02:47Google Research: Blog(资讯)Google 研究团队提出了一种新的框架,用于审计机器学习模型是否真正实现了“遗忘”功能。该框架通过设计特定的攻击和测试方法,能够有效评估模型在删除特定数据后是否仍保留了相关信息。这项工作对于负责任的人工智能、隐私保护和数据安全至关重要,尤其是在用户要求删除个人数据的场景下。框架提供了可量化的评估指标,帮助开发者和监管机构验证模型遗忘的可靠性。论文机器学习数据遗忘隐私保护审计框架Google推荐理由:隐私合规团队和 AI 安全研究者终于有了可操作的遗忘验证工具——Google 的审计框架让“数据被遗忘权”不再是空话,做模型治理和合规的团队建议点开看看具体方法。原文
14:26arXiv cs.AI@Payal Chandak, Victoria Alkin, David Wu, Maya Dagan, Taposh Dutta Roy, Maria Clara Saad Menezes, Ayush Noori, Nirali Somia, John S. Brownstein, Ran Balicer, Rebecca W. Brendel, Noa Dagan, Isaac S. Kohane, Gabriel A. Brat精选医学伦理天然具有多元性,但大型语言模型在提供医疗建议时可能隐含单一的价值偏好。研究者提出了一个审计框架,包含临床验证的伦理困境基准和从决策中恢复价值优先级的方法。前沿模型在讨论伦理冲突时能展现观点多元性,但个体决策几乎确定,无法复现医生群体的分布性多元。多数模型的价值优先级在医生变异范围内,但部分模型显著低估患者自主权。若不加干预,单一模型可能将自身价值偏好大规模强加给所有患者,取代临床伦理的多元性。论文AI伦理医疗AI价值多元性审计框架语言模型推荐理由:这篇论文揭示了AI医疗建议中隐藏的价值偏见问题,做医疗AI开发或临床决策支持的团队值得关注——它提醒我们,模型不只是输出答案,还在无声地传递伦理立场。原文
19:11arXiv: OpenAI@Gabriela Dobrita, Simona-Vasilica Oprea, Adela BaraCHAINTRIX提出了一种端到端的智能合约审计框架,核心设计是确保每个LLM生成的声明都能通过确定性结构合约表示进行验证。该框架引入跨合约交互模型(CCIM),将Solidity代码解析为函数级操作的结构化映射,支持12个确定性信号引擎和并行LLM审计管道。此外,通过引入结构判决引擎(SVE)执行确定性结构检查,并结合符号执行和模糊测试来过滤低置信度发现。在EVMbench基准测试中,CHAINTRIX达到了71.7%的高危漏洞召回率,超越最强前沿模型26个百分点,部分审计实现100%召回,显著提升了审计的准确性和可靠性。论文智能合约LLM/增强安全审计确定性分析审计框架推荐理由:该工作为智能合约安全审计提供了一种结合LLM与确定性分析的有效方案,解决了LLM幻觉和传统静态误报问题,对DeFi安全领域具有实际参考价值。原文