AITOP6月11日 15:28
精选
过去 24 小时,从 652 条中筛出 45 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
09:58
09:58
arXiv: DeepSeek@Hongzhou Rao, Zikan Dong, Yanjie Zhao, Haodong Li, Haoyu Wang
精选
推荐理由:代码安全团队和开发者面临LLM分析带来的知识产权泄露风险,Acoda提供了一种实用的防御手段,建议关注其混淆方法如何平衡安全性和代码可用性。
6月10日
13:09
13:09
arXiv cs.AI@Shelly Bensal, Axel Magnuson, Aparna Balagopalan, Daniel M. Bikel
精选
推荐理由:做LLM记忆系统或对话AI的开发者值得关注——这项研究揭示了记忆增强的双刃剑效应,并给出了可落地的缓解方案,建议直接参考MIST基准评估自己的模型。
6月1日
00:09
AITOP6月1日 00:09
5月29日
13:00
13:00
arXiv: Anthropic@Galip Tolga Erdem
精选72°
推荐理由:这项研究揭示了LLM作为攻击者的行为规律和可靠性差异,做AI安全评估或红队测试的团队值得关注——它告诉你不同模型在真实攻击场景下的稳定性和失败模式,直接指导模型选型和防御策略。
5月19日
14:03
14:03
arXiv: DeepSeek@Dylan Marx, Marcel Dunaiski
精选72°
推荐理由:安全团队和LLM开发者需要警惕:多语言安全漏洞远未被堵住,低资源语言成为新的攻击面。建议立即检查自家模型的多轮对话安全机制。
10:20
10:20
arXiv cs.AI@Tsafac Nkombong Regine Cyrille, Franziska Schwarz
精选
推荐理由:AI安全团队终于有了一个从理论到工具都落地的威胁建模框架——STRIDE-AI把NIST和OWASP的鸿沟填上了,做LLM应用安全评估的可以直接用它的Web工具跑一遍评估流程。
5月15日
10:07
10:07
arXiv: Anthropic@Jean-Philippe Monteuuis, Cong Chen, Jonathan Petit
精选
推荐理由:做LLM安全评估的团队会发现现有ASR指标不可靠——论文用数据证明80%的ASR在连续测试中可能只剩50%,CAS-eval和CAS-gen直接解决了这个评估和生成的不一致问题,做红队测试的建议点开。
5月14日
13:27
13:27
arXiv cs.AI@Alberto G. Rodríguez Salgado
精选70°
推荐理由:做LLM安全对齐或代理系统部署的团队必须关注——一句简单的“保持一致”就能让最强模型从安全转向危险,这意味着轨迹注入攻击可能轻易绕过现有防护,建议仔细阅读实验设计并评估自身系统的脆弱性。
5月13日
19:12
19:12
arXiv: Anthropic@Neil Fendley, Zhengyu Liu, Aonan Guan, Jiacheng Zhong, Yinzhi Cao
精选85°
推荐理由:这是首个系统研究AI工作流安全风险的工作,使用GitHub Actions或n8n的开发者应立刻检查自己的工作流是否暴露在类似攻击下,建议点开了解具体攻击路径和防护建议。
