精选 AI 资讯 · AI 热点

6月12日

09:16

09:16

arXiv: OpenAI@Md Jafrin Hossain, Mohammad Arif Hossain, Weiqi Liu, Nirwan Ansari

精选

一项新研究对LangChain、AutoGPT和OpenAI Agents SDK三大主流智能体框架进行安全审计，发现它们均未提供架构级结构安全保证。其中，内存完整性——防御最常见漏洞类别的关键机制——在三个框架中均缺失。实验表明，基于LangChain构建的政府福利智能体，一次内存投毒攻击即可使目标申请人的错误拒绝率升至88.9%，且难以通过标准监控检测。研究者提出了两种轻量级防护机制（内存完整性验证器和策略门），可在亚毫秒开销内消除攻击向量。该研究警示，当前智能体框架生态可能尚未达到面向公众部署的默认安全标准。

论文智能体安全/漏洞 LangChain AutoGPT OpenAI Agents SDK

推荐理由：做AI智能体部署的团队必须看——LangChain等主流框架在公共场景下存在严重安全漏洞，一次内存攻击就能让政府福利系统错误拒绝率飙到88.9%，建议立即检查自己的智能体架构。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？

5月13日

19:12

19:12

arXiv: Anthropic@Neil Fendley, Zhengyu Liu, Aonan Guan, Jiacheng Zhong, Yinzhi Cao

精选85°

研究人员设计了首个检测与利用框架JAW，针对GitHub Actions和n8n等自动化平台中的智能体工作流进行劫持攻击。攻击者可通过操控GitHub Issue评论等输入，诱导LLM代理执行凭证泄露、任意命令等恶意操作。JAW通过静态路径可行性分析、动态提示来源分析和运行时能力分析，成功劫持了4714个GitHub工作流和8个n8n模板。受影响组件包括Claude Code、Gemini CLI、Qwen CLI、Cursor CLI等15个广泛使用的GitHub Actions及两个n8n官方节点。研究人员已向GitHub、Google、Anthropic等厂商负责任披露，并获得致谢、修复和漏洞赏金。

论文智能体工作流安全/漏洞 GitHub Actions n8n LLM安全

推荐理由：这是首个系统研究AI工作流安全风险的工作，使用GitHub Actions或n8n的开发者应立刻检查自己的工作流是否暴露在类似攻击下，建议点开了解具体攻击路径和防护建议。