№安全·general
安全
别名
- 首次出现
- 2026-05-22
- 最近出现
- 2026-06-12
- 累计提及
- 50
§ 01综述
近期AI安全领域呈现出行业巨头、开源项目与学术研究多方发力的态势,安全重点从传统的模型对齐延伸至供应链、数据隐私和操作治理层面。
OpenAI 发布了面向第三方评估机构的指南,旨在建立更可信的前沿模型评测框架,强调评估的独立性和透明度(OpenAI发布第三方AI评估指南)。同时,OpenAI 扩展了 Admin API,使企业可以按编程方式管理用户和权限,增强企业级部署的安全性(OpenAI扩展Admin API)。
阿里云针对AI Agent的供应链风险提出了7大最佳实践,覆盖从模型选择、数据流控制到审计日志等环节,为行业提供了实操参考(阿里云AI Agent安全方案)。LangSmith 的 LLM Gateway 新增了预算限制和PII脱敏功能,帮助开发者防范过度支出和敏感信息泄漏(LangSmith LLM Gateway)。
开源项目面临新型安全挑战:curl 维护者透露,AI辅助生成的漏洞报告大量涌现,质量参差不齐,给项目带来了前所未有的处理压力(curl项目遭遇AI安全报告洪流)。这提示社区需建立更高效的漏洞报告过滤与验证机制。
在漏洞发现领域,Anthropic 披露其智能体 Glasswing 在首月内发现超过1万个漏洞,展示了AI辅助安全审计的巨大潜力(Anthropic披露Glasswing首月成果)。与此同时,NVIDIA 推出了 Verified Agent Skills,旨在通过形式化验证提升AI智能体的行为安全性(NVIDIA推出Verified Agent Skills)。
当前焦点在于如何平衡AI安全技术的快速演进与系统性治理:一方面,AI自身正被用于发现漏洞、强化防护;另一方面,AI生成的不可靠内容也制造了新的安全噪声。未来值得观察的包括:第三方评估机制的实际落地效果、供应链安全方案在多元生态中的兼容性,以及AI辅助安全报告泛滥的应对策略。