安全·general

安全

别名
首次出现
2026-05-22
最近出现
2026-06-12
累计提及
50
§ 01综述

近期AI安全领域呈现出行业巨头、开源项目与学术研究多方发力的态势,安全重点从传统的模型对齐延伸至供应链、数据隐私和操作治理层面。

  • OpenAI 发布了面向第三方评估机构的指南,旨在建立更可信的前沿模型评测框架,强调评估的独立性和透明度(OpenAI发布第三方AI评估指南)。同时,OpenAI 扩展了 Admin API,使企业可以按编程方式管理用户和权限,增强企业级部署的安全性(OpenAI扩展Admin API)。
  • 阿里云针对AI Agent的供应链风险提出了7大最佳实践,覆盖从模型选择、数据流控制到审计日志等环节,为行业提供了实操参考(阿里云AI Agent安全方案)。LangSmith 的 LLM Gateway 新增了预算限制和PII脱敏功能,帮助开发者防范过度支出和敏感信息泄漏(LangSmith LLM Gateway)。
  • 开源项目面临新型安全挑战:curl 维护者透露,AI辅助生成的漏洞报告大量涌现,质量参差不齐,给项目带来了前所未有的处理压力(curl项目遭遇AI安全报告洪流)。这提示社区需建立更高效的漏洞报告过滤与验证机制。
  • 在漏洞发现领域,Anthropic 披露其智能体 Glasswing 在首月内发现超过1万个漏洞,展示了AI辅助安全审计的巨大潜力(Anthropic披露Glasswing首月成果)。与此同时,NVIDIA 推出了 Verified Agent Skills,旨在通过形式化验证提升AI智能体的行为安全性(NVIDIA推出Verified Agent Skills)。
  • 当前焦点在于如何平衡AI安全技术的快速演进与系统性治理:一方面,AI自身正被用于发现漏洞、强化防护;另一方面,AI生成的不可靠内容也制造了新的安全噪声。未来值得观察的包括:第三方评估机制的实际落地效果、供应链安全方案在多元生态中的兼容性,以及AI辅助安全报告泛滥的应对策略。

    § 02相关报道10 条在档
    1. 01
      πFS愚人节玩笑、Homebrew 6.0.0、Niantic军用无人机争议
      SuperTechFans
    2. 02
      OpenAI 收购 Ona,强化编程助手 Codex 云环境与安全能力
      IT之家
    3. 03
      GitHub 用 LLM 减少秘密扫描误报,提升可信度
      GitHub Blog
    4. 04
      Replit 联合 Socket 推出 Package Firewall,拦截供应链攻击
      Amjad Masad
    5. 05
      LangSmith Sandboxes GA:安全可扩展的智能体代码执行环境
      LangChain
    6. 06
      Claude新模型发布:长任务领先,安全回退Opus 4.8
      Mike Krieger
    7. 07
      Warp 更新:会话回滚、Codex 后端、AI 聊天等多项改进
      Tw93
    8. 08
      LangSmith Sandboxes:为智能体提供安全的“计算机”
      LangChain
    9. 09
      古尔曼:苹果WWDC26还将聚焦隐私与安全
      IT之家
    10. 10
      PRISM:从语言模型激活中恢复指令集
      arXiv cs.LG
    § 03邻近话题

    本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

    /topic/%E5%AE%89%E5%85%A8