AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:安全×
6月19日
11:08
11:08arXiv cs.LG@Jun He, Deying Yu
论文提出 Sovereign Execution Broker (SEB),一种运行时执行边界,用于证书绑定的自主基础设施。SEB 消耗由 Sovereign Assurance Boundary (SAB) 签发的证书,验证请求变更是否匹配认证执行契约,检查有效期窗口、策略纪元、撤销纪元和实时状态漂移。SEB 铸造作用域执行身份,调用基础设施 API,记录签名决策和结果记录。原型在 AWS 和 Kubernetes 集群上评估,测量延迟开销、撤销传播、漂移检测和故障注入下的安全性。
论文Sovereign Execution Broker自主代理证书绑定执行边界安全

推荐理由:想给自主代理加一把安全锁?这篇论文提出了SEB,一个在运行时强制证书绑定的执行边界,能控制突变操作。实测在AWS和K8s上延迟开销可控。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月9日
11:08
11:08arXiv cs.LG@Gilad Gressel, Rahul Pankajakshan, Julia Diament, Efim Hudis, Krishnashree Achuthan, Yisroel Mirsky
精选
随着LLM被部署为智能体,可靠监控需要知道不仅输出内容,还有哪些指令在引导其行为。当模型推断意外子目标、遵循上下文线索或受提示注入和隐藏目标影响时,这变得困难。现有激活到语言方法无法恢复智能体场景中同时活跃的完整指令集、约束、禁止和子目标。PRISM是一个激活条件解释器,从冻结目标模型的隐藏状态解码出忠实的活动指令要点列表。它使用法官引导的GRPO训练,奖励覆盖的指令并惩罚无支持的指令,在良性、约束、提示注入和隐藏目标设置中优于基线方法,尤其在安全相关目标上表现突出。
论文指令恢复激活解释智能体监控安全LLM

推荐理由:PRISM解决了LLM智能体监控中指令恢复的盲区,对安全团队和AI治理开发者来说,这是直接可用的工具,建议关注其在实际部署中的效果。
原文
6月1日
10:41
10:41arXiv cs.AI@Maksuda Bilkis Baby, Khushika Shah, Naiyue Liang, Lei Zhang
精选
针对公开代码仓库中凭据泄露检测高误报率问题,研究者提出一个三类分类框架,将占位符/弱凭据作为独立类别,结合CodeBERT语义理解与字符级模式识别。在包含10种编程语言的9426个样本数据集上,模型在真实凭据泄露检测上达到93%召回率和89%精确率,同时将高严重性告警减少33%。相比纯字符级方法,占位符/弱凭据检测F1从54%提升至81%,且跨语言泛化能力强,9/10语言在留一语言评估中F1超过0.80。
论文凭据泄露检测CodeBERTCNN安全开源仓库

推荐理由:安全团队终于有了能区分真实凭据和占位符的检测工具,误报率大幅降低。做DevSecOps的开发者可以直接参考这个框架来优化自己的凭据扫描流程。
原文
5月21日
11:15
11:15arXiv cs.AI@Mohamed Almukhtar, Anwar Ghammam, Hua Ming
精选
一项针对 AI 代理生成的 Python 重构 Pull Request 的实证研究发现,平均 22.5% 的变更提升了代码质量属性,其中可用性提升最频繁(36.5%)。但 24.17% 的修改文件引入了新的 Pylint 问题(主要是约定违规如长行),4.7% 引入了新的 Bandit 安全发现。尽管存在这些问题,73.5% 的 PR 被合并,包括那些引入新问题但同时也移除了旧问题的案例。研究还归纳了 24 种常见变更操作及其与 lint/安全发现的关系,强调了在 AI 驱动开发中加强质量与安全门控的必要性。
论文AI 编程代码质量安全重构Python

推荐理由:AI 写代码到底靠不靠谱?这篇论文用数据说话——重构 PR 质量有提升也有隐患,做 AI 编程工具或代码审查的团队值得看看,能帮你设计更好的质量门控。
原文
5月19日
09:54
09:54arXiv cs.AI@Nicanor Mayumu, Xiaoheng Deng, Patrick Mukala
精选
该研究首次系统评估了视觉-语言-动作(VLA)驾驶模型在推理忠实性方面的表现,分析了 Alpamayo-R1-10B 在 100 个场景中的 300 次推理。结果显示,模型输出的自然语言推理与轨迹存在显著不忠实:整体推理忠实度仅 42.5%,Chain-of-Causation 匹配场景现实不到一半;在三分之一的行人相关场景中遗漏了 94 个行人;轻微视觉扰动导致 97.7% 的轨迹脆弱;推理-动作一致性仅 48.3%,其中 53.3% 的推理一致性低,37.9% 声称停止但模型继续前进。研究从信息论角度形式化了忠实性,定义了实体和动作忠实性验证标准,并提出了四组件安全架构。
论文VLA自动驾驶推理忠实性安全Chain-of-Causation

推荐理由:VLA 驾驶模型的推理不忠实问题直接关系到自动驾驶安全,做自动驾驶或具身智能的开发者值得关注——你的模型可能声称停车但实际在开。
原文
精选全部日报登录