全部 AI 动态 · AI 热点

6月25日

10:47

10:47

arXiv cs.LG@Babak Rahmani, Sebastian Dziadzio, Joschka Strüber, Sergio Hernández-Gutiérrez, Matthias Bethge

RevengeBench基准包含75个LLM生成的、基于Elo校准的策略，覆盖5个游戏环境，数据来自CodeClash比赛轨迹。学习者观察隐藏目标策略与对手对战，设计自定义对手策略作为行为探针，并提交可执行假设，用连续动作距离指标评估。在12个前沿LLM上，恢复质量差异显著，从34%到72%的初始距离闭合。重建策略在玩家对玩家锦标赛中提供可衡量的竞争优势，尤其对较弱模型更有帮助。

论文 RevengeBench CodeClash LLM 逆向工程策略恢复

推荐理由：这篇论文出了个RevengeBench基准，能从行为实验反推LLM的策略代码，测了12个模型恢复率34%-72%，弱模型受益最大。

6月16日

23:31

23:31IT之家（博客/媒体）

71°

开发者@0x0SojalSec 绕过苹果M4神经网络引擎的软件限制，通过逆向工程使用自定义MIL（模型中间语言）直接与芯片通信，没有调用Core ML、Metal或GPU。训练数据全程放在RAM中运行，不写入NAND闪存，速度更快。解锁后M4在iPad或Mac上可达到15.8TFLOPS的AI处理性能，用于训练模型。目前自定义MIL能否用于更新的Apple Silicon尚不明确。

技巧 M4 Apple Silicon 神经网络引擎模型训练逆向工程

推荐理由：有个开发者自己写了一套代码，把M4芯片的AI训练能力全开出来了，不用苹果官方工具，跑到了15.8TFLOPS。想用iPad或Mac训练模型的人可以看看。

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月13日

04:33

04:33

Microsoft Research@MSFTResearch

精选

微软Project Ire通过逆向工程分析了一个及时获取的恶意软件样本，确认其具有LOTUSLITE特征。主流EDR工具均未检测到该样本，而Project Ire成功识别其意图。此次分析展示了传统安全工具在应对新型威胁时的局限性。

行业 Project Ire LOTUSLITE 恶意软件分析 EDR工具逆向工程

推荐理由：微软安全项目首次发现未检测到的LOTUSLITE

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

06:19

06:19Simon Willison’s Weblog（博客/媒体）

Wes McKinney 开发的 AgentsView 是一款用于探索本地编程代理 token 使用情况的工具。Claude Fable 5 发布后，其定价尚未被 AgentsView 的数据库收录。作者利用 Fable 逆向工程了 AgentsView，并找到了设置自定义价格的方法。该方法允许用户手动添加新模型的定价信息，以便在 AgentsView 中准确追踪 token 消耗和费用。

技巧 AgentsView token 使用追踪自定义定价 Claude Fable 5 逆向工程

推荐理由：对于使用 AgentsView 追踪 AI 编程代理 token 消耗的开发者，这个技巧能让你第一时间为新模型设置自定义价格，避免数据缺失。建议收藏备用。

6月7日

14:44

14:44

宝玉@dotey

精选

Claude Design 与服务器通信时未使用常见的 JSON 文本协议，而是采用 Protocol Buffers（protobuf）二进制格式。这种设计能减少数据传输量、提升传输速度，同时由于缺少 schema，外部难以直接解析通信内容。不过，客户端 JavaScript 中包含了 schema，有心人稍加分析即可找到。这一细节反映了 Claude Design 在性能与安全性之间的权衡，对关注 AI 产品架构和逆向工程的开发者有参考价值。

AI产品 Claude Design Protocol Buffers 通信协议性能优化逆向工程

推荐理由：做 AI 产品架构或协议分析的开发者值得关注——protobuf 在节省流量和提升速度上有优势，但 schema 暴露在客户端也带来安全隐患，看完能帮你评估类似设计。

5月29日

11:05

11:05

arXiv cs.AI@Yaxin Luo, Jiacheng Cui, Xiaohan Zhao, Xinyi Shang, Jiacheng Liu, Xinyue Bi, Zhaoyi Li, Zhiqiang Shen

精选

大语言模型的预训练数据混合比例决定了其能力与缺陷，但这一信息极少公开。LLMSurgeon 提出“数据混合手术”框架，仅通过模型生成的文本就能逆向估计其预训练语料的领域分布。该方法利用校准后的软混淆矩阵解决领域混淆问题，在开源模型上验证了高精度。这为审计基础模型的数据构成提供了无需访问训练数据的实用后验方案。

论文大语言模型数据审计预训练数据逆向工程 LLMSurgeon

推荐理由：想知道你用的模型到底吃了什么数据？LLMSurgeon 让数据审计变得可行，做模型安全、数据治理或开源复现的团队值得关注。

5月28日

02:45

02:45

rohanpaul_ai@rohanpaul_ai

76°

一位开发者展示了 OpenAI Codex 的强大能力：他给 Codex 看了一张有问题的 MP3 播放器芯片照片，Codex 指导他将设备进入 Mac 的 bootloader 模式，从而读取完整固件。开发者执行 Codex 给出的命令后，Mac 转储了完整的二进制固件文件。他将该二进制文件反馈给 Codex，Codex 分析了机器码，找到了导致问题的具体代码段，并生成了修复后的自定义固件。最终问题被成功解决，展示了 AI 在逆向工程和嵌入式系统调试中的潜力。

AI产品 OpenAI Codex 逆向工程固件修复嵌入式开发

推荐理由：这个案例展示了 AI 从硬件照片到固件修复的端到端能力，做嵌入式开发或逆向工程的团队值得一看——Codex 可能帮你省掉数小时的手动调试。

5月19日

14:33

14:33

arXiv cs.AI@Sanderson Oliveira de Macedo, Ronaldo Martins da Costa

精选72°

Reversa 是一个将遗留系统（如COBOL代码）转化为AI智能体可操作规范的框架。它通过多智能体流水线，自动映射项目表面、分析模块、提取隐含规则、合成架构并编写单元级规范，强调代码与规范的可追溯性、显式置信度标记和保留人工验证缺口。在将ATM系统从COBOL迁移到Go的案例中，生成了517条声明、10个缺口、53个Gherkin场景和9/11任务完成的重建计划。该框架以Node.js CLI形式发布，支持多种智能体引擎，并利用SHA-256清单保护修改文件。

论文逆向工程遗留系统迁移 AI智能体代码规范 COBOL

推荐理由：做遗留系统现代化或AI驱动代码迁移的团队，终于有了一个能自动生成可追溯规范的框架——Reversa 直接帮你把老代码变成AI智能体能理解的文档，建议做COBOL迁移或大型系统重构的开发者点开看看。