全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月13日

21:35

21:35Anthropic: Transformer Circuits（资讯）

85°

Anthropic 发布了一项关于 Claude 3.5 Haiku 内部机制的研究，将其类比为生物学研究。他们通过构建“归因图”来追踪模型在多种任务中的推理路径，发现模型内部存在类似生物体的模块化结构和功能分工。这项研究揭示了大型语言模型如何从输入到输出逐步构建理解，例如在数学推理中，模型会先识别问题类型，再调用特定计算模块。该工作为理解 AI 黑箱提供了新视角，有助于提升模型的可解释性和安全性。

论文可解释性归因图 Claude 3.5 Haiku 模型内部机制 Anthropic

推荐理由：Anthropic 把模型内部机制当生物系统来研究，做 AI 可解释性的人会看到新方法论，关心模型安全性的团队值得关注。

21:35

21:35Anthropic: Transformer Circuits（资讯）

Anthropic 的 Circuits 团队发布 2025 年 8 月更新，探讨了人格设定如何影响 AI 助手的输出。研究发现，通过调整模型内部表示，可以系统性地改变回复风格和内容。这项工作揭示了模型内部机制的运作方式，为理解 AI 行为提供了新视角。

论文可解释性人格设定模型内部机制 Anthropic Circuits

推荐理由：对 AI 可解释性研究感兴趣的读者值得关注，这揭示了模型内部如何响应人格设定，有助于构建更可控的 AI 系统。