全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月13日

21:35

21:35Anthropic: Research（资讯）

70°

Anthropic 发布了一项新研究，提出利用大型语言模型（LLM）作为自动化对齐研究者，以解决 AI 对齐中的可扩展监督问题。该方法通过让 LLM 自动生成和测试对齐假设，减少对人类研究者的依赖，从而加速对齐研究进程。实验表明，自动化对齐研究者能够发现一些人类可能忽略的漏洞，并生成有效的对齐策略。这项研究为未来更安全的 AI 系统开发提供了新思路，尤其适用于需要大规模监督的复杂场景。

论文 Anthropic AI 对齐可扩展监督自动化研究 LLM

推荐理由：Anthropic 用 LLM 自动化对齐研究，解决了可扩展监督的人力瓶颈，做 AI 安全和对齐的团队值得关注，可以直接参考其方法加速自己的研究。