全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月14日

04:21

04:21

elvis@omarsar0

精选

Elvis 在讨论中分享了运行自主长期编码智能体的经验，指出大多数模型难以协调长期任务，容易过早暂停或出现奖励黑客行为。他建议使用 Opus 4.8 进行规划，GPT-5.5 执行任务，并用 Deepseek、Qwen、Kimi 等模型作为评估器。强调多模态目标比纯文本目标更有效，能帮助智能体保持方向。

技巧 Opus 4.8 GPT-5.5 Deepseek Qwen 智能体

推荐理由：Opus 4.8 规划 + GPT-5.5 执行，长期智能体实战配方

6月13日

13:09

13:09

elvis@omarsar0

精选

Omar Sanseviero分享运行自主长时编码智能体的经验，建议用Opus 4.8做规划、GPT-5.5执行，并用Deepseek、Qwen、Kimi或MiniMax等模型作为评估器。他强调多模态目标比纯文本目标更强，能帮助智能体保持方向。清晰定义目标、消除模型假设、避免奖励黑客行为是关键。

技巧 Opus 4.8 GPT-5.5 Deepseek Qwen Kimi MiniMax 智能体

推荐理由：Opus 4.8+GPT-5.5分工跑长任务

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

06:02

06:02

elvis@omarsar0

AI 研究者 Omar 在推文中分享，他越来越多地使用 Deepseek、Qwen 和 Minimax 等模型作为评估智能体，用于其自主循环系统。这一做法旨在通过多样化模型提升评估的准确性和鲁棒性，避免单一模型的偏见。对于构建自主 AI 系统的开发者来说，这是一个值得关注的实践方向。

AI产品智能体评估模型 Deepseek Qwen Minimax

推荐理由：做自主循环或智能体评估的开发者，可以借鉴这种多模型评估策略来提升系统稳定性，建议点开看看具体怎么搭配。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月13日

19:15

19:15

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue在特朗普与习近平会晤期间，呼吁美国AI社区公开支持开源国际AI，特别是来自中国的Deepseek、Qwen、Kimi、GLM等模型。他强调开源是当前AI领域竞争、就业和财富创造的最重要驱动力。此举意在关键时刻维护开源合作，避免地缘政治影响技术交流。

行业开源/仓库 Deepseek Qwen Kimi GLM

推荐理由：开源AI社区正面临地缘政治压力，Hugging Face CEO的呼吁提醒从业者：支持开源模型（尤其是中国模型）关乎整个行业的竞争力和创新活力。做AI开发或关注开源生态的人，值得关注这一立场。