04:21elvis@omarsar0精选Elvis 在讨论中分享了运行自主长期编码智能体的经验,指出大多数模型难以协调长期任务,容易过早暂停或出现奖励黑客行为。他建议使用 Opus 4.8 进行规划,GPT-5.5 执行任务,并用 Deepseek、Qwen、Kimi 等模型作为评估器。强调多模态目标比纯文本目标更有效,能帮助智能体保持方向。技巧Opus 4.8GPT-5.5DeepseekQwen智能体5 个信源在谈推荐理由:Opus 4.8 规划 + GPT-5.5 执行,长期智能体实战配方原文
13:09elvis@omarsar0精选Omar Sanseviero分享运行自主长时编码智能体的经验,建议用Opus 4.8做规划、GPT-5.5执行,并用Deepseek、Qwen、Kimi或MiniMax等模型作为评估器。他强调多模态目标比纯文本目标更强,能帮助智能体保持方向。清晰定义目标、消除模型假设、避免奖励黑客行为是关键。技巧Opus 4.8GPT-5.5DeepseekQwenKimiMiniMax智能体7 个信源在谈推荐理由:Opus 4.8+GPT-5.5分工跑长任务原文
06:02elvis@omarsar0AI 研究者 Omar 在推文中分享,他越来越多地使用 Deepseek、Qwen 和 Minimax 等模型作为评估智能体,用于其自主循环系统。这一做法旨在通过多样化模型提升评估的准确性和鲁棒性,避免单一模型的偏见。对于构建自主 AI 系统的开发者来说,这是一个值得关注的实践方向。AI产品智能体评估模型DeepseekQwenMinimax推荐理由:做自主循环或智能体评估的开发者,可以借鉴这种多模型评估策略来提升系统稳定性,建议点开看看具体怎么搭配。原文
00:43Decoder@Matthias Bastian2026年6月,Deepseek 成为 Ramp 平台增长最快的软件供应商,美国企业为降低成本而大量采用其付费服务。Ramp 首席经济学家指出,成本意识是主要驱动力,但使用中国模型存在安全风险。这一趋势反映了美国企业在 AI 支出上对性价比的追求,同时也引发了对数据安全的担忧。行业DeepseekAI 成本软件供应商数据安全美国企业推荐理由:美国企业转向 Deepseek 说明 AI 成本压力正在重塑市场格局,关注 AI 采购和成本优化的团队值得了解这一趋势,以便评估自身供应商策略。原文
10:50Decoder@Matthias BastianDeepseek 宣布将其旗舰模型 V4-Pro 的 75% 折扣永久化,输入价格降至每百万 tokens 0.435 美元,比 GPT-5.5 便宜至少 11.5 倍,输出价格更是低 34 倍以上。这一激进定价策略针对 token 消耗大的智能体系统,可能对西方 AI 提供商造成巨大竞争压力。Deepseek 通过永久降价巩固其性价比优势,吸引更多开发者转向其平台。此举标志着 AI 模型价格战进入新阶段,尤其对依赖大规模推理的自动化应用影响深远。AI模型DeepseekV4-Pro降价GPT-5.5智能体推荐理由:做智能体或高 token 消耗应用的开发者,Deepseek 这个永久降价直接拉低了推理成本,比 GPT-5.5 便宜几十倍,值得立刻评估迁移。原文
21:09Decoder@Matthias Bastian中国 AI 初创公司 Deepseek 即将完成约 100 亿美元融资,估值约 450 亿美元。创始人梁文峰向投资者明确表示,公司将优先投入通用人工智能(AGI)研究,而非追求短期盈利。这一表态凸显了 Deepseek 在巨额资本支持下坚持长期技术路线的决心,也反映了当前 AI 领域对 AGI 研发的持续投入趋势。行业DeepseekAGI融资长期战略AI 研究推荐理由:Deepseek 在巨额融资下仍坚持 AGI 优先,这对关注 AI 长期发展的投资者和研究者是个重要信号——值得关注其技术路线与商业平衡的后续进展。原文
19:15Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue在特朗普与习近平会晤期间,呼吁美国AI社区公开支持开源国际AI,特别是来自中国的Deepseek、Qwen、Kimi、GLM等模型。他强调开源是当前AI领域竞争、就业和财富创造的最重要驱动力。此举意在关键时刻维护开源合作,避免地缘政治影响技术交流。行业开源/仓库DeepseekQwenKimiGLM推荐理由:开源AI社区正面临地缘政治压力,Hugging Face CEO的呼吁提醒从业者:支持开源模型(尤其是中国模型)关乎整个行业的竞争力和创新活力。做AI开发或关注开源生态的人,值得关注这一立场。原文