12:57IT之家(博客/媒体)Anthropic致信美国参议院,指控阿里巴巴在4月22日至6月5日期间使用约2.5万个欺诈账户进行了2880万次对话,对其Claude模型实施“迄今已知最大规模的蒸馏攻击”。蒸馏是一种利用更强模型输出训练更小模型的技术。然而,Anthropic自家旗舰模型Claude Opus 4.8于5月发布后,被用户发现回答中自称是阿里通义千问(Qwen)或DeepSeek,引发双标争议。埃隆·马斯克也批评Anthropic曾大规模盗用训练数据并支付和解金。行业Anthropic阿里巴巴模型蒸馏Claude Opus 4.8双标争议10 个信源在谈推荐理由:Anthropic刚发的Claude Opus 4.8被揭套壳千问和DeepSeek,转头就告阿里偷模型,马斯克都看不下去了,这瓜绝对值得吃。原文
16:54Decoder@Matthias BastianMoonshot AI 发布了开源模型 Kimi K2.7 Code,拥有 1 万亿参数,专为编程任务设计。在编程基准测试中,Kimi K2.7 Code 仍落后于 GPT-5.5 和 Claude Opus 4.8,但每 token 价格比它们低 12 倍。用户需权衡:在相同预算下,使用 Kimi K2.7 Code 能获得更多推理次数,但质量可能有所下降。AI模型Kimi K2.7 CodeMoonshot AIGPT-5.5Claude Opus 4.8开源模型7 个信源在谈推荐理由:编程省钱利器,12倍性价比原文
13:27IT之家(博客/媒体)72°Anthropic 今日发布旗舰大模型 Claude Opus 4.8,并宣布完成 650 亿美元融资,估值逼近万亿美元。然而,模型上线后不久,用户通过 API 测试发现,Opus 4.8 在回答身份问题时自称是阿里通义千问或 DeepSeek,引发“蒸馏”争议。Anthropic 此前曾指责中国公司进行“工业规模的蒸馏攻击”,但自身模型却出现类似问题,被指“双标”。新模型在编码、推理等方面有提升,并增加了“思考强度控制”功能。行业Claude Opus 4.8蒸馏Anthropic通义千问DeepSeek10 个信源在谈推荐理由:Anthropic 一边指责中国公司蒸馏,一边自己的模型却自称是千问和 DeepSeek,做 AI 模型训练或关注行业伦理的开发者值得看看这场“双标”闹剧。原文
10:12SuperTechFans(博客/媒体)Hacker News 热议 AI 提升白领生产力可能带来四天工作制,但评论指出收益多被资本攫取,员工面临裁员风险而非休假。YouTube 宣布从 2026 年 5 月起自动为逼真 AI 视频打标,但用户担忧低质高刺激内容让儿童与老人沉迷。Anthropic 发布 Claude Opus 4.8,小幅改进编码与推理,但社区更看好小模型强化方法。前沿 LLM 在事实核查上分歧显著,缺乏“我不知道”选项削弱可信度。FBI 拘捕藏有约四千万美元金条的 CIA 高官,舆论聚焦低级失误。行业AI 生产力四天工作制AI 标签Claude Opus 4.8事实核查10 个信源在谈推荐理由:AI 生产力提升的分配问题直接关系到每个白领的未来,做技术或管理的读者看完会反思自己的处境;YouTube 的 AI 标签政策影响内容生态,创作者和用户都该了解。原文
09:07Simon Willison’s Weblog(博客/媒体)llm-anthropic 0.25.1 版本发布,主要新增了对 Claude Opus 4.8 模型的支持。新版本引入了 `-o fast 1` 选项,为已启用该功能的组织提供快速模式。此外,每个模型的默认 max_tokens 现在设置为该模型的最大输出长度,而非之前的 8,192。该更新让开发者能更方便地在命令行中调用最新的 Claude 模型。AI产品llmClaude Opus 4.8命令行工具快速模式更新10 个信源在谈推荐理由:如果你在用 llm 工具链调用 Claude 模型,这次更新直接支持了 Opus 4.8 并优化了输出长度限制,做 AI 应用开发的值得升级试试。原文
08:38Simon Willison’s Weblog(博客/媒体)精选76°Anthropic 发布了 Claude Opus 4.8,官方描述为“微小但切实的改进”。该模型最大的亮点是诚实性提升,在评估中错误率最低,主要通过不确定时主动弃权而非强行回答来减少幻觉。定价与 Opus 4.7 相同,但新增了“快速模式”且价格大幅降低。技术上新支持对话中插入系统消息,可动态调整指令而不影响缓存,对长对话和智能体循环更友好。提示缓存最低门槛也从 1024 降至 512 token,进一步降低成本。AI模型Claude Opus 4.8Anthropic诚实性对话系统消息提示缓存10 个信源在谈推荐理由:Anthropic 坦诚承认这是小幅升级,但诚实性改进和对话中系统消息功能对做长对话应用或智能体开发的团队很实用,建议关注缓存优化带来的成本节省。原文
06:54IT之家(博客/媒体)83°Anthropic 于 5 月 29 日发布旗舰模型 Claude Opus 4.8,重点提升编程、智能体和知识工作能力。相比 Opus 4.7,新模型在复杂任务中更稳定,能主动提问、识别错误,并减少无依据结论。官方评估显示,其放任代码缺陷的概率降低约 4 倍,同时亲社会行为指标创新高。claude.ai 新增 effort 程度控制,用户可平衡质量与响应速度。定价不变,快速模式速度提升 2.5 倍,成本降至 1/3。AI模型Claude Opus 4.8编程助手智能体推理模型可靠性10 个信源在谈推荐理由:做 AI 编程和智能体开发的团队终于有了更可靠的模型——Opus 4.8 减少无依据结论,主动标出不确定性,建议在复杂多步骤任务中直接试用。原文
06:18marktechpost@Michal Sutter88°Anthropic 推出了 Claude Opus 4.8 模型,并同步为 Claude Code 引入动态工作流功能,允许用户创建最多包含 1000 个子代理的复杂自动化流程。同时,快速模式(Fast Mode)价格下调,降低了使用门槛。该版本目前处于研究预览阶段,旨在提升开发者在多步骤任务编排和智能体协作方面的效率。动态工作流可根据上下文自动调整执行路径,而不再是固定的线性流程,这标志着 AI 编程助手向更灵活、可扩展的自动化方向迈进。AI产品Claude Opus 4.8动态工作流子代理编程助手Anthropic10 个信源在谈推荐理由:Claude Opus 4.8 的动态工作流和 1000 子代理上限解决了复杂任务自动化的编排难题,做多步骤 AI 流程的开发者可以直接上手体验,快速模式降价也让高频使用更划算。原文
05:36Decoder@Matthias Bastian88°Anthropic 推出了 Claude Opus 4.8,该模型在大多数基准测试中超越了 GPT-5.5 和 Gemini 3.1 Pro。相比前代,它发现自身编码错误的频率提高了四倍。同时,Anthropic 还推出了动态工作流功能,可启动数百个并行子智能体来处理代码库迁移等任务。这标志着 Claude 在性能和自动化能力上的显著提升。AI模型Claude Opus 4.8GPT-5.5Gemini 3.1 Pro编码错误检测动态工作流10 个信源在谈推荐理由:Claude Opus 4.8 在编码错误检测和并行任务处理上大幅进化,做大型代码库迁移或复杂自动化的开发者可以直接体验动态工作流带来的效率提升。原文