全部 AI 动态 · AI 热点

6月28日

19:16

@elonmusk@elonmusk

Grok 4.5 基于 xAI 的 1.5T V9 基础模型，并使用 Cursor 数据进行补充训练。该版本目前已在 SpaceX 和 Tesla 内部私测。早期评估显示其性能接近甚至超过 Opus。RL 训练仍在持续改进模型，Grok Build 工具每日提升。xAI 计划今年每月发布完全从头训练的新模型。

AI模型 Grok 4.5 Cursor SpaceX 模型更新

推荐理由：Musk 说 Grok 4.5 私测版已经接近 Opus，而且后面每月都会出新模型，想追动态可以瞅一眼。

原文

6月27日

11:47

Sam Altman@sama

OpenAI首席执行官Sam Altman在X上发文称，本周已更新ChatGPT使用的5.5 Instant模型。Altman形容该模型“vibe不错”。这是CEO对模型质量的直接肯定，但未透露具体改进细节。

AI模型 ChatGPT OpenAI 5.5 Instant 模型更新

推荐理由：Sam Altman亲口说这周ChatGPT的5.5 Instant模型更新了，他本人很喜欢，想感受一下新效果可以试试。

原文

6月22日

03:49

@koltregaskes@koltregaskes

Anthropic正在准备更新Claude Mythos模型，版本可能从当前跳至5.1。升级到版本6的可能性较低，除非Sonnet和Opus也同步升级。目前尚不确定是否公开发布。

AI模型 Anthropic Claude Mythos 5.1 模型更新版本升级

推荐理由：Anthropic又在迭代模型了，这次可能是Mythos 5.1，跟Sonnet和Opus版本联动，不知道会不会公开。

原文

00:42

@koltregaskes@koltregaskes

78°

X用户koltregaskes发现字符串"claude-sonnet-5"出现在某个位置，暗示Anthropic可能即将发布新模型。Claude Sonnet系列是Anthropic的中端模型，上一代为Claude Sonnet 4（2024年发布）。本次发现意味着Sonnet 5可能已在内部测试或即将进入公开阶段。目前Anthropic尚未官方确认该模型的存在或发布时间线。

AI模型 Claude Sonnet 5 Anthropic 模型更新

推荐理由：有用户在X上扒到了Claude Sonnet 5的名字，说明Anthropic可能马上要出新模型了，关注Claude的朋友可以看看这个线索。

原文

6月18日

10:40

arXiv cs.LG@Mingzhi Song

本文提出局部总体风险证书(Local Population-Risk Certificates)，为当前模型θ周围的候选方向v∈D构建ℓ_{θ+v}-ℓ_θ的两面置信带。该证书的上端点作为风险控制更新规则：仅当上端点非正时才接受更新，否则保留当前模型。这种方法保证了更新不会增加总体风险，为安全模型更新提供了理论保障。

论文风险控制模型更新置信带理论分析

推荐理由：这篇论文用置信带兜底，保证模型更新不会越改越差，适合需要稳妥迭代的场景。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:31

karminski-牙医 (AI工具)@karminski3

该模型新增多模态输入功能，支持文本、图片和视频等多种数据格式。这一更新显著扩展了模型的应用场景，使其能够处理更丰富的输入类型。对于需要综合处理多种媒体信息的用户来说，这是一个重要的功能升级。

AI模型多模态模型更新文本图片视频

推荐理由：多模态输入让模型能处理图片和视频，做内容分析或创意工作的团队可以直接用起来，效率提升明显。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

13:19

Midjourney@midjourney

72°

Midjourney 宣布 V8.1 成为所有用户的默认模型，V8 将在两周后退役。V8.1 恢复了标志性美学，支持原生 2K 高清渲染，速度比 V8 快 3 倍，成本降低 3 倍。全质量 1K 模式比 V7 草稿模式更快。图像提示功能回归，新的“Describe”功能上线，并引入了 moodboards 和 srefs。V8.2 测试即将开始。

AI产品 Midjourney V8.1 图像生成 AI 绘画模型更新

推荐理由：Midjourney 用户终于等来了更快的生成速度和更低成本，V8.1 的 2K 渲染和图像提示回归让创作更高效，建议立即体验新默认模型。

原文

6月10日

13:53

歸藏(guizang.ai)@op7418

CodePilot 发布 v0.56.0 版本，新增 Claude Fable 5、小米 MiMo UltraSpeed 模型以及通用 OpenAI 兼容第三方渠道。本次更新的部分修复由 Claude Fable 5 完成，展示了其代码审查能力。同时修复了用量统计、回复状态丢失、服务商列表刷新等问题。官方推荐所有用户升级。

AI产品 CodePilot Claude Fable 5 小米 MiMo UltraSpeed 代码修复模型更新

推荐理由：对于使用 CodePilot 的开发者，这次更新不仅带来了新模型支持，还验证了 Claude Fable 5 的代码修复能力，值得升级体验。

原文

01:29

Claude Code: GitHub Releases@ashwin-ant

83°

Anthropic 发布了 Claude Code v2.1.170 版本，核心亮点是引入了名为 Claude Fable 5 的 Mythos 级模型。该模型能力超越此前所有公开发布的模型，且已通过安全评估可供通用。此次更新还修复了从 VS Code 集成终端或继承环境变量的 shell 启动时，会话记录未保存且无法通过 --resume 恢复的问题。用户更新至该版本即可使用新模型。

AI产品 Claude Code Fable 5 模型更新会话修复 Anthropic

推荐理由：Claude Fable 5 是 Anthropic 目前最强通用模型，做复杂推理和代码生成的开发者值得立即更新体验。

原文

6月2日

10:36

Skywork@Skywork_ai

88°

AI模型 Claude Opus 4.8 推理模型 Skywork Anthropic 模型更新

推荐理由：Claude Opus 4.8 的更强推理能力对需要高精度判断的开发者（如代码审查、逻辑分析）是直接利好，Skywork 用户现在就能体验，建议试试。

原文

5月30日

16:10

shao__meng@shao__meng

Claude Opus 4.8 发布后，用户反馈普遍认为相比 Opus 4.7 升级不大，甚至变笨，部分用户更倾向于 GPT-5.5。有用户尝试测试新模型时，发现自己的账号被莫名封禁，即使仅注册后发过一次消息。该事件引发对 Anthropic 模型更新策略和账号管理问题的讨论。

AI产品 Claude Opus 4.8 模型更新账号封禁 GPT-5.5 用户反馈

推荐理由：Claude 重度用户和开发者需要注意：Opus 4.8 口碑不佳，且账号封禁问题频发，建议谨慎更新和备份数据。

原文

10:19

10:19IT之家（博客/媒体）

OpenAI 于 5 月 28 日更新了 GPT-5.5 Instant 模型，使其回复更自然、易读、结构清晰，并减少冗长列表。该模型此前已在医学、法律等高风险主题上减少 52.5% 的幻觉，并提升数学、科学推理能力。更新后，GPT-5.5 Instant 和 GPT-5.5 Thinking 不再支持 Canvas 功能，用户可通过文字块和代码块直接交互。同时，OpenAI 宣布逐步淘汰 o3 和 GPT-4.5 模型，分别于 2026 年 8 月和 6 月移除。

AI产品 OpenAI GPT-5.5 Instant 模型更新回复质量幻觉减少

推荐理由：日常使用 ChatGPT 的用户会直接感受到回复质量提升——更少列表、更自然的对话体验，值得立即体验。

原文

02:19

Decoder@Matthias Bastian

OpenAI 对 GPT-5.5 Instant 进行了可读性升级，使其回复更自然，并移除了最新模型中的 Canvas 功能，写作和编程任务将直接在聊天中完成。同时，OpenAI 宣布从 ChatGPT 中淘汰较旧的 o3 和 GPT-4.5 模型，这两款模型最迟将于 2026 年 8 月停止服务。这一更新旨在简化用户体验，并推动用户转向更高效的模型。

AI产品 GPT-5.5 Instant OpenAI 模型更新 ChatGPT 模型淘汰

推荐理由：GPT-5.5 Instant 的回复更自然，写作和编程任务直接在聊天中完成，省去了切换 Canvas 的麻烦。经常用 ChatGPT 写代码或文档的开发者，建议试试新版本，体验更流畅。

原文

5月29日

21:32

Greg Brockman@gdb

精选72°

OpenAI 员工 Michelle Pokrass 宣布今日发布了新版 GPT-5.5 Instant 模型。旧版模型被认为过于“子弹头”式（即过于激进/固执），新版在谄媚倾向、事实准确性和多语言性能三个关键维度上做了改进。该模型已上线 ChatGPT，团队欢迎用户反馈。这次更新表明 OpenAI 在持续调优模型行为，尤其关注减少谄媚和提升可靠性。

AI产品 ChatGPT GPT-5.5 Instant 模型更新事实性多语言

推荐理由：如果你在用 ChatGPT 做事实核查或多语言任务，新版 5.5 Instant 值得一试——它直接解决了旧版过于固执和谄媚的问题，对需要准确答案的开发者来说是个实用升级。

原文

08:20

Aravind Srinivas@AravSrinivas

Perplexity 宣布 Claude Opus 4.8 模型已对所有 Max 订阅用户开放。该模型被定位为 Perplexity Computer 的编排器（orchestrator），意味着它能在多步骤任务中协调其他工具或模型。Perplexity Max 用户可直接在 Perplexity 平台和 Perplexity Computer 上体验。这一更新为需要复杂推理和多工具协作的用户提供了更强大的模型选择。

AI产品 Perplexity Claude Opus 4.8 模型更新编排器 Max 订阅

推荐理由：Perplexity Max 用户终于能用上 Claude Opus 4.8 了，做复杂研究或自动化任务的团队可以直接在 Perplexity Computer 里体验编排能力，值得试试。

原文

08:10

Lenny Rachitsky@lennysan

Anthropic 发布 Claude Opus 4.8，这是 Opus 4.7 的升级版本。新模型在判断力上更敏锐，能更诚实地评估自身进展，并且比前代能独立工作更长时间。价格保持不变，即日起可用。这次更新聚焦于提升模型的自主性和可靠性，对需要长时间无人干预任务的用户尤其重要。

AI模型 Claude Opus 4.8 推理模型自主工作模型更新

推荐理由：Claude Opus 4.8 提升了自主工作能力和判断诚实度，做复杂长任务或自动化流程的团队可以直接升级，价格不变更值得一试。

原文

08:08

cat@_catwu

88°

Claude Code 团队发布了 Opus 4.8 模型，该模型在诚实性上有显著提升，能主动承认自己不知道的内容，并在代码中标记问题而非掩盖。Opus 4.8 被推荐为 Claude Code 日常使用的默认模型。这一更新旨在提升 AI 编程助手的可靠性和透明度，减少开发者的调试时间。

AI产品 Claude Code Opus 4.8 编程助手模型更新诚实性

推荐理由：Opus 4.8 解决了 AI 编程中常见的“幻觉”和掩盖问题，做代码审查和日常开发的团队可以直接在 Claude Code 中切换体验，减少不必要的排查成本。

原文

05:54

Mike Krieger@mikeyk

88°

Anthropic 联合创始人 Mikey 宣布，Claude Opus 4.8 已正式上线，价格与 4.7 相同。新模型在 Opus 4.7 基础上提升了判断准确性、对自身进展的诚实度，并支持更长时间的独立工作。同时，claude.ai 和 Cowork 新增了 effort control 功能，用户可通过滑块调节模型推理深度：处理复杂问题时调高，快速问答时调低。这一功能让用户能灵活控制模型的计算资源消耗，兼顾效率与质量。

AI产品 Claude Opus 4.8 effort control 推理控制模型更新 Anthropic

推荐理由：Opus 4.8 的 effort control 让用户按需调节模型推理深度，做复杂任务或高频问答的团队可以更精准地控制成本与响应速度，值得一试。

原文

03:06

Cognition@cognition_labs

AI产品 Claude Opus 4.8 Windsurf Devin CLI 编程助手模型更新

推荐理由：Claude Opus 4.8 的集成让 Windsurf 和 Devin 用户直接获得更强的代码生成和推理能力，做 AI 编程的开发者可以立刻升级体验。

原文

02:45

Alex Albert@alexalbert__

78°

Anthropic 发布了 Claude Opus 4.8，这是对 Opus 4.7 的改进版本。新版本在理解细微差别、对话自然度以及协作能力上均有提升，尤其在编程和知识工作方面表现更佳。Opus 4.8 还引入了更诚实的自我评估机制，能够更独立地长时间工作，且价格保持不变。

AI模型 Claude Opus 4.8 模型更新协作能力编程助手

推荐理由：Claude Opus 4.8 解决了用户对 4.7 的反馈痛点，提升了对话自然度和协作效率，做编程或知识工作的团队可以直接升级体验，值得一试。

原文

5月26日

15:22

AI Will@FinanceYF5

Anthropic 正在准备推出代号为 claude-mythos-1-preview 的新模型 Mythos 1，该模型将登陆 Claude Code 和 Claude Security 产品。模型曾短暂在代码中露面，相关标识已更新。官方表示普通用户暂时无法使用该模型，暗示可能面向企业或特定场景。这一动态表明 Anthropic 在持续迭代其模型能力，并针对开发者和安全场景进行优化。

AI模型 Anthropic Mythos 1 Claude Code Claude Security 模型更新

推荐理由：Anthropic 的新模型 Mythos 1 专为 Claude Code 和 Security 场景设计，做 AI 开发或安全工作的团队值得关注——这可能意味着更强的代码理解和安全分析能力，虽然普通用户暂不可用，但提前了解有助于规划技术栈。

原文

5月21日

08:00

08:00Simon Willison’s Weblog（博客/媒体）

76°

llm-gemini 插件更新至 0.32 版本，新增了对 Gemini 3.5 Flash 模型的支持。该模型是 Google 最新推出的轻量级模型，旨在提供更快的推理速度和更低的成本。作者还分享了使用该模型绘制鹈鹕的示例，展示了其生成能力。对于使用 LLM 命令行工具的用户，这次更新意味着可以更方便地调用 Gemini 3.5 Flash 进行文本生成和创意任务。

AI产品 Gemini LLM 模型更新命令行工具 Google

推荐理由：LLM 命令行用户可以直接升级体验 Gemini 3.5 Flash 的快速推理，做创意生成或快速原型验证的开发者值得一试。

原文

5月20日

02:09

Google Gemini App@GeminiApp

精选

谷歌今天开始推出全新的Gemini 3.5 Flash模型。该模型解锁了多项新功能，具体细节将在后续公布。用户可以期待在Gemini应用中体验这些改进。

AI模型 Gemini 3.5 Flash Google 新功能模型更新

推荐理由：Gemini 3.5 Flash上线，新功能等你尝鲜

原文

5月13日

21:36

21:36Anthropic: Engineering（资讯）

75°

Anthropic 针对近期用户报告的 Claude Code 质量问题进行了调查，发现根源在于三个独立的代码变更。这三个变更分别影响了代码生成准确性、上下文理解能力和错误处理逻辑。Anthropic 已回滚相关变更并加强了测试流程，同时承诺未来将更透明地沟通模型更新细节。此次事件提醒开发者，AI 编程助手仍处于快速迭代阶段，质量波动在所难免。

AI产品 Claude Code 质量报告编程助手 Anthropic 模型更新

推荐理由：Claude Code 用户近期遇到的质量波动终于有了官方解释——三个独立变更导致的问题已被定位并修复，做 AI 编程的团队建议关注 Anthropic 的改进措施，避免踩坑。

原文

21:36

21:36Moonshot AI: Kimi Blog（资讯）

Moonshot AI推出了Kimi Latest模型，该模型会自动指向其最新版本，用户无需手动更新即可使用最新功能。Kimi Latest旨在简化模型管理，确保用户始终使用最先进的AI能力。此举解决了模型版本频繁更新带来的兼容性和维护问题。对于开发者而言，这意味着更少的版本迁移工作和更稳定的API体验。

AI产品 Kimi Latest Moonshot AI 模型更新 API 开发者工具

推荐理由：Moonshot的Kimi Latest解决了AI模型频繁更新带来的维护痛点，做API集成的开发者可以直接用，省去手动升级的麻烦。

原文

21:35

21:35Moonshot AI: Kimi Blog（资讯）

Kimi K2 模型迎来重要更新，主要提升了代码生成与理解能力，并优化了 API 响应速度。更新后的模型在编程任务上表现更出色，能够更准确地理解复杂指令并生成高质量代码。同时，API 的延迟显著降低，为开发者提供了更流畅的集成体验。这一更新对于依赖 Kimi 进行代码辅助的团队来说是一个实用升级。

AI模型 Kimi K2 代码能力 API 加速模型更新编程助手

推荐理由：Kimi K2 的代码能力增强和 API 加速直接提升了开发者的编程效率，做 AI 编程或使用 Kimi API 的团队值得立即体验。

原文