19:16@elonmusk@elonmuskGrok 4.5 基于 xAI 的 1.5T V9 基础模型,并使用 Cursor 数据进行补充训练。该版本目前已在 SpaceX 和 Tesla 内部私测。早期评估显示其性能接近甚至超过 Opus。RL 训练仍在持续改进模型,Grok Build 工具每日提升。xAI 计划今年每月发布完全从头训练的新模型。AI模型Grok 4.5CursorSpaceX模型更新6 个信源在谈推荐理由:Musk 说 Grok 4.5 私测版已经接近 Opus,而且后面每月都会出新模型,想追动态可以瞅一眼。原文
11:47Sam Altman@samaOpenAI首席执行官Sam Altman在X上发文称,本周已更新ChatGPT使用的5.5 Instant模型。Altman形容该模型“vibe不错”。这是CEO对模型质量的直接肯定,但未透露具体改进细节。AI模型ChatGPTOpenAI5.5 Instant模型更新10 个信源在谈推荐理由:Sam Altman亲口说这周ChatGPT的5.5 Instant模型更新了,他本人很喜欢,想感受一下新效果可以试试。原文
03:49@koltregaskes@koltregaskesAnthropic正在准备更新Claude Mythos模型,版本可能从当前跳至5.1。升级到版本6的可能性较低,除非Sonnet和Opus也同步升级。目前尚不确定是否公开发布。AI模型AnthropicClaude Mythos5.1模型更新版本升级10 个信源在谈推荐理由:Anthropic又在迭代模型了,这次可能是Mythos 5.1,跟Sonnet和Opus版本联动,不知道会不会公开。原文
00:42@koltregaskes@koltregaskes78°X用户koltregaskes发现字符串"claude-sonnet-5"出现在某个位置,暗示Anthropic可能即将发布新模型。Claude Sonnet系列是Anthropic的中端模型,上一代为Claude Sonnet 4(2024年发布)。本次发现意味着Sonnet 5可能已在内部测试或即将进入公开阶段。目前Anthropic尚未官方确认该模型的存在或发布时间线。AI模型Claude Sonnet 5Anthropic模型更新10 个信源在谈推荐理由:有用户在X上扒到了Claude Sonnet 5的名字,说明Anthropic可能马上要出新模型了,关注Claude的朋友可以看看这个线索。原文
10:40arXiv cs.LG@Mingzhi Song本文提出局部总体风险证书(Local Population-Risk Certificates),为当前模型θ周围的候选方向v∈D构建ℓ_{θ+v}-ℓ_θ的两面置信带。该证书的上端点作为风险控制更新规则:仅当上端点非正时才接受更新,否则保留当前模型。这种方法保证了更新不会增加总体风险,为安全模型更新提供了理论保障。论文风险控制模型更新置信带理论分析推荐理由:这篇论文用置信带兜底,保证模型更新不会越改越差,适合需要稳妥迭代的场景。原文
12:31karminski-牙医 (AI工具)@karminski3该模型新增多模态输入功能,支持文本、图片和视频等多种数据格式。这一更新显著扩展了模型的应用场景,使其能够处理更丰富的输入类型。对于需要综合处理多种媒体信息的用户来说,这是一个重要的功能升级。AI模型多模态模型更新文本图片视频推荐理由:多模态输入让模型能处理图片和视频,做内容分析或创意工作的团队可以直接用起来,效率提升明显。原文
13:19Midjourney@midjourney72°Midjourney 宣布 V8.1 成为所有用户的默认模型,V8 将在两周后退役。V8.1 恢复了标志性美学,支持原生 2K 高清渲染,速度比 V8 快 3 倍,成本降低 3 倍。全质量 1K 模式比 V7 草稿模式更快。图像提示功能回归,新的“Describe”功能上线,并引入了 moodboards 和 srefs。V8.2 测试即将开始。AI产品MidjourneyV8.1图像生成AI 绘画模型更新推荐理由:Midjourney 用户终于等来了更快的生成速度和更低成本,V8.1 的 2K 渲染和图像提示回归让创作更高效,建议立即体验新默认模型。原文
13:53歸藏(guizang.ai)@op7418CodePilot 发布 v0.56.0 版本,新增 Claude Fable 5、小米 MiMo UltraSpeed 模型以及通用 OpenAI 兼容第三方渠道。本次更新的部分修复由 Claude Fable 5 完成,展示了其代码审查能力。同时修复了用量统计、回复状态丢失、服务商列表刷新等问题。官方推荐所有用户升级。AI产品CodePilotClaude Fable 5小米 MiMo UltraSpeed代码修复模型更新10 个信源在谈推荐理由:对于使用 CodePilot 的开发者,这次更新不仅带来了新模型支持,还验证了 Claude Fable 5 的代码修复能力,值得升级体验。原文
01:29Claude Code: GitHub Releases@ashwin-ant83°Anthropic 发布了 Claude Code v2.1.170 版本,核心亮点是引入了名为 Claude Fable 5 的 Mythos 级模型。该模型能力超越此前所有公开发布的模型,且已通过安全评估可供通用。此次更新还修复了从 VS Code 集成终端或继承环境变量的 shell 启动时,会话记录未保存且无法通过 --resume 恢复的问题。用户更新至该版本即可使用新模型。AI产品Claude CodeFable 5模型更新会话修复Anthropic10 个信源在谈推荐理由:Claude Fable 5 是 Anthropic 目前最强通用模型,做复杂推理和代码生成的开发者值得立即更新体验。原文
10:36Skywork@Skywork_ai88°Anthropic 最新模型 Claude Opus 4.8 已在 Skywork 平台上线。该模型在判断力和推理能力上有显著提升,能够处理更复杂的任务。Skywork 用户现在可以直接使用该模型进行对话和推理。这标志着 Anthropic 在 AI 模型能力上的持续进步。AI模型Claude Opus 4.8推理模型SkyworkAnthropic模型更新10 个信源在谈推荐理由:Claude Opus 4.8 的更强推理能力对需要高精度判断的开发者(如代码审查、逻辑分析)是直接利好,Skywork 用户现在就能体验,建议试试。原文
16:10shao__meng@shao__mengClaude Opus 4.8 发布后,用户反馈普遍认为相比 Opus 4.7 升级不大,甚至变笨,部分用户更倾向于 GPT-5.5。有用户尝试测试新模型时,发现自己的账号被莫名封禁,即使仅注册后发过一次消息。该事件引发对 Anthropic 模型更新策略和账号管理问题的讨论。AI产品Claude Opus 4.8模型更新账号封禁GPT-5.5用户反馈10 个信源在谈推荐理由:Claude 重度用户和开发者需要注意:Opus 4.8 口碑不佳,且账号封禁问题频发,建议谨慎更新和备份数据。原文
10:19IT之家(博客/媒体)OpenAI 于 5 月 28 日更新了 GPT-5.5 Instant 模型,使其回复更自然、易读、结构清晰,并减少冗长列表。该模型此前已在医学、法律等高风险主题上减少 52.5% 的幻觉,并提升数学、科学推理能力。更新后,GPT-5.5 Instant 和 GPT-5.5 Thinking 不再支持 Canvas 功能,用户可通过文字块和代码块直接交互。同时,OpenAI 宣布逐步淘汰 o3 和 GPT-4.5 模型,分别于 2026 年 8 月和 6 月移除。AI产品OpenAIGPT-5.5 Instant模型更新回复质量幻觉减少10 个信源在谈推荐理由:日常使用 ChatGPT 的用户会直接感受到回复质量提升——更少列表、更自然的对话体验,值得立即体验。原文
02:19Decoder@Matthias BastianOpenAI 对 GPT-5.5 Instant 进行了可读性升级,使其回复更自然,并移除了最新模型中的 Canvas 功能,写作和编程任务将直接在聊天中完成。同时,OpenAI 宣布从 ChatGPT 中淘汰较旧的 o3 和 GPT-4.5 模型,这两款模型最迟将于 2026 年 8 月停止服务。这一更新旨在简化用户体验,并推动用户转向更高效的模型。AI产品GPT-5.5 InstantOpenAI模型更新ChatGPT模型淘汰10 个信源在谈推荐理由:GPT-5.5 Instant 的回复更自然,写作和编程任务直接在聊天中完成,省去了切换 Canvas 的麻烦。经常用 ChatGPT 写代码或文档的开发者,建议试试新版本,体验更流畅。原文
21:32Greg Brockman@gdb精选72°OpenAI 员工 Michelle Pokrass 宣布今日发布了新版 GPT-5.5 Instant 模型。旧版模型被认为过于“子弹头”式(即过于激进/固执),新版在谄媚倾向、事实准确性和多语言性能三个关键维度上做了改进。该模型已上线 ChatGPT,团队欢迎用户反馈。这次更新表明 OpenAI 在持续调优模型行为,尤其关注减少谄媚和提升可靠性。AI产品ChatGPTGPT-5.5 Instant模型更新事实性多语言10 个信源在谈推荐理由:如果你在用 ChatGPT 做事实核查或多语言任务,新版 5.5 Instant 值得一试——它直接解决了旧版过于固执和谄媚的问题,对需要准确答案的开发者来说是个实用升级。原文
08:20Aravind Srinivas@AravSrinivasPerplexity 宣布 Claude Opus 4.8 模型已对所有 Max 订阅用户开放。该模型被定位为 Perplexity Computer 的编排器(orchestrator),意味着它能在多步骤任务中协调其他工具或模型。Perplexity Max 用户可直接在 Perplexity 平台和 Perplexity Computer 上体验。这一更新为需要复杂推理和多工具协作的用户提供了更强大的模型选择。AI产品PerplexityClaude Opus 4.8模型更新编排器Max 订阅10 个信源在谈推荐理由:Perplexity Max 用户终于能用上 Claude Opus 4.8 了,做复杂研究或自动化任务的团队可以直接在 Perplexity Computer 里体验编排能力,值得试试。原文
08:10Lenny Rachitsky@lennysanAnthropic 发布 Claude Opus 4.8,这是 Opus 4.7 的升级版本。新模型在判断力上更敏锐,能更诚实地评估自身进展,并且比前代能独立工作更长时间。价格保持不变,即日起可用。这次更新聚焦于提升模型的自主性和可靠性,对需要长时间无人干预任务的用户尤其重要。AI模型ClaudeOpus 4.8推理模型自主工作模型更新10 个信源在谈推荐理由:Claude Opus 4.8 提升了自主工作能力和判断诚实度,做复杂长任务或自动化流程的团队可以直接升级,价格不变更值得一试。原文
08:08cat@_catwu88°Claude Code 团队发布了 Opus 4.8 模型,该模型在诚实性上有显著提升,能主动承认自己不知道的内容,并在代码中标记问题而非掩盖。Opus 4.8 被推荐为 Claude Code 日常使用的默认模型。这一更新旨在提升 AI 编程助手的可靠性和透明度,减少开发者的调试时间。AI产品Claude CodeOpus 4.8编程助手模型更新诚实性10 个信源在谈推荐理由:Opus 4.8 解决了 AI 编程中常见的“幻觉”和掩盖问题,做代码审查和日常开发的团队可以直接在 Claude Code 中切换体验,减少不必要的排查成本。原文
05:54Mike Krieger@mikeyk88°Anthropic 联合创始人 Mikey 宣布,Claude Opus 4.8 已正式上线,价格与 4.7 相同。新模型在 Opus 4.7 基础上提升了判断准确性、对自身进展的诚实度,并支持更长时间的独立工作。同时,claude.ai 和 Cowork 新增了 effort control 功能,用户可通过滑块调节模型推理深度:处理复杂问题时调高,快速问答时调低。这一功能让用户能灵活控制模型的计算资源消耗,兼顾效率与质量。AI产品Claude Opus 4.8effort control推理控制模型更新Anthropic10 个信源在谈推荐理由:Opus 4.8 的 effort control 让用户按需调节模型推理深度,做复杂任务或高频问答的团队可以更精准地控制成本与响应速度,值得一试。原文
03:06Cognition@cognition_labsAnthropic 的最新模型 Claude Opus 4.8 现已集成到 Windsurf 和 Devin CLI 中。这意味着开发者可以在 Windsurf 的 AI 编程环境和 Devin 的命令行工具中直接使用该模型。Claude Opus 4.8 在推理、代码生成和复杂任务处理上有所提升,为 AI 编程助手提供了更强的底层能力。这一更新让使用 Windsurf 和 Devin 的团队能够立即体验到最新模型带来的性能改进。AI产品Claude Opus 4.8WindsurfDevin CLI编程助手模型更新10 个信源在谈推荐理由:Claude Opus 4.8 的集成让 Windsurf 和 Devin 用户直接获得更强的代码生成和推理能力,做 AI 编程的开发者可以立刻升级体验。原文
02:45Alex Albert@alexalbert__78°Anthropic 发布了 Claude Opus 4.8,这是对 Opus 4.7 的改进版本。新版本在理解细微差别、对话自然度以及协作能力上均有提升,尤其在编程和知识工作方面表现更佳。Opus 4.8 还引入了更诚实的自我评估机制,能够更独立地长时间工作,且价格保持不变。AI模型ClaudeOpus 4.8模型更新协作能力编程助手10 个信源在谈推荐理由:Claude Opus 4.8 解决了用户对 4.7 的反馈痛点,提升了对话自然度和协作效率,做编程或知识工作的团队可以直接升级体验,值得一试。原文
15:22AI Will@FinanceYF5Anthropic 正在准备推出代号为 claude-mythos-1-preview 的新模型 Mythos 1,该模型将登陆 Claude Code 和 Claude Security 产品。模型曾短暂在代码中露面,相关标识已更新。官方表示普通用户暂时无法使用该模型,暗示可能面向企业或特定场景。这一动态表明 Anthropic 在持续迭代其模型能力,并针对开发者和安全场景进行优化。AI模型AnthropicMythos 1Claude CodeClaude Security模型更新10 个信源在谈推荐理由:Anthropic 的新模型 Mythos 1 专为 Claude Code 和 Security 场景设计,做 AI 开发或安全工作的团队值得关注——这可能意味着更强的代码理解和安全分析能力,虽然普通用户暂不可用,但提前了解有助于规划技术栈。原文
08:00Simon Willison’s Weblog(博客/媒体)76°llm-gemini 插件更新至 0.32 版本,新增了对 Gemini 3.5 Flash 模型的支持。该模型是 Google 最新推出的轻量级模型,旨在提供更快的推理速度和更低的成本。作者还分享了使用该模型绘制鹈鹕的示例,展示了其生成能力。对于使用 LLM 命令行工具的用户,这次更新意味着可以更方便地调用 Gemini 3.5 Flash 进行文本生成和创意任务。AI产品GeminiLLM模型更新命令行工具Google推荐理由:LLM 命令行用户可以直接升级体验 Gemini 3.5 Flash 的快速推理,做创意生成或快速原型验证的开发者值得一试。原文
02:09Google Gemini App@GeminiApp精选谷歌今天开始推出全新的Gemini 3.5 Flash模型。该模型解锁了多项新功能,具体细节将在后续公布。用户可以期待在Gemini应用中体验这些改进。AI模型Gemini 3.5 FlashGoogle新功能模型更新推荐理由:Gemini 3.5 Flash上线,新功能等你尝鲜原文
21:36Anthropic: Engineering(资讯)75°Anthropic 针对近期用户报告的 Claude Code 质量问题进行了调查,发现根源在于三个独立的代码变更。这三个变更分别影响了代码生成准确性、上下文理解能力和错误处理逻辑。Anthropic 已回滚相关变更并加强了测试流程,同时承诺未来将更透明地沟通模型更新细节。此次事件提醒开发者,AI 编程助手仍处于快速迭代阶段,质量波动在所难免。AI产品Claude Code质量报告编程助手Anthropic模型更新10 个信源在谈推荐理由:Claude Code 用户近期遇到的质量波动终于有了官方解释——三个独立变更导致的问题已被定位并修复,做 AI 编程的团队建议关注 Anthropic 的改进措施,避免踩坑。原文
21:36Moonshot AI: Kimi Blog(资讯)Moonshot AI推出了Kimi Latest模型,该模型会自动指向其最新版本,用户无需手动更新即可使用最新功能。Kimi Latest旨在简化模型管理,确保用户始终使用最先进的AI能力。此举解决了模型版本频繁更新带来的兼容性和维护问题。对于开发者而言,这意味着更少的版本迁移工作和更稳定的API体验。AI产品Kimi LatestMoonshot AI模型更新API开发者工具1 个信源在谈推荐理由:Moonshot的Kimi Latest解决了AI模型频繁更新带来的维护痛点,做API集成的开发者可以直接用,省去手动升级的麻烦。原文
21:35Moonshot AI: Kimi Blog(资讯)Kimi K2 模型迎来重要更新,主要提升了代码生成与理解能力,并优化了 API 响应速度。更新后的模型在编程任务上表现更出色,能够更准确地理解复杂指令并生成高质量代码。同时,API 的延迟显著降低,为开发者提供了更流畅的集成体验。这一更新对于依赖 Kimi 进行代码辅助的团队来说是一个实用升级。AI模型Kimi K2代码能力API 加速模型更新编程助手推荐理由:Kimi K2 的代码能力增强和 API 加速直接提升了开发者的编程效率,做 AI 编程或使用 Kimi API 的团队值得立即体验。原文