15:27AI Will@FinanceYF5该视频记录了Mntruell在Compile会议上宣布Cursor新模型的完整过程。视频未透露模型版本号或基准测试结果,只展示了发布现场。观众可通过视频了解新模型的基本定位和功能方向。AI模型CursorMntruellCompile编程助手3 个信源在谈推荐理由:想第一时间知道Cursor新发布什么模型?这是Mntruell在Compile上的完整宣布视频,直接看干货。原文
15:18marktechpost@Asif Razzaq精选MoonMath AI 开源了一个基于 HIP 的注意力内核,针对 AMD MI300X GPU 进行了优化。该内核采用单指令汇编包装器和八波流水线架构,在所有形状和舍入模式下均击败了 AMD 官方实现的 AITER v3。基准测试结果显示,新内核在 MI300X 上的性能显著领先,未出现任何退化情况。AI模型MoonMathAMD MI300XHIPAITER v3推理模型推荐理由:MoonMath 开源了一个注意力内核,能在 AMD MI300X 上全面碾压官方 AITER v3,速度更快,所有形状都更强,值得跑推理的人试试。原文
15:06IT之家(博客/媒体)72°特斯拉Semi电动重卡在加州森尼韦尔被拍到搭载基准真值校验设备(ground truth validation)。该设备用于监督式算法训练,旨在为8级纯电动重卡完善FSD模型。特斯拉此前在Cybertruck上因摄像头高度异常,FSD功能延迟部署,一周前才推送智能召唤(ASS)功能。Semi的FSD若能落地,将缓解法规对卡车司机驾驶时长的限制,提升物流效率,但技术挑战类似Cybertruck。AI模型特斯拉SemiFSD自动驾驶电动重卡推荐理由:特斯拉正在给Semi重卡刷FSD,用专业校准设备训练,比乘用车版更难搞,搞定了能解决卡车司机疲劳问题。原文
14:57IT之家(博客/媒体)阿里巴巴今日发布视频生成模型 HappyHorse 1.1,较 1.0 版本在动态表现力、主体一致性、指令遵循等维度系统性升级。模型单次生成时长 3 到 15 秒,支持 720p 和 1080p 分辨率和自由宽高比。官方同步宣布联合虎鲸文娱集团举办 “Horsepower” AI 影像大赛,优胜者获百万商单合作,导演张纪中担任评委。即日起可通过 HappyHorse 官网、阿里云百炼和千问云使用最新版本。AI模型HappyHorse阿里巴巴视频生成AI影像大赛张纪中推荐理由:阿里刚发了视频生成模型 HappyHorse 1.1,动态和一致性更强了,还搭了百万大奖的比赛,玩 AI 视频的可以试试。原文
14:27The Rundown AI@therundownai精选73°日本Sakana AI发布了Fugu和Fugu Ultra模型。Fugu Ultra采用多智能体编排系统,整合多种模型协同工作。在多个基准测试中,Fugu Ultra达到Fable和Mythos模型的性能水平。模型通过单一API提供,声称可规避出口管制风险。AI模型Sakana AIFuguFugu Ultra多智能体推荐理由:Sakana AI搞了个新玩法,用多个小模型组团干活,性能追平Fable和Mythos,还不用怕出口限制,搞AI的值得看看。原文
14:09IT之家(博客/媒体)郭明錤透露,谷歌在 TPU v9(Humufish)基础上推出升级改款 Triggerfish,针对 AI 推理优化,由联发科独家代工。Triggerfish 片内 SRAM 缓存规模为 Humufish 的 2~3 倍,可降低数据传输开销;片外 DRAM 从 HBM4 升级至 HBM4E。该芯片旨在缓解“CPU 墙”与“内存墙”问题,预计2027年底投产,2028年底放量,生命周期出货 100~200 万颗,单价较 Humufish 高出约三成。还引入“simulation die”,可能用于本地 TPU 管理、训推切换等功能。AI模型谷歌TPU v9联发科推理芯片AI芯片推荐理由:谷歌和联发科联手要做 TPU v9 推理升级版 Triggerfish,缓存翻倍、内存升级,2027 年就能看到成品了。原文
12:54量子位@思邈清华大学团队开源的空间智能模型被ECCV 2026接收。该模型在空间理解基准上得分超过Gemini。它能够处理120分钟的长视频并保持上下文。模型权重和代码已开源。AI模型空间模型ECCV2026清华Gemini开源模型推荐理由:清华这套空间模型在ECCV 2026上把Gemini比下去了,还能边看两小时长视频边记,玩空间理解的同学可以试试。原文
12:24歸藏(guizang.ai)@op7418Anthropic已训练完成更强版本的Mythos模型,可能命名为Mythos 5.1或Mythos 6。目前不确定是否会公开发布或仅用于内部加速开发。消息称停止发布Fable 5或Mythos 5不会减慢进展,反而释放资源。竞争压力来自开源模型如GLM-5.2,迫使前沿实验室持续训练更强系统。AI模型AnthropicMythosGLM-5.2推理模型开源模型8 个信源在谈推荐理由:有人说Anthropic偷偷训了个更强的Mythos,但可能不对外放。想了解AI前沿动态可以看看。原文
10:48Pandaily@contact@pandaily.com (Pandaily)ByteDance Seed与学术合作伙伴提出SpatialTree,这是一个分层框架,旨在重新定义多模态大模型(MLLM)对空间的理解与推理能力。该工作已被计算机视觉顶级会议CVPR 2026接收。SpatialTree通过层级结构显著提升MLLM在空间任务上的表现。AI模型SpatialTreeByteDance SeedCVPR 2026多模态空间智能4 个信源在谈推荐理由:字节跳动Seed搞了个SpatialTree框架,专门提升多模态模型的空间推理能力,还被CVPR 2026接受了,值得一看。原文
09:30IT之家(博客/媒体)精选闪迪新专利(US 12,430,274 B2)提出将搭载CMOS键合阵列的NAND闪存存储裸片堆叠在主计算裸片下方,主计算裸片可为AI加速器或GPU。与HBM DRAM共存于同一中介层,HBM负责低延迟高优先任务,NAND闪存承担大容量读写。单组HBF堆叠容量最高4TB,而HBM单堆仅32~64GB。宽通道互联降低传输延迟、硬件成本和功耗。该架构尚在专利阶段,量产面临功耗和制造成本挑战。AI模型闪迪NAND闪存HBM3D堆叠存储架构推荐理由:闪迪把海量NAND闪存直接堆到GPU底下,单堆容量冲到4TB,比HBM大几十倍,延迟还低,存储瓶颈的新解法来了。原文
06:54@koltregaskes@koltregaskes据传闻,GPT-5.6将在前端开发方面有显著提升,类似于Claude Design的Codex设计工具。5.6和5.6 Pro版本可能在下周四发布。同时,用户也在期待Sonnet 5和Gemini 3.5 Pro的更新。AI模型GPT-5.6Sonnet 5Gemini 3.5 Pro前端开发编程助手推荐理由:GPT-5.6据说前端开发更强了,还有5.6 Pro,下周四可能发布。原文
03:49@koltregaskes@koltregaskesX用户koltregaskes分享的截图显示,ChatGPT在一段对话中回复需要更多时间进行检查,暗示GPT-5.6可能引入更严格的安全机制。目前OpenAI官方未对此消息确认。GPT-5.6是传闻中的下一代模型,但具体发布时间与功能细节仍未公布。AI模型GPT-5.6OpenAIAI安全10 个信源在谈推荐理由:OpenAI可能推出的GPT-5.6会增加安全检查,想提前了解变化可以看看这个讨论。原文
03:49@koltregaskes@koltregaskesAnthropic正在准备更新Claude Mythos模型,版本可能从当前跳至5.1。升级到版本6的可能性较低,除非Sonnet和Opus也同步升级。目前尚不确定是否公开发布。AI模型AnthropicClaude Mythos5.1模型更新版本升级10 个信源在谈推荐理由:Anthropic又在迭代模型了,这次可能是Mythos 5.1,跟Sonnet和Opus版本联动,不知道会不会公开。原文
00:42@koltregaskes@koltregaskes78°X用户koltregaskes发现字符串"claude-sonnet-5"出现在某个位置,暗示Anthropic可能即将发布新模型。Claude Sonnet系列是Anthropic的中端模型,上一代为Claude Sonnet 4(2024年发布)。本次发现意味着Sonnet 5可能已在内部测试或即将进入公开阶段。目前Anthropic尚未官方确认该模型的存在或发布时间线。AI模型Claude Sonnet 5Anthropic模型更新10 个信源在谈推荐理由:有用户在X上扒到了Claude Sonnet 5的名字,说明Anthropic可能马上要出新模型了,关注Claude的朋友可以看看这个线索。原文
17:54shao__meng@shao__meng社交媒体上发起LLM对比投票,比较GLM-5.2和Gemini 3.5 Flash。投票结果倾向GLM-5.2,用户认为Gemini 3.5 Flash表现不佳。评论指出Google DeepMind自Gemini 3.0多模态发布后缺乏亮眼进展。讨论焦点集中在国产模型与Google模型的性能差距。AI模型GLM-5.2Gemini 3.5 FlashGoogle DeepMind模型对比推理模型推荐理由:看看大家投票选GLM-5.2还是Gemini 3.5 Flash,很多人觉得Gemini近期的模型不太能打。原文
15:25@koltregaskes@koltregaskesGLM-5.2 在 DeepSWE 编程基准上取得 44% 的得分,超过 Kimi-K2.7 Code,成为目前最强的开源模型。不过它的运行成本更高,且每次输出更多 tokens。与封闭模型相比,Claude Fable 5 以 70% 的得分领先,差距明显。AI模型GLM-5.2Kimi-K2.7DeepSWE开源模型代码生成推荐理由:智谱的 GLM-5.2 代码上刚赢了 Kimi 的 K2.7,但更贵输出也更多,离顶级闭源还有距离。原文
15:18AI Will@FinanceYF5精选Anthropic在2月完成新模型Mythos的训练。Mythos悄然改变了整个研发节奏。过去5个月AI能力跃升部分源于Mythos。领先模型正帮助训练下一代模型,该循环已启动。AI模型MythosAnthropic推理模型模型迭代8 个信源在谈推荐理由:Anthropic悄悄练成了Mythos,据说它直接改变了研发节奏,领先模型开始帮训练下一代模型了。原文
15:13Guillermo Rauch@rauchgGLM-5.2 是 zai_org 发布的新模型,在编码任务上表现极佳。网友 rauchg 在 X 上表示“几乎震惊”,认为这改变了局面。该推文获得 127 赞和 25 次分享。GLM-5.2 的编码能力被认为堪比顶级模型。AI模型GLM-5.2zai_org编程助手编码推荐理由:zai_org 的 GLM-5.2 在编码上强到让人震惊,跟之前版本比进步很大,值得试试。原文
07:12marktechpost@Asif Razzaq精选Cisco Foundation AI开源FAPO,由Claude Code驱动,自动优化多步骤LLM流水线。FAPO评估整个链条,在步骤级别归因失败原因,并提出提示、参数和链结构层面的变体。在18个模型-基准对比中,FAPO击败GEPA 15次。每个变体经独立审批评证后集成到优化循环中。AI模型FAPOClaude CodeCisco提示优化流水线推荐理由:Cisco开源了FAPO,能自动修多步LLM管线的提示,比GEPA强在15/18个测试里,想搞提示优化的快去试试。原文
05:58marktechpost@Michal SutterNous Research为其开源智能体框架Hermes Agent新增了Blank Slate模式。该模式默认仅启用provider、model、File Operations和Terminal四项基础功能。用户通过platform_toolsets.cli和disabled_toolsets命令行接口手动添加其他工具集,实现从零开始配置。这种设计避免了预装过多工具,提升了Agent的灵活性和可控性。AI模型Hermes AgentNous Research智能体工具集开源模型推荐理由:想精细控制Agent工具?Nous Research给Hermes Agent加了Blank Slate模式,从零选工具,不预装一堆,清爽又可控。原文
03:54Suhail@Suhail精选Z.ai推出GLM-5.2开源模型,采用MIT开放权重。该模型支持1M上下文窗口,在Terminal-Bench 2.1基准上得分81.0,仅比Claude Opus 4.8低几分。Perplexity CEO此前指出,中国已拥有最强开源模型DeepSeek,且美国开发者正基于其构建应用。GLM-5.2的发布进一步表明开源AI竞赛已非理论。AI模型GLM-5.2Z.aiDeepSeek开源模型推理模型推荐理由:Z.ai刚刚放出了GLM-5.2,MIT开源、100万上下文、跑分81.0,跟Claude Opus 4.8差距很小,做开源模型的得看看。原文
00:53elvis@omarsar0精选GLM-5.2 在图形设计能力上据称达到 Opus 级别,同时在长期运行任务中表现良好。其训练引入了反奖励破解模块,用于解决强化学习中常见的奖励破解问题,例如模型走捷径、变懒、意图偏差等。该模块有助于提升编码代理在长周期任务中的可靠性与效果。GLM-5.2 是一个开源开放权重模型。AI模型GLM-5.2奖励破解开源模型设计长期任务推荐理由:GLM-5.2 据称设计和长任务都接近 Opus,关键是加了个反奖励破解机制,让模型更靠谱。原文
23:55AK@_akhaliq研究人员发布了S-Agent,一个通过空间工具使用来增强空间推理能力的模型。S-Agent在虚拟环境中学习操作和使用空间工具,如旋转、移动物体等,以解决空间任务。该方法在空间智能基准测试中展现了显著的推理能力提升。AI模型S-Agent推理模型空间智能智能体推荐理由:S-Agent教AI通过操作空间工具来推理空间关系,跟传统只靠视觉的模型不一样,值得关注。原文
19:56量子位@听雨由三位00后开发者耗时两个月打造的流式音视频社交模型,在推理速度上达到SOTA水平。相比谷歌的Veo 3,其速度提升7倍,成本降低至1/2000。模型支持实时音视频交互,适用于社交场景。AI模型Veo 3流式模型音视频社交SOTA推荐理由:三个00后做的音视频社交模型,速度比谷歌Veo 3快7倍,成本低到吓人,适合实时互动场景。原文
17:42IT之家(博客/媒体)74°LM Studio 与苹果在 WWDC 2026 期间合作,用四台 Mac Studio 集群成功运行月之暗面万亿参数大模型 Kimi K2.6。Kimi K2.6 总参数达 1 万亿,采用 MoE 架构,激活参数 320 亿,支持长上下文、多模态输入和智能体任务。四台 Mac Studio 通过 Thunderbolt 5 RDMA 内存共享形成约 1.5TB 统一内存,实现模型推理。演示还展示 LM Link 功能,用户可从 MacBook Neo 或 iPhone 安全远程访问集群模型,数据保持本地处理。在类似配置下,模型生成速度约 28 tokens/s,功耗低于传统 GPU 集群。AI模型Kimi K2.6LM StudioMac Studio本地部署推理模型推荐理由:LM Studio 用四台 Mac Studio 跑起万亿参数的 Kimi K2.6,还能用 iPhone 远程调用,给消费级本地部署开了个好头。原文
16:46Pandaily@contact@pandaily.com (Pandaily)智谱AI的GLM 5.2在Design Arena的HTML网页设计基准测试中超越Claude Fable 5,获得第一名。该模型在第三方库利用方面表现更优,同时具备成本优势。Design Arena基准专门评估AI生成HTML代码的设计质量和功能性。AI模型GLM 5.2Claude Fable 5Zhipu AIDesign Arena网页设计7 个信源在谈推荐理由:智谱AI的GLM 5.2在网页设计上干掉了Claude Fable 5,库支持更好还更省钱。原文
16:21IT之家(博客/媒体)上海交通大学等机构在arXiv发布研究,提出BabelTele压缩方法。该方法将文本压缩至原大小的27.9%,仍保持99.5%的语义准确性。人类阅读压缩文本后问答准确率显著下降,但Gemini 3.1 Pro准确率稳定。在MeetingBank和QuALITY基准上,同等压缩率下BabelTele优于LLMLingua-2。多智能体通信测试中,减少约40%通信Token,任务完成度超过96%。AI模型BabelTeleGemini 3.1 Pro文本压缩多智能体语义保留推荐理由:上海交大团队搞了个BabelTele,AI之间能说人类看不懂的语言,压缩四分之三文本还差不多全对,省token神器。原文
14:30IT之家(博客/媒体)82°OpenAI 预计下周发布 GPT-5.6 系列,涵盖 mini、标准版和 Pro 版。部分 Pro 订阅用户已可访问 GPT-5.6 Pro,输出质量提升明显。上下文窗口从 100 万 tokens 扩展至 150 万 tokens,优化了长周期编码和 Codex 响应速度。消息称在智能体编码工作中,GPT-5.6 已超越 Anthropic 的 Mythos 系列。定价方面,OpenAI 当前 token 价格约为 Anthropic 的一半,计划进一步降价。AI模型GPT-5.6OpenAIMythosAnthropic智能体10 个信源在谈推荐理由:OpenAI 要发 GPT-5.6 了,上下文拉到 150 万 tokens,编码能力还干翻了 Anthropic 的 Mythos,价格还更便宜,开发者可以关注一下。原文
11:09IT之家(博客/媒体)x86生态系统咨询小组(EAG)于2024年由英特尔和AMD联合成立,旨在统一x86架构演进。EAG近日发布ACE规范1.15版本,定义了一套针对AI计算的指令集,核心优化矩阵乘法运算和低精度数据格式处理。ACE支持INT8、FP16、BF16、FP8等多种数据格式,并引入图块寄存器(tile register)状态。AMD明确Zen 6将添加新AI数据类型支持,Zen 7配备新矩阵引擎与AI数据格式扩展。AI模型英特尔AMDACEx86AI算力推荐理由:英特尔和AMD联手推出了ACE规范1.15,专门给x86芯片加AI加速指令,未来Zen 6和Zen 7都会用上,搞深度学习的朋友可以关注。原文
10:54shao__meng@shao__mengGLM 5.2 开源后在 X 平台获得多位国外 AI 博主称赞。智谱港股股价近期飙升,市值已超过 MiniMax 并接近小米。作者提到智谱内部运营问题和自身充值体验,但认为模型够强仍是核心。AI模型GLM 5.2智谱开源模型港股推荐理由:智谱开源了 GLM 5.2,国外博主都在夸,股价还涨到快赶上小米了,模型实力真的能打。原文
10:18pandaily@contact@pandaily.com (Pandaily)小米发布并开源了Miloco 2.0全屋AI系统,具备多模态感知能力,可识别用户行为和场景。该系统支持主动智能,能预测需求并执行持续任务,如自动调节灯光温度。Miloco 2.0拥有家庭记忆功能,可记住家庭成员的偏好和习惯。该系统被比作钢铁侠的JARVIS管家,面向中国家庭提供个性化服务。AI模型小米Miloco 2.0智能家居多模态开源模型推荐理由:小米开源了Miloco 2.0,一个像JARVIS一样有记忆能主动帮忙的智能家居AI,多模态和家庭记忆功能很实用。原文
08:54IT之家(博客/媒体)Anthropic 国际董事总经理 Chris Ciauri 在韩国首尔发布会上表示,有信心在未来几天内向美国之外地区重新开放 Claude Mythos 和 Claude Fable 5 模型。此前这两个模型因美国白宫安全指令被临时封锁访问权限。Anthropic 计划深化对韩投资,已组建商业、技术、政策和运营团队,韩国是其全球第 12 大市场。其安全倡议 Project Glasswing 已有约 150 个合作伙伴,包括谷歌、英伟达、微软、苹果、三星电子等。AI模型AnthropicMythosFable 5AI安全韩国10 个信源在谈推荐理由:Anthropic 的最强模型 Mythos 和 Fable 5 很快要重新开放了,面向美国之外,韩国市场也在快速扩张。原文
08:09IT之家(博客/媒体)72°智谱 GLM-5.2 在 Design Arena 单轮 HTML 网页设计评测中总分第一,超越 Claude Fable 5、Opus 4.6 等模型。相比前代 GLM 5.1,名次提升 5 位。推理价格为每百万 tokens 1.40/4.40 美元,低于 Fable 5 的 10/50 美元。GLM 5.2 在 91% 会话中使用 TailwindCSS,调用第三方库使胜率提升 6.0 个百分点。AI模型GLM-5.2智谱Claude Fable 5Design Arena网页设计8 个信源在谈推荐理由:智谱的 GLM-5.2 刚登顶设计榜单,比 Claude Fable 5 便宜很多,还能用好第三方库,做网页设计的可以试试。原文
06:57marktechpost@Asif RazzaqNVIDIA AI推出了SpatialClaw,这是一个无需训练的智能体。它通过编写Python代码在持久内核中执行,将代码作为动作接口。SpatialClaw能够组合多种感知工具,实现3D空间推理。这种设计免去了传统微调或训练步骤。AI模型SpatialClawNVIDIAPython智能体3D空间推理2 个信源在谈推荐理由:NVIDIA搞了个叫SpatialClaw的智能体,不用训练,直接用写Python代码的方式做3D空间推理,挺创新的。原文
06:15marktechpost@Asif RazzaqVibeThinker-3B是一个3B参数的MIT许可证推理模型,基于Qwen2.5-Coder-3B构建。该模型采用Spectrum-to-Signal后训练流水线。在可验证基准上,它匹配了DeepSeek V3.2和Kimi K2.5的性能。AI模型VibeThinker-3BQwen2.5-Coder-3BDeepSeek V3.2Kimi K2.5推理模型2 个信源在谈推荐理由:3B参数就能比肩DeepSeek V3.2和Kimi K2.5,基于Qwen2.5-Coder-3B开源,适合资源受限场景的推理任务。原文
05:55Browser Use@browser_useGLM 5.2 在 BrowserCode 基准上达到接近 Opus 级别分数,单次任务成本仅 0.18 美元。Minimax M3 取得 Sonnet 级别分数,输入价格 0.30 美元,比 DeepSeek V4 Pro 更便宜。Kimi k2.7 相比 k2.6 提升 9%,但被 M3 超越。这些开源权重模型首次在浏览器智能体任务中追平甚至超过 GPT 5.5 等闭源模型。AI模型GLM 5.2Minimax M3Kimi k2.7BrowserCode智能体2 个信源在谈推荐理由:智谱发了 GLM 5.2,Benchmark 接近 Opus,成本才一毛八,还有更便宜的 M3 和升级的 Kimi 2.7,做浏览器智能体有得选了。原文
03:55Nous Research@NousResearchNousResearch 在推文中表示,Hermes Agent 模型当前表现优秀。AI模型Hermes AgentNousResearch智能体推荐理由:NousResearch 说他们的 Hermes Agent 现在很强,可以看看。原文
03:50Nous Research@NousResearchNousResearch 在其 Hermes Agent 中引入了异步子代理功能。主代理可无需等待子代理完成即可继续工作。该功能提升了多代理协作的效率。AI模型Hermes AgentNousResearch智能体异步多代理协作推荐理由:Hermes Agent 现在支持异步子代理了,主代理不用干等子任务结束,能同时干多件事,效率提升很明显。原文
03:05Together AI@togethercompute精选MiniMax-M3 模型支持智能体携带长历史(超过百万token)、图像、视频、文档和工具输出进入上下文,显著提升多模态信息处理能力。Together 的推理优化通过改进服务路径上的 token 吞吐量,使这一能力在大规模部署时更实用。相比之前方案,每 GPU 可处理更多 token,从而降低每美元自动化工作成本。AI模型MiniMax-M3Together智能体多模态推理优化2 个信源在谈推荐理由:MiniMax-M3 让智能体一口气带进长历史、图、视频、文档和工具输出,Together 优化后每 GPU token 翻倍,自动任务成本更低。原文
03:05Together AI@togethercompute88°OpenAI 的 GPT Image 2 模型现已在 Together AI 的 Serverless Inference 服务中上线。开发者可通过该接口将图像生成与编辑功能集成到多模态应用中。模型支持精准布局控制、可读文本生成以及参考图像引导生成。Together AI 提供无服务器推理能力,无需管理基础设施即可调用。AI模型GPT Image 2OpenAITogether AI图像生成多模态10 个信源在谈推荐理由:OpenAI 的新图像模型 GPT Image 2 现在能用 Together AI 的无服务器接口调用了,做多模态应用时直接用它生成和编辑图片,支持布局和文字控制,挺方便。原文