全部 AI 动态 · AI 热点

AITOP

6月22日

15:27

AI Will@FinanceYF5

该视频记录了Mntruell在Compile会议上宣布Cursor新模型的完整过程。视频未透露模型版本号或基准测试结果，只展示了发布现场。观众可通过视频了解新模型的基本定位和功能方向。

推荐理由：想第一时间知道Cursor新发布什么模型？这是Mntruell在Compile上的完整宣布视频，直接看干货。

原文

15:18

marktechpost@Asif Razzaq

精选

MoonMath AI 开源了一个基于 HIP 的注意力内核，针对 AMD MI300X GPU 进行了优化。该内核采用单指令汇编包装器和八波流水线架构，在所有形状和舍入模式下均击败了 AMD 官方实现的 AITER v3。基准测试结果显示，新内核在 MI300X 上的性能显著领先，未出现任何退化情况。

AI模型 MoonMath AMD MI300X HIP AITER v3 推理模型

推荐理由：MoonMath 开源了一个注意力内核，能在 AMD MI300X 上全面碾压官方 AITER v3，速度更快，所有形状都更强，值得跑推理的人试试。

原文

15:06

15:06IT之家（博客/媒体）

72°

特斯拉Semi电动重卡在加州森尼韦尔被拍到搭载基准真值校验设备（ground truth validation）。该设备用于监督式算法训练，旨在为8级纯电动重卡完善FSD模型。特斯拉此前在Cybertruck上因摄像头高度异常，FSD功能延迟部署，一周前才推送智能召唤（ASS）功能。Semi的FSD若能落地，将缓解法规对卡车司机驾驶时长的限制，提升物流效率，但技术挑战类似Cybertruck。

AI模型特斯拉 Semi FSD 自动驾驶电动重卡

推荐理由：特斯拉正在给Semi重卡刷FSD，用专业校准设备训练，比乘用车版更难搞，搞定了能解决卡车司机疲劳问题。

原文

14:57

14:57IT之家（博客/媒体）

阿里巴巴今日发布视频生成模型 HappyHorse 1.1，较 1.0 版本在动态表现力、主体一致性、指令遵循等维度系统性升级。模型单次生成时长 3 到 15 秒，支持 720p 和 1080p 分辨率和自由宽高比。官方同步宣布联合虎鲸文娱集团举办 “Horsepower” AI 影像大赛，优胜者获百万商单合作，导演张纪中担任评委。即日起可通过 HappyHorse 官网、阿里云百炼和千问云使用最新版本。

AI模型 HappyHorse 阿里巴巴视频生成 AI影像大赛张纪中

推荐理由：阿里刚发了视频生成模型 HappyHorse 1.1，动态和一致性更强了，还搭了百万大奖的比赛，玩 AI 视频的可以试试。

原文

14:27

The Rundown AI@therundownai

精选73°

日本Sakana AI发布了Fugu和Fugu Ultra模型。Fugu Ultra采用多智能体编排系统，整合多种模型协同工作。在多个基准测试中，Fugu Ultra达到Fable和Mythos模型的性能水平。模型通过单一API提供，声称可规避出口管制风险。

AI模型 Sakana AI Fugu Fugu Ultra 多智能体

推荐理由：Sakana AI搞了个新玩法，用多个小模型组团干活，性能追平Fable和Mythos，还不用怕出口限制，搞AI的值得看看。

原文

14:09

14:09IT之家（博客/媒体）

郭明錤透露，谷歌在 TPU v9（Humufish）基础上推出升级改款 Triggerfish，针对 AI 推理优化，由联发科独家代工。Triggerfish 片内 SRAM 缓存规模为 Humufish 的 2~3 倍，可降低数据传输开销；片外 DRAM 从 HBM4 升级至 HBM4E。该芯片旨在缓解“CPU 墙”与“内存墙”问题，预计2027年底投产，2028年底放量，生命周期出货 100~200 万颗，单价较 Humufish 高出约三成。还引入“simulation die”，可能用于本地 TPU 管理、训推切换等功能。

AI模型谷歌 TPU v9 联发科推理芯片 AI芯片

推荐理由：谷歌和联发科联手要做 TPU v9 推理升级版 Triggerfish，缓存翻倍、内存升级，2027 年就能看到成品了。

原文

12:54

量子位@思邈

清华大学团队开源的空间智能模型被ECCV 2026接收。该模型在空间理解基准上得分超过Gemini。它能够处理120分钟的长视频并保持上下文。模型权重和代码已开源。

AI模型空间模型 ECCV2026 清华 Gemini 开源模型

推荐理由：清华这套空间模型在ECCV 2026上把Gemini比下去了，还能边看两小时长视频边记，玩空间理解的同学可以试试。

原文

12:24

歸藏(guizang.ai)@op7418

Anthropic已训练完成更强版本的Mythos模型，可能命名为Mythos 5.1或Mythos 6。目前不确定是否会公开发布或仅用于内部加速开发。消息称停止发布Fable 5或Mythos 5不会减慢进展，反而释放资源。竞争压力来自开源模型如GLM-5.2，迫使前沿实验室持续训练更强系统。

AI模型 Anthropic Mythos GLM-5.2 推理模型开源模型

推荐理由：有人说Anthropic偷偷训了个更强的Mythos，但可能不对外放。想了解AI前沿动态可以看看。

原文

10:48

Pandaily@contact@pandaily.com (Pandaily)

ByteDance Seed与学术合作伙伴提出SpatialTree，这是一个分层框架，旨在重新定义多模态大模型（MLLM）对空间的理解与推理能力。该工作已被计算机视觉顶级会议CVPR 2026接收。SpatialTree通过层级结构显著提升MLLM在空间任务上的表现。

AI模型 SpatialTree ByteDance Seed CVPR 2026 多模态空间智能

推荐理由：字节跳动Seed搞了个SpatialTree框架，专门提升多模态模型的空间推理能力，还被CVPR 2026接受了，值得一看。

原文

09:30

09:30IT之家（博客/媒体）

精选

闪迪新专利（US 12,430,274 B2）提出将搭载CMOS键合阵列的NAND闪存存储裸片堆叠在主计算裸片下方，主计算裸片可为AI加速器或GPU。与HBM DRAM共存于同一中介层，HBM负责低延迟高优先任务，NAND闪存承担大容量读写。单组HBF堆叠容量最高4TB，而HBM单堆仅32~64GB。宽通道互联降低传输延迟、硬件成本和功耗。该架构尚在专利阶段，量产面临功耗和制造成本挑战。

AI模型闪迪 NAND闪存 HBM 3D堆叠存储架构

推荐理由：闪迪把海量NAND闪存直接堆到GPU底下，单堆容量冲到4TB，比HBM大几十倍，延迟还低，存储瓶颈的新解法来了。

原文

06:54

@koltregaskes@koltregaskes

据传闻，GPT-5.6将在前端开发方面有显著提升，类似于Claude Design的Codex设计工具。5.6和5.6 Pro版本可能在下周四发布。同时，用户也在期待Sonnet 5和Gemini 3.5 Pro的更新。

AI模型 GPT-5.6 Sonnet 5 Gemini 3.5 Pro 前端开发编程助手

推荐理由：GPT-5.6据说前端开发更强了，还有5.6 Pro，下周四可能发布。

原文

03:49

@koltregaskes@koltregaskes

X用户koltregaskes分享的截图显示，ChatGPT在一段对话中回复需要更多时间进行检查，暗示GPT-5.6可能引入更严格的安全机制。目前OpenAI官方未对此消息确认。GPT-5.6是传闻中的下一代模型，但具体发布时间与功能细节仍未公布。

AI模型 GPT-5.6 OpenAI AI安全

推荐理由：OpenAI可能推出的GPT-5.6会增加安全检查，想提前了解变化可以看看这个讨论。

原文

03:49

@koltregaskes@koltregaskes

Anthropic正在准备更新Claude Mythos模型，版本可能从当前跳至5.1。升级到版本6的可能性较低，除非Sonnet和Opus也同步升级。目前尚不确定是否公开发布。

AI模型 Anthropic Claude Mythos 5.1 模型更新版本升级

推荐理由：Anthropic又在迭代模型了，这次可能是Mythos 5.1，跟Sonnet和Opus版本联动，不知道会不会公开。

原文

00:42

@koltregaskes@koltregaskes

78°

X用户koltregaskes发现字符串"claude-sonnet-5"出现在某个位置，暗示Anthropic可能即将发布新模型。Claude Sonnet系列是Anthropic的中端模型，上一代为Claude Sonnet 4（2024年发布）。本次发现意味着Sonnet 5可能已在内部测试或即将进入公开阶段。目前Anthropic尚未官方确认该模型的存在或发布时间线。

AI模型 Claude Sonnet 5 Anthropic 模型更新

推荐理由：有用户在X上扒到了Claude Sonnet 5的名字，说明Anthropic可能马上要出新模型了，关注Claude的朋友可以看看这个线索。

原文

6月21日

17:54

shao__meng@shao__meng

社交媒体上发起LLM对比投票，比较GLM-5.2和Gemini 3.5 Flash。投票结果倾向GLM-5.2，用户认为Gemini 3.5 Flash表现不佳。评论指出Google DeepMind自Gemini 3.0多模态发布后缺乏亮眼进展。讨论焦点集中在国产模型与Google模型的性能差距。

AI模型 GLM-5.2 Gemini 3.5 Flash Google DeepMind 模型对比推理模型

推荐理由：看看大家投票选GLM-5.2还是Gemini 3.5 Flash，很多人觉得Gemini近期的模型不太能打。

原文

15:25

@koltregaskes@koltregaskes

GLM-5.2 在 DeepSWE 编程基准上取得 44% 的得分，超过 Kimi-K2.7 Code，成为目前最强的开源模型。不过它的运行成本更高，且每次输出更多 tokens。与封闭模型相比，Claude Fable 5 以 70% 的得分领先，差距明显。

AI模型 GLM-5.2 Kimi-K2.7 DeepSWE 开源模型代码生成

推荐理由：智谱的 GLM-5.2 代码上刚赢了 Kimi 的 K2.7，但更贵输出也更多，离顶级闭源还有距离。

原文

15:18

AI Will@FinanceYF5

精选

Anthropic在2月完成新模型Mythos的训练。Mythos悄然改变了整个研发节奏。过去5个月AI能力跃升部分源于Mythos。领先模型正帮助训练下一代模型，该循环已启动。

AI模型 Mythos Anthropic 推理模型模型迭代

推荐理由：Anthropic悄悄练成了Mythos，据说它直接改变了研发节奏，领先模型开始帮训练下一代模型了。

原文

15:13

Guillermo Rauch@rauchg

GLM-5.2 是 zai_org 发布的新模型，在编码任务上表现极佳。网友 rauchg 在 X 上表示“几乎震惊”，认为这改变了局面。该推文获得 127 赞和 25 次分享。GLM-5.2 的编码能力被认为堪比顶级模型。

AI模型 GLM-5.2 zai_org 编程助手编码

推荐理由：zai_org 的 GLM-5.2 在编码上强到让人震惊，跟之前版本比进步很大，值得试试。

原文

07:12

marktechpost@Asif Razzaq

精选

Cisco Foundation AI开源FAPO，由Claude Code驱动，自动优化多步骤LLM流水线。FAPO评估整个链条，在步骤级别归因失败原因，并提出提示、参数和链结构层面的变体。在18个模型-基准对比中，FAPO击败GEPA 15次。每个变体经独立审批评证后集成到优化循环中。

AI模型 FAPO Claude Code Cisco 提示优化流水线

推荐理由：Cisco开源了FAPO，能自动修多步LLM管线的提示，比GEPA强在15/18个测试里，想搞提示优化的快去试试。

原文

05:58

marktechpost@Michal Sutter

Nous Research为其开源智能体框架Hermes Agent新增了Blank Slate模式。该模式默认仅启用provider、model、File Operations和Terminal四项基础功能。用户通过platform_toolsets.cli和disabled_toolsets命令行接口手动添加其他工具集，实现从零开始配置。这种设计避免了预装过多工具，提升了Agent的灵活性和可控性。

AI模型 Hermes Agent Nous Research 智能体工具集开源模型

推荐理由：想精细控制Agent工具？Nous Research给Hermes Agent加了Blank Slate模式，从零选工具，不预装一堆，清爽又可控。

原文

03:54

Suhail@Suhail

精选

Z.ai推出GLM-5.2开源模型，采用MIT开放权重。该模型支持1M上下文窗口，在Terminal-Bench 2.1基准上得分81.0，仅比Claude Opus 4.8低几分。Perplexity CEO此前指出，中国已拥有最强开源模型DeepSeek，且美国开发者正基于其构建应用。GLM-5.2的发布进一步表明开源AI竞赛已非理论。

AI模型 GLM-5.2 Z.ai DeepSeek 开源模型推理模型

推荐理由：Z.ai刚刚放出了GLM-5.2，MIT开源、100万上下文、跑分81.0，跟Claude Opus 4.8差距很小，做开源模型的得看看。

原文

00:53

elvis@omarsar0

精选

GLM-5.2 在图形设计能力上据称达到 Opus 级别，同时在长期运行任务中表现良好。其训练引入了反奖励破解模块，用于解决强化学习中常见的奖励破解问题，例如模型走捷径、变懒、意图偏差等。该模块有助于提升编码代理在长周期任务中的可靠性与效果。GLM-5.2 是一个开源开放权重模型。

AI模型 GLM-5.2 奖励破解开源模型设计长期任务

推荐理由：GLM-5.2 据称设计和长任务都接近 Opus，关键是加了个反奖励破解机制，让模型更靠谱。

原文

6月20日

23:55

AK@_akhaliq

研究人员发布了S-Agent，一个通过空间工具使用来增强空间推理能力的模型。S-Agent在虚拟环境中学习操作和使用空间工具，如旋转、移动物体等，以解决空间任务。该方法在空间智能基准测试中展现了显著的推理能力提升。

AI模型 S-Agent 推理模型空间智能智能体

推荐理由：S-Agent教AI通过操作空间工具来推理空间关系，跟传统只靠视觉的模型不一样，值得关注。

原文

19:56

量子位@听雨

由三位00后开发者耗时两个月打造的流式音视频社交模型，在推理速度上达到SOTA水平。相比谷歌的Veo 3，其速度提升7倍，成本降低至1/2000。模型支持实时音视频交互，适用于社交场景。

AI模型 Veo 3 流式模型音视频社交 SOTA

推荐理由：三个00后做的音视频社交模型，速度比谷歌Veo 3快7倍，成本低到吓人，适合实时互动场景。

原文

17:42

17:42IT之家（博客/媒体）

74°

LM Studio 与苹果在 WWDC 2026 期间合作，用四台 Mac Studio 集群成功运行月之暗面万亿参数大模型 Kimi K2.6。Kimi K2.6 总参数达 1 万亿，采用 MoE 架构，激活参数 320 亿，支持长上下文、多模态输入和智能体任务。四台 Mac Studio 通过 Thunderbolt 5 RDMA 内存共享形成约 1.5TB 统一内存，实现模型推理。演示还展示 LM Link 功能，用户可从 MacBook Neo 或 iPhone 安全远程访问集群模型，数据保持本地处理。在类似配置下，模型生成速度约 28 tokens/s，功耗低于传统 GPU 集群。

AI模型 Kimi K2.6 LM Studio Mac Studio 本地部署推理模型

推荐理由：LM Studio 用四台 Mac Studio 跑起万亿参数的 Kimi K2.6，还能用 iPhone 远程调用，给消费级本地部署开了个好头。

原文

16:46

Pandaily@contact@pandaily.com (Pandaily)

智谱AI的GLM 5.2在Design Arena的HTML网页设计基准测试中超越Claude Fable 5，获得第一名。该模型在第三方库利用方面表现更优，同时具备成本优势。Design Arena基准专门评估AI生成HTML代码的设计质量和功能性。

AI模型 GLM 5.2 Claude Fable 5 Zhipu AI Design Arena 网页设计

推荐理由：智谱AI的GLM 5.2在网页设计上干掉了Claude Fable 5，库支持更好还更省钱。

原文

16:21

16:21IT之家（博客/媒体）

上海交通大学等机构在arXiv发布研究，提出BabelTele压缩方法。该方法将文本压缩至原大小的27.9%，仍保持99.5%的语义准确性。人类阅读压缩文本后问答准确率显著下降，但Gemini 3.1 Pro准确率稳定。在MeetingBank和QuALITY基准上，同等压缩率下BabelTele优于LLMLingua-2。多智能体通信测试中，减少约40%通信Token，任务完成度超过96%。

AI模型 BabelTele Gemini 3.1 Pro 文本压缩多智能体语义保留

推荐理由：上海交大团队搞了个BabelTele，AI之间能说人类看不懂的语言，压缩四分之三文本还差不多全对，省token神器。

原文

14:30

14:30IT之家（博客/媒体）

82°

OpenAI 预计下周发布 GPT-5.6 系列，涵盖 mini、标准版和 Pro 版。部分 Pro 订阅用户已可访问 GPT-5.6 Pro，输出质量提升明显。上下文窗口从 100 万 tokens 扩展至 150 万 tokens，优化了长周期编码和 Codex 响应速度。消息称在智能体编码工作中，GPT-5.6 已超越 Anthropic 的 Mythos 系列。定价方面，OpenAI 当前 token 价格约为 Anthropic 的一半，计划进一步降价。

AI模型 GPT-5.6 OpenAI Mythos Anthropic 智能体

推荐理由：OpenAI 要发 GPT-5.6 了，上下文拉到 150 万 tokens，编码能力还干翻了 Anthropic 的 Mythos，价格还更便宜，开发者可以关注一下。

原文

11:09

11:09IT之家（博客/媒体）

x86生态系统咨询小组（EAG）于2024年由英特尔和AMD联合成立，旨在统一x86架构演进。EAG近日发布ACE规范1.15版本，定义了一套针对AI计算的指令集，核心优化矩阵乘法运算和低精度数据格式处理。ACE支持INT8、FP16、BF16、FP8等多种数据格式，并引入图块寄存器（tile register）状态。AMD明确Zen 6将添加新AI数据类型支持，Zen 7配备新矩阵引擎与AI数据格式扩展。

AI模型英特尔 AMD ACE x86 AI算力

推荐理由：英特尔和AMD联手推出了ACE规范1.15，专门给x86芯片加AI加速指令，未来Zen 6和Zen 7都会用上，搞深度学习的朋友可以关注。

原文

10:54

shao__meng@shao__meng

GLM 5.2 开源后在 X 平台获得多位国外 AI 博主称赞。智谱港股股价近期飙升，市值已超过 MiniMax 并接近小米。作者提到智谱内部运营问题和自身充值体验，但认为模型够强仍是核心。

AI模型 GLM 5.2 智谱开源模型港股

推荐理由：智谱开源了 GLM 5.2，国外博主都在夸，股价还涨到快赶上小米了，模型实力真的能打。

原文

10:18

pandaily@contact@pandaily.com (Pandaily)

小米发布并开源了Miloco 2.0全屋AI系统，具备多模态感知能力，可识别用户行为和场景。该系统支持主动智能，能预测需求并执行持续任务，如自动调节灯光温度。Miloco 2.0拥有家庭记忆功能，可记住家庭成员的偏好和习惯。该系统被比作钢铁侠的JARVIS管家，面向中国家庭提供个性化服务。

AI模型小米 Miloco 2.0 智能家居多模态开源模型

推荐理由：小米开源了Miloco 2.0，一个像JARVIS一样有记忆能主动帮忙的智能家居AI，多模态和家庭记忆功能很实用。

原文

08:54

08:54IT之家（博客/媒体）

Anthropic 国际董事总经理 Chris Ciauri 在韩国首尔发布会上表示，有信心在未来几天内向美国之外地区重新开放 Claude Mythos 和 Claude Fable 5 模型。此前这两个模型因美国白宫安全指令被临时封锁访问权限。Anthropic 计划深化对韩投资，已组建商业、技术、政策和运营团队，韩国是其全球第 12 大市场。其安全倡议 Project Glasswing 已有约 150 个合作伙伴，包括谷歌、英伟达、微软、苹果、三星电子等。

AI模型 Anthropic Mythos Fable 5 AI安全韩国

推荐理由：Anthropic 的最强模型 Mythos 和 Fable 5 很快要重新开放了，面向美国之外，韩国市场也在快速扩张。

原文

08:09

08:09IT之家（博客/媒体）

72°

智谱 GLM-5.2 在 Design Arena 单轮 HTML 网页设计评测中总分第一，超越 Claude Fable 5、Opus 4.6 等模型。相比前代 GLM 5.1，名次提升 5 位。推理价格为每百万 tokens 1.40/4.40 美元，低于 Fable 5 的 10/50 美元。GLM 5.2 在 91% 会话中使用 TailwindCSS，调用第三方库使胜率提升 6.0 个百分点。

AI模型 GLM-5.2 智谱 Claude Fable 5 Design Arena 网页设计

推荐理由：智谱的 GLM-5.2 刚登顶设计榜单，比 Claude Fable 5 便宜很多，还能用好第三方库，做网页设计的可以试试。

原文

06:57

marktechpost@Asif Razzaq

NVIDIA AI推出了SpatialClaw，这是一个无需训练的智能体。它通过编写Python代码在持久内核中执行，将代码作为动作接口。SpatialClaw能够组合多种感知工具，实现3D空间推理。这种设计免去了传统微调或训练步骤。

AI模型 SpatialClaw NVIDIA Python 智能体 3D空间推理

推荐理由：NVIDIA搞了个叫SpatialClaw的智能体，不用训练，直接用写Python代码的方式做3D空间推理，挺创新的。

原文

06:15

marktechpost@Asif Razzaq

VibeThinker-3B是一个3B参数的MIT许可证推理模型，基于Qwen2.5-Coder-3B构建。该模型采用Spectrum-to-Signal后训练流水线。在可验证基准上，它匹配了DeepSeek V3.2和Kimi K2.5的性能。

AI模型 VibeThinker-3B Qwen2.5-Coder-3B DeepSeek V3.2 Kimi K2.5 推理模型

推荐理由：3B参数就能比肩DeepSeek V3.2和Kimi K2.5，基于Qwen2.5-Coder-3B开源，适合资源受限场景的推理任务。

原文

05:55

Browser Use@browser_use

GLM 5.2 在 BrowserCode 基准上达到接近 Opus 级别分数，单次任务成本仅 0.18 美元。Minimax M3 取得 Sonnet 级别分数，输入价格 0.30 美元，比 DeepSeek V4 Pro 更便宜。Kimi k2.7 相比 k2.6 提升 9%，但被 M3 超越。这些开源权重模型首次在浏览器智能体任务中追平甚至超过 GPT 5.5 等闭源模型。

AI模型 GLM 5.2 Minimax M3 Kimi k2.7 BrowserCode 智能体

推荐理由：智谱发了 GLM 5.2，Benchmark 接近 Opus，成本才一毛八，还有更便宜的 M3 和升级的 Kimi 2.7，做浏览器智能体有得选了。

原文

03:55

Nous Research@NousResearch

NousResearch 在推文中表示，Hermes Agent 模型当前表现优秀。

AI模型 Hermes Agent NousResearch 智能体

推荐理由：NousResearch 说他们的 Hermes Agent 现在很强，可以看看。

原文

03:50

Nous Research@NousResearch

NousResearch 在其 Hermes Agent 中引入了异步子代理功能。主代理可无需等待子代理完成即可继续工作。该功能提升了多代理协作的效率。

AI模型 Hermes Agent NousResearch 智能体异步多代理协作

推荐理由：Hermes Agent 现在支持异步子代理了，主代理不用干等子任务结束，能同时干多件事，效率提升很明显。

原文

03:05

Together AI@togethercompute

精选

MiniMax-M3 模型支持智能体携带长历史（超过百万token）、图像、视频、文档和工具输出进入上下文，显著提升多模态信息处理能力。Together 的推理优化通过改进服务路径上的 token 吞吐量，使这一能力在大规模部署时更实用。相比之前方案，每 GPU 可处理更多 token，从而降低每美元自动化工作成本。

AI模型 MiniMax-M3 Together 智能体多模态推理优化

推荐理由：MiniMax-M3 让智能体一口气带进长历史、图、视频、文档和工具输出，Together 优化后每 GPU token 翻倍，自动任务成本更低。

原文

03:05

Together AI@togethercompute

88°

OpenAI 的 GPT Image 2 模型现已在 Together AI 的 Serverless Inference 服务中上线。开发者可通过该接口将图像生成与编辑功能集成到多模态应用中。模型支持精准布局控制、可读文本生成以及参考图像引导生成。Together AI 提供无服务器推理能力，无需管理基础设施即可调用。

AI模型 GPT Image 2 OpenAI Together AI 图像生成多模态

推荐理由：OpenAI 的新图像模型 GPT Image 2 现在能用 Together AI 的无服务器接口调用了，做多模态应用时直接用它生成和编辑图片，支持布局和文字控制，挺方便。

原文