全部 AI 动态 · AI 热点

6月18日

08:15

08:15Simon Willison’s Weblog（博客/媒体）

精选73°

中国AI实验室Z.ai于6月16日开源GLM-5.2，采用MIT许可证。该模型753B参数、40激活参数（MoE），上下文窗口从GLM-5.1的20万提升至100万。在Artificial Analysis Intelligence Index v4.1上以51分领先MiniMax-M3（44）和DeepSeek V4 Pro（44）。在Code Arena WebDev前端编码排行榜上排名第二，仅次于Claude Fable 5。OpenRouter上输入价格$1.40/百万token，输出$4.40/百万token。

推荐理由：Z.ai开源了GLM-5.2，纯文本模型在智能和编码基准上超过DeepSeek V4和Kimi K2.6，价格只有GPT-5.5的五分之一。

原文

04:41

04:41OpenAI Blog（博客/媒体）

OpenAI 发布了 LifeSciBench，这是一个由 10 位生命科学专家编写并经过独立审查的基准测试。该基准包含 30 个任务，覆盖文献综述、实验设计、数据分析等真实研究场景。初步测试显示，GPT-4o 在多数任务上优于其他模型，但所有模型在需要跨领域推理的任务中表现仍有显著差距。LifeSciBench 旨在为 AI 在科学领域的可靠性和安全性提供更严格的评估工具。

AI模型 OpenAI LifeSciBench 基准测试 AI安全科学推理

推荐理由：OpenAI 出了个新基准 LifeSciBench，专门测 AI 做生命科学研究的能力，比一般问答难多了，能看出模型哪里不行。

原文

01:55

Decoder@Jonathan Kemper

精选

智谱AI推出开源模型GLM-5.2，采用MIT许可证，支持稳定100万token上下文。在FrontierSWE编码基准测试中，GLM-5.2以1个百分点之差落后于Anthropic的Claude Opus 4.8。该模型在推理能力上仍显著落后于闭源竞争对手。

AI模型 GLM-5.2 智谱AI Claude Opus 开源模型编码助手

推荐理由：智谱AI的GLM-5.2在长时间编码任务上只比Claude Opus 4.8差1%，还是开源免费，码农可以试试。

原文

01:30

marktechpost@Asif Razzaq

Vercel 开源了 Eve，这是一个 Apache-2.0 许可的 AI Agent 框架，目前处于公开预览阶段。每个 Agent 被定义为一个包含配置和能力的文件目录，内置了持久化执行、沙箱、审批、连接、通道和评估功能。开发者可使用 npx eve@latest init 快速搭建项目，并通过 vercel deploy 直接部署无需修改。

AI模型 Eve Vercel 智能体开源模型编程助手

推荐理由：Vercel 出了个开源 Agent 框架 Eve，把 Agent 做成文件目录，自带沙箱和评估，用 npx init 就能部署，挺省事的。

原文

00:36

量子位@一水

某国产模型在多项关键医疗测评中超过GPT-5.5。这些测评覆盖多个专科方向，准确率指标领先。这表明国产医疗AI在核心性能上已实现突破。

AI模型 GPT-5.5 医疗AI 基准测试国产模型

推荐理由：国产医疗AI终于打败GPT-5.5了，评测成绩很能打，值得关心AI落地的人看一看。

原文

6月17日

23:33

marktechpost@Asif Razzaq

精选

MiniMax 发布 Sparse Attention (MSA) 机制，基于 Grouped Query Attention (GQA) 架构。MSA 包含一个轻量级索引分支，为每个查询和 GQA 组选择 Top-k 键值块；主分支仅关注这些块。在 1M 上下文长度下，每个 token 的注意力计算量减少 28.4 倍。该机制训练在 109B 参数的 MoE 模型上，使用 3T token 预算，下游基准测试中与 GQA 性能相当。

AI模型 MiniMax MSA 稀疏注意力长上下文

推荐理由：MiniMax 搞了个新稀疏注意力 MSA，1M 上下文计算量降 28 倍，准度却一点没掉，适合长文本场景。

原文

23:30

Decoder@Maximilian Schreiner

73°

Nvidia、卡内基梅隆大学和UC Berkeley的研究人员使用AI编码智能体（coding agents）训练机器人自主完成灵巧抓取任务。项目部署了8台机器人，在真实世界中执行复杂抓取，成功率高达99%。该研究展示了AI智能体在机器人技能自我提升中的潜力。

AI模型 Nvidia AI编码智能体机器人灵巧抓取

推荐理由：Nvidia和大学团队让8台机器人用AI编码智能体自己练抓取，成功率冲到99%，比手写代码更灵活。

原文

13:58

marktechpost@Michal Sutter

精选

OpenAI于2026年6月16日推出Deployment Simulation方法，通过回放历史对话让新候选模型生成完成并评分，以估计部署时不良行为率。该方法报告了1.5倍中位数乘法误差，将预部署风险评估扩展至智能体编码场景。文章还讨论了该方法的局限性，如无法覆盖所有风险类型。

AI模型 OpenAI Deployment Simulation AI安全风险评估

推荐理由：OpenAI搞了个新方法，用历史对话模拟测试模型，能估算不良行为率，误差才1.5倍，做AI安全评估的朋友可以看看。

原文

13:40

量子位@量子位的朋友们

昆仑万维推出天工3.1版本，新增Skywork Design画布功能和Dynamic Workflows工作流系统。Skywork Design让AI能自由生成和编辑可视化界面，Dynamic Workflows支持多智能体协作执行复杂任务。据官方数据，天工超级智能体收入实现三倍增长。

AI模型天工3.1 Skywork Design Dynamic Workflows 智能体工作流

推荐理由：天工3.1给了两个新工具：一个让AI画界面，一个让AI组团干活。收入涨了三倍，可以试试。

原文

12:43

12:43IT之家（博客/媒体）

xAI 于 6 月 17 日正式上线 Grok Imagine Video 1.5 模型，此前该模型于 6 月 3 日推出预览版。相比前代，模型升级了音画同步，可同时生成音效、环境音和对话，口型同步更自然。运动连贯性提升，减少了肢体扭曲和漂浮假象，能更好模拟重量与动量。在 Fast 模式下，生成 6 秒 720p 视频仅需约 25 秒，而前代需要 40 秒以上，现已通过 xAI API 提供。

AI模型 Grok Imagine Video 1.5 xAI 视频生成

推荐理由：xAI 刚上线的 Grok Imagine Video 1.5，6 秒 720P 视频生成只要 25 秒，音画同步和运动真实感比前代强不少，做短视频挺合适。

原文

11:40

11:40IT之家（博客/媒体）

大晓机器人联合香港中文大学发布并开源具身操作VLA模型ACE-Ego。在RoboCasa GR1 TableTop基准上，ACE-Ego以72.8%平均成功率刷新纪录，超越英伟达GR00T、PI π₀.₅等模型。在RoboTwin 2.0高难度双臂操作测试中，ACE-Ego成功率90.62%。该模型已能稳定完成塑料袋打包、鞋子装入鞋盒等零售操作。

AI模型 ACE-Ego 大晓机器人人形机器人具身智能开源模型

推荐理由：大晓机器人开源了新模型ACE-Ego，在人形机器人操作基准上拿了第一，能打包塑料袋、装鞋盒，挺实用的。

原文

11:36

量子位@十三

智谱AI于2026年6月开源了GLM-5.2模型，支持1M上下文长度。该模型在AI编程评测基准上取得第一，超过此前领先的Fable-5。基于GLM架构的持续优化，GLM-5.2在代码生成任务中展现出更强能力。开源版本已发布在GitHub。

AI模型 GLM-5.2 智谱编程助手开源模型长上下文

推荐理由：智谱开源了GLM-5.2，1M超长上下文，编程能力直接拿下第一，想换编程模型的话可以试试。

原文

10:10

pandaily@contact@pandaily.com (Pandaily)

73°

阿里巴巴发布了Qwen-Robot系列，这是其首个具身AI模型系列，涵盖导航、操作和世界建模三个领域。该系列可部署在Unitree Go2四足机器人上，仅需一个摄像头就能运行。Qwen-Robot模型旨在让机器人更智能地感知和交互物理世界。

AI模型 Qwen-Robot 阿里 Unitree Go2 具身AI 机器人

推荐理由：阿里给机器狗装上了AI大脑，单摄像头就能导航干活，Qwen-Robot系列挺实用。

原文

09:27

09:27IT之家（博客/媒体）

精选

智谱发布并开源 GLM-5.2 模型，支持 1M 无损上下文。在 Code Arena 盲测中取得全球可用模型第一。在多个长程任务基准上表现介于 Claude Opus 4.7 与 4.8 之间。编程基准上保持开源 SOTA，与 Claude Opus 4.8 可比。已适配华为昇腾、平头哥等国产算力平台，单位 token FLOPs 降至 2.9 倍。

AI模型 GLM-5.2 智谱 Code Arena 开源模型上下文长度

推荐理由：智谱的 GLM-5.2 开源了，1M 上下文还拿了 Code Arena 第一，编程和长任务都强，国产算力也能跑。

原文

07:25

07:25IT之家（博客/媒体）

83°

英伟达在MLPerf Training 6.0七项基准测试中全部夺魁，Blackwell平台成为唯一全覆盖的提交系统。全新GB300 NVL72相比GB200 NVL72同等规模带来1.6倍训练速度提升。CoreWeave使用基于Spectrum-X以太网的GB300 NVL72系统，在8192块GPU规模下将DeepSeek-V3 671B训练耗时缩短至2.02分钟。本次测试首次引入DeepSeek-V3 671B和GPT-OSS-20B两个MoE工作负载，刷新了大规模训练效率纪录。

AI模型 NVIDIA Blackwell DeepSeek-V3 MLPerf 训练基准

推荐理由：英伟达Blackwell平台在MLPerf上把DeepSeek-V3 671B训练时间压到2分钟，比上代快60%，性能真狠。

原文

00:55

marktechpost@Asif Razzaq

精选73°

Qwen团队推出Qwen-RobotSuite，包含三个具身AI模型。RobotManip是基于Qwen3.5-4B的视觉-语言-动作模型，用于操作任务。RobotWorld是一个60层MMDiT架构的语言条件视频世界模型。RobotNav是基于Qwen3-VL的导航模型，提供2B、4B和8B三种参数量。

AI模型 Qwen-RobotSuite RobotManip RobotWorld RobotNav 具身AI

推荐理由：一口气发了三个模型，从操作到导航都管了，全用自家Qwen3.5和Qwen3-VL，做机器人研究的可以看看。

原文

6月16日

22:10

量子位@允中

一种新模型使机器人实现手脚腰身全身协同，完成精细操作。该模型在仿真环境中提升任务成功率，真实机器人上验证了效果。手部动作问题根源在于全身协调，而非单关节。

AI模型机器人控制全身协同精细操作控制模型

推荐理由：这个模型让机器人能全身配合做精细活，手的问题原来在腰身协调，挺有意思的新思路。

原文

19:46

Decoder@Jonathan Kemper

爱沙尼亚语言研究所发布了一项基准测试，用于评估AI语言模型对俄语宣传的抵抗力。测试涵盖了GPT-4o、Claude 3.5 Sonnet、Llama 3.1等8个模型，发现部分模型在30%的测试样本中会生成亲俄内容。Meta的Llama 3.1 70B表现最差，错误生成率高达42%；而OpenAI的GPT-4o错误率最低，仅为12%。该基准测试还包含一个包含1000个样本的俄语宣传语料库，用于衡量模型对政治操纵的脆弱性。

AI模型 GPT-4o Claude 3.5 Sonnet Llama 3.1 AI安全基准测试

推荐理由：想知道你用的AI会不会被俄语宣传带跑偏？爱沙尼亚语言研究所测了8个主流模型，GPT-4o最扛打，Llama 3.1中招率最高。看看你的AI排第几。

原文

15:49

15:49IT之家（博客/媒体）

精选

OpenRouter于6月14日发布Fusion API复合AI模型，通过并行调用多个模型并汇总结果实现协同回答。基准测试中，Claude Opus 4.8+GPT-5.5+Gemini 3.1 Pro组合得分68.3%，超过Claude Fable 5的65.3%。而Gemini 3 Flash+Kimi K2.6+DeepSeek V4 Pro组合以约一半成本实现64.7%的得分，差距不到1%。该服务分为并行请求、审查模型分析、调用模型生成最终答复三个步骤。

AI模型 OpenRouter Fusion Claude Fable 5 多模型协同推理模型

推荐理由：OpenRouter用多个便宜模型拼出顶级效果，成本砍半但性能追上Claude Fable 5，预算有限又想用好模型可以试试。

原文

14:55

量子位@量子位的朋友们

阿里发布Qwen-Robot系列，包含Qwen-Robot-V1、Qwen-Robot-V1-Pro和Qwen-Robot-V1-Plus三款模型。该系列将视觉、语言与行动能力整合，支持在复杂环境中完成抓取、导航等任务。在RoboBench基准上，Qwen-Robot-V1-Pro任务成功率较基线提升15.3%。模型参数规模从7B到72B不等，可适配不同硬件平台。

AI模型 Qwen-Robot 阿里具身大模型机器人开源模型

推荐理由：阿里刚出的Qwen-Robot系列，三个模型从7B到72B，让机器人能边看边想边动，RoboBench成绩提升15%，搞具身智能的值得看看。

原文

12:25

12:25IT之家（博客/媒体）

谷歌 6 月 15 日更新 Android Bench 榜单，测评 AI 模型在安卓开发任务中的表现。OpenAI 的 GPT-5.5 以 74 分排名第一，GPT-5.4 以 72.4 分第二，谷歌 Gemini 3.1 Pro Preview 同分第三。谷歌自家 Gemini 3.5 Flash 仅得 63.7 分，排第六，且单次运行平均成本 147.1 美元，为榜单最贵。DeepSeek V4 Flash 得分 52.7 排第 12，成本仅 8.4 美元，Gemini 3.5 Flash 成本是其 17.5 倍。

AI模型 Android Bench Gemini 3.5 Flash GPT-5.5 DeepSeek V4 Flash 开发辅助

推荐理由：谷歌新榜单实测，Gemini 3.5 Flash 在安卓开发任务中得分低、成本高，性价比远不如 DeepSeek V4 Flash。

原文

12:23

12:23IT之家（博客/媒体）

阿里巴巴发布千问具身智能大模型 Qwen-Robot 系列，包含 VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 和世界模型 Qwen-RobotWorld。这三个模型分别为机器人提供灵巧的手、认路的脚和会思考的大脑，可单独部署也能协同运转。此前，Qwen3.7-Max 在 Arena 全球大模型盲测中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，位列国产模型第一。

AI模型 Qwen-Robot 阿里巴巴具身智能 Qwen-RobotManip 机器人

推荐理由：阿里推出了首个具身智能模型系列 Qwen-Robot，包含操作、移动和世界模型，为机器人打造通用底座。

原文

09:52

09:52IT之家（博客/媒体）

火山引擎于 6 月 15 日上线 Seedance 2.0 Mini 模型，官方称其生成速度快于 Seedance 2.0 Fast 约 2 倍，输出质量相当。定价方面，图生视频 0.023 元/千 tokens，视频生视频 0.014 元/千 tokens，720P 规格下单秒成本约 0.5 元，较标准版降低约一半。该模型主要面向电商内容、营销素材、UGC 创作等高频率生产场景。

AI模型 Seedance 2.0 Mini 字节跳动火山引擎视频生成性价比

推荐理由：字节跳动刚出的视频模型，成本只有上一代一半，速度还快两倍，电商和做UGC的可以试试批量出素材。

原文

09:46

09:46IT之家（博客/媒体）

AMD在COMPUTEX 2026宣布，Radeon RX 7000系列显卡通过INT8 AI加速全面适配FSR超分辨率4.1，质量与FP8版本持平。RX 6000系列因缺乏专用AI加速器，需利用传统流处理器单元优化，减少着色器周期占用难度大，发布时间推迟至明年初。FSR 4.1的开发流程使用Instinct MI显卡训练，Radeon PRO优化，并在数十万种PC配置中测试验证。

AI模型 FSR 4.1 RX 7000 RDNA 3 INT8 超分辨率

推荐理由：AMD确认了，RX 7000用INT8跑FSR 4.1画质不输FP8，RX 6000得等到明年。想玩新超分可以关注。

原文

09:37

AWS Machine Learning Blog@Aris Tsakpinis

精选

Google DeepMind 发布的 Gemma 4 开源权重模型系列现已在 Amazon Bedrock 上可用。该系列包含三个指令调优变体：Gemma 4 31B（密集架构）、26B-A4B（MoE 架构，每次激活 4B 参数）和 E2B。所有变体均支持内置推理、原生函数调用以及文本和图像多模态输入。模型基于 Apache 2.0 许可发布，旨在多种部署场景下实现每参数智能最大化。

AI模型 Gemma 4 Amazon Bedrock Google DeepMind 开源模型多模态

推荐理由：Google DeepMind 把最新的 Gemma 4 放到 AWS 上了，三种规格可选，带推理和图文理解，正好拿来玩开源项目。

原文

09:16

09:16IT之家（博客/媒体）

AMD "Zen 6" 微架构桌面级处理器 "Olympic Ridge" 据 X 平台爆料将集成 NPU 单元但取消核显。该处理器引入 CUDIMM 支持，可提升 DDR5 内存频率上限，仍无原生 USB4 控制器需外挂芯片。此举旨在平衡 AI PC 需求与芯片制造成本，与英特尔 "Nova Lake S" 正面竞争。AMD 此前 AM4 时期无核显处理器策略已获成功。

AI模型 AMD Zen 6 Olympic Ridge NPU 桌面处理器

推荐理由：AMD要在桌面处理器里加NPU，砍掉核显，看来是为了推AI PC和降成本，跟英特尔的新品对标。

原文

09:07

GitHub Blog@Natalie Guevara

GitHub发布了一个新的repository-level数据集，许可证为CC0-1.0，包含多语言开发者内容，涵盖README、issues和pull requests。该数据集旨在帮助研究人员和开发者训练或改进多语言AI模型。数据集中于2025年4月发布，可直接下载使用，无需额外申请。

AI模型 GitHub 多语言AI 开源数据集代码文档

推荐理由：GitHub新出的多语言数据集，免费开源，里面各种语言的README和讨论都有，做多语言AI模型训练正好用上。

原文

6月15日

23:15

23:15IT之家（博客/媒体）

78°

稀宇科技于6月12日开源了 MiniMax M3 模型权重，总参数428B，激活参数23B。M3 是首个从 Step 0 开始进行多模态混合训练的开源模型，支持百万上下文。发布两周后，M3 在 Artificial Analysis 综合智能指数排行榜上获得全球开源模型最高排名。模型输出速度已从30 TPS提升至约80 TPS，后续还将提速30-40%。在编码与智能体评测中达到行业顶尖水平，具备自主任务拆解、工具调用与多步推理能力。

AI模型 MiniMax M3 多模态开源模型百万上下文智能体

推荐理由：MiniMax 开源了原生多模态巨无霸 M3，428B参数、百万上下文，全球开源排名第一，还能自主拆任务调工具，速度从30飙到80 TPS。

原文

18:07

18:07IT之家（博客/媒体）

中国科学院深圳先进院李晴岚团队研发的“机器学习台风快速增强集成预报模型”已部署至国家气象中心、香港天文台，成为国内首个实现落地应用的24小时台风快速增强预报模型。该模型基于梯度提升树等四类机器学习算法，并构建“海陆比”“对称比”两个量化指标。针对2016-2020年北大西洋热带气旋快速增强过程模拟回报，该模型相比美国国家飓风中心最佳预报系统，命中率更高、误报率更低。

AI模型台风快速增强预报模型深圳先进院机器学习梯度提升树气象预报

推荐理由：这个预报模型比美国飓风中心的系统更准，用四个机器学习算法组合判断台风内核有没有变对称，24小时内预测台风会不会突然变强。国内气象局和香港天文台已经开始用啦。

原文

17:37

17:37IT之家（博客/媒体）

73°

理想汽车在Livis Day发布会宣布，第三季度ADS Max将推送全新马赫VLA，第四季度对齐特斯拉FSD V14能力。双马赫M100芯片算力达2560TOPS，模仿学习规模提升50%、强化学习提升15倍。自研马赫Mind-4系列包括Mind-Pro和Mind-Edge，其中Mind-Pro在IFEval、LongBench-v2、AIME26、BFCL-v4等基准中稳居第一梯队。Mind-Edge为端侧原生具身智能体，在车端本地完成感知、交互、控车，数据不上传。

AI模型理想汽车马赫VLA 马赫Mind-4 特斯拉FSD V14 自动驾驶

推荐理由：理想发布了马赫Mind-4系列模型，Mind-Pro在多个权威基准领先，Mind-Edge是端侧原生智能体，还要在Q4对标特斯拉FSD V14，自动驾驶的可以关注。

原文

17:36

17:36IT之家（博客/媒体）

精选

理想在 Livis Day 上宣布马赫 Mind-Pro 模型全面落地 L9。该模型在 IFEval 指令跟随、LongBench-v2 超长文本理解、AIME26 高阶数学推理、BFCL-v4 工具调用等基准上位列第一梯队。其 Token 生成速度、任务完成质量、成本、端到端响应时延达到可量产水平。模型采用多模态流式时序建模，能连续理解动态物理世界并自主决策。所有能力在车端本地完成，数据不上传。

AI模型马赫 Mind-Pro 理想 L9 多模态车载AI

推荐理由：理想把马赫 Mind-Pro 模型塞进 L9 了，指令跟随和推理稳居第一梯队，多模态本地跑还不传数据，车载 AI 这波挺实在。

原文

17:21

marktechpost@Asif Razzaq

精选

Flash-KMeans是一个开源的、IO感知的精确K-Means实现，使用Triton GPU内核，不改变Lloyd算法数学或做近似。其FlashAssign组件消除了距离矩阵的物化，Sort-Inverse Update消除了原子竞争。在NVIDIA H200上，它实现了17.9倍端到端加速，比cuML快33倍，比FAISS快200倍以上。该算法在大规模聚类任务中显著降低内存开销和计算延迟。

AI模型 Flash-KMeans FAISS cuML NVIDIA H200 Triton 聚类算法 GPU加速

推荐理由：开源Flash-KMeans在H200上比FAISS快200多倍，做精确k-means不近似，适合大规模数据聚类。

原文

16:13

量子位@思邈

Noiz AI联合香港科技大学和清华大学开源了一款音频生成大模型。该模型仅需4步推理即可生成高质量音频，在单张GPU上推理速度达到0.24秒。其高效架构显著降低了音频生成的计算门槛。开源代码和模型权重已在GitHub发布，支持多种音频生成任务。

AI模型音频生成开源模型 Noiz AI 快速推理

推荐理由：噪点AI和港科大、清华联手做了一个音频模型，4步生成只要0.24秒，比同类快很多，还开源了，想玩音频AI的可以试试。

原文

15:24

量子位@思邈

研究团队提出OrcaRouter，一种多模型路由方法。该方法通过动态选择多个小模型协作，在性能上反超了单一大型模型Fable 5。同时大幅降低了推理成本。OrcaRouter的实现验证了多模型集成可行且高效。

AI模型 OrcaRouter Fable 5 多模型路由推理效率

推荐理由：想低成本体验Fable 5级效果？OrcaRouter让一群小模型组队打架，结果更猛，值得一试。

原文

14:13

marktechpost@Michal Sutter

79°

Z.ai 于 2026 年 6 月 13 日发布 GLM-5.2，覆盖所有 GLM Coding Plan 层级。该模型支持 100 万 token 的可用上下文窗口，并提供 High 和 Max 两种思考努力级别。GLM-5.2 通过 Anthropic 兼容端点集成到 Claude Code、Cline 和 OpenClaw 等工具中。发布时未公布基准测试结果，MIT 开源权重预计下周发布。

AI模型 Z.ai GLM-5.2 长上下文推理模型开源模型

推荐理由：Z.ai 的 GLM-5.2 支持百万token上下文，还能选思考深度

原文

6月14日

21:58

Decoder@Jonathan Kemper

精选

Mirage由微软研究院与多所大学联合开发。它直接在潜在空间存储场景信息，而非基于像素的点云。该方法将计算时间和显存需求大幅降低，同时支持长镜头下的空间一致性。模型目前无法可靠追踪跨片段的移动物体。

AI模型 Mirage Microsoft Research 视频生成世界模型潜在空间

推荐理由：视频生成空间记忆新方案

原文

16:18

Pandaily@contact@pandaily.com (Pandaily)

72°

智谱AI宣布将GLM-5.2模型以MIT许可证开源，支持100万token上下文长度。此举直接回应美国针对Anthropic模型的出口限制。GLM-5.2在多项基准测试中表现优异，其开源策略旨在推动国内AI生态发展。

AI模型 GLM-5.2 Zhipu AI 开源模型长上下文 MIT许可证

推荐理由：智谱开源百万token模型

原文

11:57

11:57IT之家（博客/媒体）

精选

马斯克透露，特斯拉 AI6 芯片工程评审顺利，有望创下单块晶圆可用算力纪录。AI6 将应用于自动驾驶出租车、FSD、Optimus 机器人及太空数据中心。AI5 芯片已流片，计划 2027 年下半年量产，算力是 AI4 的 5 倍；AI6 性能在 AI5 基础上翻倍，预计 2028 年下半年投产。AI6 将采用 LPDDR6 内存和 SRAM 加速器，由三星 165 亿美元代工合作生产。AI6 将先用于 Optimus 机器人和训练集群，再下放至乘用车。

AI模型特斯拉 AI6 AI5 芯片自动驾驶

推荐理由：特斯拉 AI6 芯片算力翻倍，2028 年投产

原文

07:21

宝玉的分享@宝玉

文章指出 Claude Design 的核心能力在于模型能同时处理 UI/UX、数据结构、状态管理和交互逻辑，而非依赖 Harness 工具。Codex 目前缺乏类似产品，因为其模型在跨领域整合上存在差距。作者分析认为，Codex 需要提升模型对多模态和逻辑的协同处理能力，才能推出类似产品。

AI模型 Codex Claude Design 多模态 UI/UX 模型能力

推荐理由：分析 Codex 与 Claude Design 的差距

原文

01:21

Decoder@Jonathan Kemper

Count Anything 是首个能通过文本提示计数任意图像中物体的 AI 模型，在对比测试中将错误率降低 50%。该模型可处理从人群到显微镜下细胞样本等场景，但在极度密集物体和模糊术语上仍有困难。

AI模型 Count Anything 计数模型多模态图像分析

推荐理由：计数准确率翻倍

原文