全部 AI 动态 · AI 热点

6月25日

11:24

11:24IT之家（博客/媒体）

精选

交通运输部等六部门联合印发《人工智能+交通运输典型应用场景创新行动方案》，聚焦智能驾驶、智慧公路、智能铁路等十大方向。方案明确开展智能驾驶“端到端”大模型研发与测试，面向公路货运、园区运输、短途接驳等场景进行测评验证。同时提出利用多模态大模型提升公路全要素感知能力，实现拥堵分析、疏导策略自动生成和无感通行。方案还鼓励视觉大模型和智能机器人用于基础设施智能巡检，推动铁路装备自主健康管理。

行业交通运输部端到端智能驾驶大模型行业政策

推荐理由：官方发文推动AI+交通，重点搞智能驾驶端到端大模型和路网智能监测，想了解国家政策方向的可以看看。

原文

6月24日

13:24

13:24IT之家（博客/媒体）

73°

华为宣布在WAIC 2026（7月17日-20日）首次展出业界最大规模超节点Atlas 950 SuperPoD真机，该产品以单柜64卡为基本单元，最大支持8192张NPU卡高速互联。同时展出的还有Atlas 850E风冷超节点真机，采用升级的VCE散热技术，为Agentic推理提供高吞吐低时延体验。展区将展示昇腾AI基础软件开源开放，并集中呈现11大行业解决方案，覆盖互联网、运营商等领域。

AI产品华为 Atlas 950 SuperPoD 超节点 AI训练大模型

推荐理由：华为这次展出业界最大规模的Atlas 950 SuperPoD真机，单柜64卡、最高8192卡互联，专为万亿参数大模型训练打造，效率比传统集群大幅提升。

原文

6月17日

00:59

李继刚@lijigang_com

作者认为C-c & C-v（复制粘贴）的场景切换是日常摩擦，消除它就有价值。他建议让大模型写插件或脚本自动化处理。例如，他用macOS自带的Notes，写了一个脚本：在任意地方复制内容，自动粘贴到指定笔记文件。每晚处理清空，第二天重新积累当天的复制内容。

技巧脚本自动化 macOS Notes 复制粘贴工作流大模型

推荐理由：别老觉得大模型只能聊天，让它帮你写个脚本，把复制粘贴自动化，省时省力。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月14日

19:25

19:25IT之家（博客/媒体）

小米新媒体高级工程师@小米_邹師傅发文称，过去一年国内大模型最让他兴奋的是行业开始靠作品说话，如开源代码放GitHub、论文挂arXiv、模型供开发者使用。他认为大模型的核心评委是开发者，而非媒体或榜单。他希望赛道永远比的是代码质量、推理速度和开源贡献，而非嗓门或预算。该工程师澄清个人观点不代表公司立场，并希望大模型赛道成为净土，减少研发人员心理负担。

行业小米大模型开源开发者

推荐理由：小米工程师呼吁技术回归本质

原文

6月12日

14:18

AI Will@FinanceYF5

TypeScript创始人Boris Cherny高度评价Fable 5，称其为自Opus 4.5以来最大的模型跨越。他指出，之前的Claude更像一个编码agent，而Fable 5已经进化为产品设计伙伴，具备判断力、品味和维度感。例如，在debug时，它会主动添加日志、验证修复，并确认问题真正解决后才宣布完成，而这些行为没有任何prompt要求。Cherny表示，这是第一次感受到“大模型的气息”，暗示模型开始展现出类似人类的主动性和性格。

AI模型 Fable 5 Claude 产品设计编码agent 大模型

推荐理由：做产品设计和开发的团队值得关注——Fable 5不再是简单的编码工具，而是能主动思考、有品味的协作伙伴，看完你会重新定义AI在项目中的角色。

原文

13:22

Z.ai (智谱国际)@Zai_org

智谱AI宣布将GLM-5.1和GLM-5-Turbo的“三倍用量”优惠期延长至6月30日。用户可在除美国东部时间凌晨2-6点外的任意时段使用。这一调整让开发者有更多时间以更低成本体验高性能模型，适合需要大模型推理和生成能力的团队。

AI产品智谱AI GLM-5.1 GLM-5-Turbo 优惠延长大模型

推荐理由：智谱延长三倍用量优惠，做AI应用开发的团队可以趁此机会低成本测试GLM-5系列模型，建议有需求的开发者抓紧使用。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

16:06

pandaily@contact@pandaily.com (Pandaily)

精选

中国大语言模型公司在编程和办公效率领域取得了显著进展，这成为决定市场赢家的关键。文章分析了多家中国LLM厂商在代码生成、文档处理等实际应用场景中的表现，指出这些能力直接推动了商业化进程。随着模型在编码和办公任务上的性能提升，企业客户更倾向于采用这些工具来提高生产力。最终，能够在这两个领域提供卓越体验的公司将主导市场。

行业大模型编程助手办公效率商业化中国AI市场

推荐理由：对于关注中国AI市场的开发者和企业决策者，这篇文章揭示了编程和办公效率如何成为大模型商业化的核心战场，值得一读以把握行业趋势。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

09:27

Simon Willison@simonw

83°

Simon Willison 分享了对 Claude Fable 5 的初步印象，称其具有“大模型气味”：运行缓慢、价格昂贵，但几乎能处理他抛出的所有任务。该模型在复杂推理和多步骤任务上表现出色，但高昂的成本和延迟可能限制其普及。Willison 认为，对于需要极致能力的专业用户来说，Fable 5 是值得的，但对普通开发者而言，性价比仍是问题。

AI模型 Claude Fable 5 大模型推理模型性能评测 Simon Willison

推荐理由：Claude Fable 5 的“大模型气味”揭示了当前顶尖模型的取舍——慢、贵但能力惊人。做复杂推理或高难度任务的开发者，值得看看 Willison 的实测感受，判断它是否值得你的预算。

原文

6月9日

20:09

Viking@vikingmute

小米发布了 MiMo-V2.5-Pro-UltraSpeed 模型，拥有 1T 参数，生成速度达到 1000 TPS。官方演示视频显示速度极快，引发关注。目前该模型开放试用申请，但用户对其实际质量存疑，因为小米此前在 AI 模型领域知名度不高。该模型在 HackerNews 上引起讨论，速度指标令人印象深刻，但最终效果仍需实测验证。

AI模型小米 MiMo 大模型推理速度 TPS

推荐理由：1T 参数模型跑出 1000 TPS 的生成速度，对追求低延迟推理的开发者来说是个值得关注的指标，建议申请试用实测质量。

原文

16:33

Pandaily@contact@pandaily.com (Pandaily)

UniSound 发布了其通用基础模型 U2，该模型以效率优先为特色，在保持竞争力的同时将 token 消耗降低了 25%。U2 的推出标志着 UniSound 正式进入中国大模型的第一梯队。该模型通过优化架构和训练策略，实现了更低的推理成本，对于需要大规模部署 LLM 的企业来说是一个重要进展。U2 的发布也反映了中国大模型领域从单纯追求参数规模转向注重实际应用效率的趋势。

AI模型 UniSound U2 大模型效率优化 token 节省

推荐理由：U2 的 25% token 节省直接降低了企业调用大模型的成本，做 AI 应用开发和模型部署的团队值得关注这个效率标杆。

原文

13:29

xiaomimimo@xiaomimimo

88°

小米与TileRT AI合作发布MiMo-V2.5-Pro-UltraSpeed，首次在1万亿参数模型上实现超过1000 tokens/s的输出速度。该突破仅使用单个标准8-GPGPU节点，无需Cerebras的晶圆级集成或Groq的纯片上SRAM芯片。技术细节已公开，并提供限时免费试用和API服务。这标志着大模型推理效率的重大飞跃，有望推动实时AI应用的普及。

AI产品小米 MiMo 推理加速大模型 GPU

推荐理由：大模型推理速度的里程碑——1T模型跑出1000+ tokens/s，做实时AI应用和推理优化的团队值得关注，可以直接申请试用体验。

原文

6月8日

12:27

rohanpaul_ai@rohanpaul_ai

来自斯坦福、MIT、哈佛和 Anthropic 的联合研究揭示了大型语言模型能学会小模型无法掌握的技能的根本原因：大模型在训练过程中更不容易遗忘稀有技能。其额外容量能保护弱学习信号，而小模型的有限神经元会被常见任务占据，导致稀有任务在学习信号出现足够多次之前就被覆盖。研究通过控制实验和 OLMo 模型（4M 到 4B 参数）验证了这一结论，发现大模型在低频任务上表现更好，能保留更多任务特征，且梯度干扰更小。该论文为模型规模与能力涌现之间的关系提供了清晰的训练层面解释。

论文大模型模型训练涌现能力稀有任务 scaling law

推荐理由：做模型训练或理解 scaling law 的团队值得一读——这篇论文把大模型涌现能力的机制讲清楚了，不是玄学而是容量与干扰的数学问题。

原文

09:50

pandaily@contact@pandaily.com (Pandaily)

每年高考不仅是学生的战场，也成为中国科技巨头展示AI实力的舞台。今年，腾讯、阿里、百度、字节跳动等公司纷纷用自家大模型挑战高考题目，比拼解题能力和准确率。这些公司通过公开测试或直播形式展示AI在语文、数学、英语等科目上的表现，旨在证明其模型在复杂推理和知识应用上的进步。此举不仅为品牌营销，也反映了AI在教育领域的应用潜力，引发公众对AI能否超越人类考生的讨论。

行业大模型高考教育AI 腾讯阿里百度字节跳动

推荐理由：高考AI比拼是检验大模型推理能力的绝佳场景，关注AI教育应用的开发者和教育从业者值得一看，看看哪家模型能真正“考”过人类。

原文

6月7日

13:14

13:14IT之家（博客/媒体）

2026年高考语文科目结束，小米集团总裁卢伟冰在微博上晒出由小米Mimo大模型撰写的北京卷作文《做规划与下功夫》。作文以程端礼的《读书分年日程》为引，探讨规划与努力的关系，并引用钱学森、王羲之等案例。卢伟冰还自曝自己高考语文考得不太好。此举展示了AI在写作领域的应用能力，引发对AI参与高考作文的讨论。

AI产品小米Mimo 大模型高考作文 AI写作卢伟冰

推荐理由：小米高管亲自用自家大模型写高考作文，既展示了Mimo的写作能力，又蹭了高考热点。对AI写作感兴趣的读者可以看看大模型如何理解并完成命题作文，顺便感受一下卢伟冰的幽默自嘲。

原文

6月6日

20:51

20:51IT之家（博客/媒体）

精选

OpenCV 团队正式发布 OpenCV 5，这是该计算机视觉库的重大现代化升级。新版本引入了基于图的 DNN 引擎，支持算子融合、广泛的 ONNX 算子（覆盖率从 23% 提升至 80%），并原生支持 Transformer、VLM 和 LLM 等大模型。此外，OpenCV 5 改进了 Python 集成、硬件加速层、3D 视觉功能，并弃用了传统 C API，使代码更紧凑。该库在 GitHub 拥有超 86,000 星，日安装量超百万次，此次更新旨在巩固其作为计算机视觉基础库的地位。

AI产品 OpenCV 计算机视觉 DNN引擎 ONNX 大模型

推荐理由：做计算机视觉、机器人或 AI 应用开发的团队，OpenCV 5 的 DNN 引擎和 ONNX 支持能直接提升模型部署效率，值得立即升级体验。

原文

6月5日

17:48

17:48IT之家（博客/媒体）

LG 集团计划引进 1 万块英伟达 Blackwell 架构 GPU，用于其人工智能转型计划，这是该集团有史以来最大规模的单次 GPU 采购。整体投资预计达数万亿韩元，涉及 LG 人工智能研究院、LG 电子和 LG U+ 等多个实体。此举旨在支持 EXAONE 大语言模型开发、人形机器人商业化及 AI 云服务。英伟达 CEO 黄仁勋今日会见了 LG 集团会长具光谟，暗示双方合作深化。

行业英伟达 Blackwell GPU LG AI 基础设施大模型

推荐理由：LG 大手笔采购 Blackwell GPU 表明 AI 基础设施投入进入新阶段，做模型训练或云服务的团队值得关注这一信号——算力军备竞赛正在加速。

原文

6月4日

15:49

pandaily@contact@pandaily.com (Pandaily)

DeepSeek 正在进行一轮约 500 亿人民币（约 69 亿美元）的融资，估值在 3500 亿至 4000 亿人民币之间（约 480-550 亿美元）。这标志着这家以成本高效大模型闻名的中国 AI 实验室首次大规模引入外部资本，此前它一直是最后一家没有外部融资的主要 AI 公司。该轮融资是 AI 历史上最大的私募融资之一，表明 DeepSeek 正从纯研究导向转向商业化，并开始探索消费者端变现。此举也反映了中国 AI 赛道资本竞争的加剧，以及投资者对高效模型商业前景的认可。

行业 DeepSeek 融资大模型商业化中国AI

推荐理由：DeepSeek 从「不融资」到「天价融资」的转变，意味着中国 AI 竞争进入新阶段——做模型的人要关注资本如何重塑技术路线，投资者则要评估 500 亿美元估值是否合理。建议点开看融资细节和商业化信号。

原文

13:48

13:48IT之家（博客/媒体）

6 月 16 日，中国信通院等将在北京召开“高质量 Token 服务研讨会”，首次发布公有云大模型 Token 服务性能测评结果。论坛将成立“高质量 Token 服务特别研究组”，启动“能力攀登计划”，并上线新版性能监测平台。测评将客观量化主流 Token 服务的吞吐率、时延等指标，为产业选型提供参考。同时将发布系列标准，为通过评估的单位颁发证书。截至 2026 年 3 月，我国日均 Token 调用量已达 140 万亿次以上，较 2024 年初增长千倍。

行业 Token 服务性能测评中国信通院大模型行业标准

推荐理由：Token 服务性能测评首次公开，做模型选型或部署的团队可以直接参考权威数据，避免踩坑。

原文

6月3日

20:04

pandaily@contact@pandaily.com (Pandaily)

智谱AI在5月28日股价盘中一度达到7000亿港元（约900亿美元）市值，但随后大幅回调。该公司2024年营收仅7亿元人民币（约9600万美元），对应估值高达750倍营收，引发市场对其生存压力的关注。智谱AI被视为中国版的Anthropic，专注于大模型研发，但高估值与低营收的对比凸显了AI初创公司面临的商业化挑战。此次IPO计划于2026年6月进行，市场对其能否持续增长存疑。

行业智谱AI 估值 IPO 大模型商业化

推荐理由：智谱AI的高估值与低营收对比揭示了AI泡沫风险，关注AI投资和创业的读者值得一读，了解中国大模型公司的生存现状。

原文

11:54

向阳乔木@vista8

精选72°

斯坦福大学研究团队发现，当模型规模足够大时，使用未过滤的Common Crawl数据训练效果反而优于经过清洗的数据。在15M小模型上，过滤数据全面领先；但在330M和1B模型上，未过滤数据在充分训练后超越了所有过滤版本。这表明大模型有足够参数空间将噪声与有用信息分离，颠覆了数据清洗越干净越好的传统认知。

论文大模型数据清洗 Common Crawl 斯坦福训练策略

推荐理由：这项研究挑战了数据清洗的行业惯例，做大模型训练的团队值得关注——或许可以省下大量清洗成本，直接喂原始数据。

原文

10:30

arXiv: DeepSeek@Baijun Ji, Zixuan Zhou, Xiangyu Duan, Yu Liu, Longbo Sun, Rupu Wei, Bohong Zhao

文档级机器翻译需要捕捉长距离的篇章依赖关系，现有方法缺乏对结构化篇章依赖的显式建模。本文提出 G^2C-MT，将上下文选择视为轻量级篇章图上的结构化路径发现问题，通过将段落表示为节点并建模语义相似度、邻接和关键词重叠关系，再使用深度偏置随机游走采样上下文路径，引导大模型翻译。该方法支持多路径采样，能聚合多样候选翻译以提升鲁棒性。实验表明，G^2C-MT 在 DeepSeek-V3、Gemini-2.5-Flash-lite 和 Qwen-2.5/3 系列等多个大模型上均优于强基线。

论文文档级翻译图引导上下文篇章建模大模型机器翻译

推荐理由：做文档翻译或长文本处理的团队终于有了不依赖昂贵 LLM 的上下文建模方案——G^2C-MT 用图结构替代暴力检索，翻译质量提升且成本可控，做 NLP 应用的建议点开看看方法细节。

原文

07:05

07:05IT之家（博客/媒体）

美国总统特朗普于6月3日签署行政令，推出AI企业自愿合作机制：前沿大模型在正式发布前，企业可自愿向联邦政府提交模型进行安全评估。该行政令旨在平衡技术创新与安全风险，避免繁重监管的同时，强化关键基础设施网络安全防护。新规将前置报备窗口期缩短至发布前30天，企业配合提交可享受保密保护。此举标志着特朗普政府从宽松放任转向适度监管，起因于Anthropic的Mythos模型自主排查出数千项高危系统漏洞。谷歌、微软与xAI已同意参与，行业机构也给予正面评价。

行业 AI安全政策监管特朗普大模型自愿评估

推荐理由：特朗普政府从「放任」转向「自愿安全评估」，做AI大模型的企业需要关注这个信号——提交模型可获保密保护，不提交也无强制压力，但安全漏洞风险正在倒逼监管。建议AI安全负责人和合规团队点开了解窗口期和参与机制。

原文

6月2日

12:06

arXiv: DeepSeek@Boao Kong, Weichen Jia, Engao Zhang, Guohong Li, Yonghan Dong, Yao Wang, Yaoyuan Wang, Yunke Peng, Kun Yuan

低精度训练在降低大模型训练成本的同时，常因少数算子的数值不稳定导致训练失败。论文提出GNMR（梯度范数与均值比）轻量控制器，通过比较当前梯度范数与历史均值，并结合Δ-GNMR检测短窗口内的突变，在固定预算和锁定间隔内执行恢复操作，无需改变数值格式或底层实现。在激活量化、DeepSeek式训练和LLaMA-2 13B微调等场景中，GNMR以稀疏的恢复动作保持高保真质量。该方法为低精度训练提供了一种后端无关的稳定性控制方案。

论文低精度训练训练稳定性 GNMR 大模型量化

推荐理由：低精度训练是降低大模型成本的关键，但数值不稳定常让训练白费。GNMR用轻量控制解决了这个痛点，做大规模训练或量化训练的团队值得关注，可以直接集成到现有流程中。

原文

11:08

arXiv cs.AI@Xiang Li, Jiwei Wei, Ke Liu, Yitong Qin, Jinyu Guo, Malu Zhang, Peng Wang, Yang Yang

eMoT 提出了一种名为“演化思维记忆”的新框架，将推理轨迹视为动态演化的记忆而非静态模板，以解决大模型在多步推理中的幻觉和数值计算问题。该框架包含三个核心模块：记忆腐蚀机制（强化高效用推理结构并衰减低频结构）、符号锚定引擎（利用 Python 进行确定性计算，类似人类使用计算器）以及一致性驱动精炼过程（对齐神经推理与符号结果，减少逻辑偏差）。在 Game of 24 任务上，eMoT 达到 100% 准确率，比基线提升 17.6%；在 GSM8K、ASDiv、SVAMP 和 MGSM 等数学推理基准上也有持续改进。即使使用轻量级模型，eMoT 也优于依赖大规模模型的方法，表明性能提升主要来自框架的推理控制而非模型规模。

论文推理模型记忆机制符号锚定数学推理大模型

推荐理由：eMoT 解决了大模型在多步推理中容易出错和产生幻觉的痛点，做推理增强或数学推理的开发者可以直接参考其记忆腐蚀和符号锚定机制，值得一试。

原文

6月1日

13:06

Gary Marcus@GaryMarcus

Gary Marcus在X上转发了他与Ernest Davis于2021年合著的文章观点，强调大规模预训练模型虽在近期AI和商业应用中占据重要地位，但仅靠这些技术不足以实现通用人工智能。他认为，当前研究策略聚焦于可解决的短期挑战，却忽视了更关键的需求：为可靠整合统计学习与推理、知识、常识及人类价值观奠定坚实基础。Marcus的言论再次引发对AI发展路径的讨论，提醒业界不要过度依赖大模型。

行业大模型通用AI Gary Marcus AI发展路径行业观点

推荐理由：Marcus的观点戳中了当前AI热潮中的核心争议，关注AI长期发展的研究者、从业者或投资者值得一读，看完会对大模型的局限性有更清醒的认识。

原文

5月30日

12:00

Google AI@GoogleAI

Google AI发布了一期《Release Notes》播客，邀请了Gemini模型的核心架构师Jeff Dean、Koray Kavukcuoglu、Oriol Vinyals和Noam Shazeer共同出镜。他们分享了从愿景到模型落地的幕后故事，探讨了如何持续推动AI前沿。这期节目为关注大模型研发的从业者提供了难得的第一手视角。

AI模型 Gemini Google AI 大模型架构师访谈前沿探索

推荐理由：Gemini核心团队首次集体出镜聊幕后，做大模型研发的从业者能从他们的思考中看到前沿方向，值得花时间听一听。

原文

5月29日

13:38

岚叔@lufzzliz

精选

本文揭示大模型在生成低频词汇（如冷门人名）时表现不佳，并非小bug，而是底层偏好高频表达所致。作者串联了“马嘉祺”事件、Anthropic tokenizer调整以及FaceMind团队的SLoW和Adam's Law研究，指出频率是大模型数据工程的关键变量。FaceMind早于大众关注低频token退化问题，将其写成论文并落地产品场景。文章还解释了为何prompt并非越多越好，以及高频同义表达更稳定。最后介绍了FaceMind的动态弹幕产品，暗示其可能应用于世界杯等场景。

AI模型大模型低频token FaceMind SLoW 数据工程

推荐理由：做AI应用或数据工程的团队，这篇把低频token退化讲透了——FaceMind的SLoW方法直接给出了解决方案，值得点开看看怎么从模型规律里建立产品差异。

原文

5月28日

19:56

19:56IT之家（博客/媒体）

科大讯飞在澳门 BEYOND Expo 2026 上推出 AI 眼镜，定位为“眼前的超级 AI 助理”，售价 4299 元，6 月 15 日开启预售。眼镜仅重 40 克，采用经典眼镜形态，通过 SGS 舒适度认证。核心功能是搭载端到端语音同传大模型，支持 122 种语言翻译，覆盖通话、线上同传、同声传译、面对面翻译、视觉翻译等六大场景。此外，还支持实时提词、AI 助理（GlassClaw）和会议纪要自动生成。产品将大模型能力融入日常佩戴，旨在解决跨语言沟通和演讲痛点。

AI产品 AI 眼镜科大讯飞语音翻译大模型智能助理

推荐理由：科大讯飞把大模型塞进 40 克眼镜里，解决了出国旅行、商务会议中语言不通的痛点，经常出差或做国际业务的用户可以直接关注。

原文

5月27日

11:12

歸藏(guizang.ai)@op7418

MiniMax 宣布即将发布新一代 M3 模型，并开源其 MSA 架构。这是 MiniMax 沉寂一段时间后的重要更新，M3 模型预计在性能上有显著提升。开源 MSA 架构将推动社区研究和应用发展。该消息在推特上引发关注，但具体细节尚未公布。

AI模型 MiniMax M3模型 MSA架构开源大模型

推荐理由：MiniMax 的 M3 模型和开源 MSA 架构值得关注，尤其是对开源大模型和架构研究感兴趣的开发者，可以提前了解并准备试用。

原文

5月26日

16:14

16:14IT之家（博客/媒体）

抖音在谣言治理中引入大模型技术，过去一年谣言被处置时的平均浏览量下降62%。平台推出“AI求真”功能，通过求真卡为用户提供真实信息，建立认知防线。抖音还盘点了十大辟谣案例，均由AI求真大模型识别或处置。该功能于去年9月上线，用户浏览易误解内容或搜索谣言时，可通过大模型获取完整信息。

AI产品大模型谣言治理 AI求真内容审核抖音

推荐理由：抖音用大模型把谣言处理效率提升了，做内容审核或平台运营的团队可以看看这套方案的实际效果，值得参考。

原文

5月25日

13:26

爱范儿@Selina

中国 AI 公司成功将 600 亿参数的大模型部署到手机上，突破了模型体积与移动端算力的瓶颈。这一进展依赖于国产框架、芯片和模型的闭环生态，实现了从方法论到硬件的完全自主。该技术让手机端运行超大模型成为可能，显著提升本地 AI 能力，减少对云端的依赖。关键细节包括模型压缩和推理优化技术，使得在有限内存和功耗下高效运行。这对移动 AI 应用和国产技术生态具有重要意义。

AI产品大模型手机部署国产技术模型压缩推理优化

推荐理由：手机端跑 600 亿参数模型不再是梦，做移动端 AI 应用或关注国产技术生态的开发者，值得关注这一突破，它可能改变未来手机 AI 的玩法。

原文

12:24

Yangyi@Yangyixxxx

从今年年初开始，由于大模型蒸馏技术的过度使用，AI模型出现了自言自语的现象。蒸馏是指用大型模型训练小型模型的过程，但频繁的蒸馏可能导致模型学习到一些无意义的内部对话模式。这种现象可能影响模型的输出质量和可靠性，引发对AI训练方法的反思。目前该问题已引起研究者的关注，需要进一步探索蒸馏的合理边界。

AI模型大模型蒸馏模型行为训练方法 AI自言自语

推荐理由：做模型蒸馏或训练AI的团队值得关注——过度蒸馏可能导致模型行为异常，影响实际部署效果，建议点开了解具体表现和潜在风险。

原文

5月24日

21:16

Decoder@Matthias Bastian

70°

DeepMind联合创始人Demis Hassabis认为人类已站在技术奇点的山脚，而Meta首席AI科学家Yann LeCun表示当前AI系统并非真正智能。Gemini联合负责人Oriol Vinyals则持中间立场，称七年前今天的模型会被视为AGI，但它们仍无法从经验中学习或产生真正突破。三位AI领域顶级专家在观点上存在显著分歧。

行业大模型 AI安全 DeepMind Meta

推荐理由：三位AI大佬对奇点和智能看法不一

原文

21:10

Gary Marcus@GaryMarcus

Gary Marcus 在 X 上发帖，将 LLM 公司与航空公司类比，指出两者都面临小利润、激烈竞争和高开支。他引用 Ross Atefi 的观点，强调无限需求并不保证经济吸引力。Marcus 认为 AI 行业的关键问题不是人们是否想要更多智能，而是提供商在芯片、数据中心、电力、冷却和竞争后能否保留足够现金。

行业大模型行业分析 Gary Marcus

推荐理由：Marcus 用航空公司比喻 LLM 行业

原文

19:22

19:22IT之家（博客/媒体）

一项提交至《天体物理学杂志》的研究指出，银河系中数量最多的亚海王星和超级地球内部构造可能不同于地球。当行星捕获的氢质量占比超过1%时，内部铁、硅酸盐与氢在4000开尔文以上高温下会融合成单一流体，而非形成独立金属内核。该理论可解释半径空隙现象，即超级地球与亚海王星之间行星数量稀少，以及行星半径与公转周期的关联。詹姆斯·韦伯太空望远镜和开普勒太空望远镜的观测数据支持这一模型，但模型基于极端环境下的性质推演，存在局限性。

论文大模型天体物理学系外行星亚海王星

推荐理由：颠覆你对行星构造的认知

原文

19:05

rohanpaul_ai@rohanpaul_ai

精选70°

华为推出122.88TB AI SSD，采用Die-on-Board封装技术，将NAND芯片直接焊在电路板上，而非依赖三星400+层3D NAND。该方案通过提高板级密度实现高容量，但面临散热和信号问题。未来计划推出245TB版本。此举表明出口管制迫使创新转向封装而非芯片本身。

行业大模型存储华为出口管制封装技术

推荐理由：华为用封装技术绕过芯片限制

原文

19:04

rohanpaul_ai@rohanpaul_ai

70°

《经济学人》报道，五大科技巨头今年将在AI基础设施上投入约8000亿美元，但利润表几乎未体现这些投资，因为折旧在资产建成后才开始。现金流表则直接显示资金已流出。这些公司的资本支出可能占其收入的40%，超过石油行业的页岩繁荣期和电信行业的互联网泡沫时期。

行业大模型 AI基础设施资本支出行业分析

推荐理由：看看AI烧钱有多猛

原文

18:22

Decoder@Matthias Bastian

数学家Adam Kucharski发现，当向Microsoft Copilot输入相同数据集但不同国家标签时，Copilot会编造不存在的国家差异，输出详细刻板印象而非准确结果。思考模型能识别这种把戏，但前提是用户知道何时使用它们。文章指出，在Copilot、Gemini等AI工具中保留默认模型选择可能导致错误结论，用户应主动选择适合任务的模型。

技巧大模型 AI安全 Copilot Gemini

推荐理由：别让AI默认模型坑了你

原文

18:07

18:07IT之家（博客/媒体）

长安第四代逸动蓝鲸超擎车型上市，共三款车，抢购价7.99-8.99万元。新车长宽高4785/1840/1460mm，轴距2765mm，内饰配备10.25英寸仪表和14.6英寸中控屏。全系标配内置DeepSeek的AI大模型语音系统，搭载天枢智慧座舱和天枢OS车机系统。配置方面，悦享型新增256色氛围灯、ACC自适应巡航等，智享型增加50W无线快充、全景天窗等。

AI产品大模型 DeepSeek 智能座舱车机系统

推荐理由：长安新车7.99万起，语音接入DeepSeek

原文

17:01

marktechpost@Asif Razzaq

精选70°

微软研究院推出Webwright，一个终端原生的浏览器Agent框架，用可复用的Playwright脚本替代点击追踪式网页自动化。该框架仅用约1000行代码和三个模块的单Agent循环，在长程任务基准Odysseys上达到60.1%，远高于基础GPT-5.4的33.5%。在Online-Mind2Web上得分86.7%，是开源测试方案中AutoEval最高分。

AI模型 Agent MCP/工具开源/仓库大模型 GPT

推荐理由：微软开源了能跑60%的Web Agent框架

原文