精选 AI 资讯 · AI 热点

6月25日

11:24

11:24IT之家（博客/媒体）

精选

交通运输部等六部门联合印发《人工智能+交通运输典型应用场景创新行动方案》，聚焦智能驾驶、智慧公路、智能铁路等十大方向。方案明确开展智能驾驶“端到端”大模型研发与测试，面向公路货运、园区运输、短途接驳等场景进行测评验证。同时提出利用多模态大模型提升公路全要素感知能力，实现拥堵分析、疏导策略自动生成和无感通行。方案还鼓励视觉大模型和智能机器人用于基础设施智能巡检，推动铁路装备自主健康管理。

行业交通运输部端到端智能驾驶大模型行业政策

推荐理由：官方发文推动AI+交通，重点搞智能驾驶端到端大模型和路网智能监测，想了解国家政策方向的可以看看。

原文

6月11日

16:06

pandaily@contact@pandaily.com (Pandaily)

精选

中国大语言模型公司在编程和办公效率领域取得了显著进展，这成为决定市场赢家的关键。文章分析了多家中国LLM厂商在代码生成、文档处理等实际应用场景中的表现，指出这些能力直接推动了商业化进程。随着模型在编码和办公任务上的性能提升，企业客户更倾向于采用这些工具来提高生产力。最终，能够在这两个领域提供卓越体验的公司将主导市场。

行业大模型编程助手办公效率商业化中国AI市场

推荐理由：对于关注中国AI市场的开发者和企业决策者，这篇文章揭示了编程和办公效率如何成为大模型商业化的核心战场，值得一读以把握行业趋势。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月6日

20:51

20:51IT之家（博客/媒体）

精选

OpenCV 团队正式发布 OpenCV 5，这是该计算机视觉库的重大现代化升级。新版本引入了基于图的 DNN 引擎，支持算子融合、广泛的 ONNX 算子（覆盖率从 23% 提升至 80%），并原生支持 Transformer、VLM 和 LLM 等大模型。此外，OpenCV 5 改进了 Python 集成、硬件加速层、3D 视觉功能，并弃用了传统 C API，使代码更紧凑。该库在 GitHub 拥有超 86,000 星，日安装量超百万次，此次更新旨在巩固其作为计算机视觉基础库的地位。

AI产品 OpenCV 计算机视觉 DNN引擎 ONNX 大模型

推荐理由：做计算机视觉、机器人或 AI 应用开发的团队，OpenCV 5 的 DNN 引擎和 ONNX 支持能直接提升模型部署效率，值得立即升级体验。

原文

6月3日

11:54

向阳乔木@vista8

精选72°

斯坦福大学研究团队发现，当模型规模足够大时，使用未过滤的Common Crawl数据训练效果反而优于经过清洗的数据。在15M小模型上，过滤数据全面领先；但在330M和1B模型上，未过滤数据在充分训练后超越了所有过滤版本。这表明大模型有足够参数空间将噪声与有用信息分离，颠覆了数据清洗越干净越好的传统认知。

论文大模型数据清洗 Common Crawl 斯坦福训练策略

推荐理由：这项研究挑战了数据清洗的行业惯例，做大模型训练的团队值得关注——或许可以省下大量清洗成本，直接喂原始数据。

原文

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

13:38

岚叔@lufzzliz

精选

本文揭示大模型在生成低频词汇（如冷门人名）时表现不佳，并非小bug，而是底层偏好高频表达所致。作者串联了“马嘉祺”事件、Anthropic tokenizer调整以及FaceMind团队的SLoW和Adam's Law研究，指出频率是大模型数据工程的关键变量。FaceMind早于大众关注低频token退化问题，将其写成论文并落地产品场景。文章还解释了为何prompt并非越多越好，以及高频同义表达更稳定。最后介绍了FaceMind的动态弹幕产品，暗示其可能应用于世界杯等场景。

AI模型大模型低频token FaceMind SLoW 数据工程

推荐理由：做AI应用或数据工程的团队，这篇把低频token退化讲透了——FaceMind的SLoW方法直接给出了解决方案，值得点开看看怎么从模型规律里建立产品差异。

原文

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

5月24日

19:05

rohanpaul_ai@rohanpaul_ai

精选70°

华为推出122.88TB AI SSD，采用Die-on-Board封装技术，将NAND芯片直接焊在电路板上，而非依赖三星400+层3D NAND。该方案通过提高板级密度实现高容量，但面临散热和信号问题。未来计划推出245TB版本。此举表明出口管制迫使创新转向封装而非芯片本身。

行业大模型存储华为出口管制封装技术

推荐理由：华为用封装技术绕过芯片限制

原文

17:01

marktechpost@Asif Razzaq

精选70°

微软研究院推出Webwright，一个终端原生的浏览器Agent框架，用可复用的Playwright脚本替代点击追踪式网页自动化。该框架仅用约1000行代码和三个模块的单Agent循环，在长程任务基准Odysseys上达到60.1%，远高于基础GPT-5.4的33.5%。在Online-Mind2Web上得分86.7%，是开源测试方案中AutoEval最高分。

AI模型 Agent MCP/工具开源/仓库大模型 GPT

推荐理由：微软开源了能跑60%的Web Agent框架

原文

16:25

Decoder@Jonathan Kemper

精选75°

来自马里兰大学、Google、Meta等机构的研究者使用AutoTTS框架，让Claude Code自主发现AI推理控制算法。该算法相比标准自一致性方法，在保持相同准确率的同时，计算量减少约70%。整个搜索过程仅花费40美元，耗时160分钟。

论文智能体推理模型大模型 AutoTTS Claude Code

推荐理由：AI自己设计算法，省钱又高效

原文

15:46

15:46IT之家（博客/媒体）

精选

中国科学院大连化学物理研究所与沈阳自动化研究所联合研制出智能透射电子显微镜“原眼一号”，实现“传样—成像—解析”全流程自主运行。该设备在催化剂分析中单日可处理200个样品，采集5000张图像，定量解析50万个颗粒。相比现有设备，图像获取速度提升约56倍，分析效率达人工的约300倍。两周数据量相当于传统电镜一年工作量。

AI产品智能体大模型原眼一号透射电镜

推荐理由：国产电镜效率提升300倍

原文

15:43

marktechpost@Asif Razzaq

精选70°

NVIDIA 发布 Gated DeltaNet-2，一种线性注意力层，将 Delta 规则中的擦除和写入操作解耦为通道级擦除门 b_t 和写入门 w_t。在 1.3B 参数、100B FineWeb-Edu 令牌训练下，它在语言建模、常识推理和长上下文检索任务上超越 Mamba-2、Gated DeltaNet、KDA 和 Mamba-3。最大提升出现在 RULER S-NIAH 和多键针检索基准上。

AI模型大模型推理模型 Mamba NVIDIA 线性注意力

推荐理由：NVIDIA 新线性注意力，解耦擦写门

原文

14:44

rohanpaul_ai@rohanpaul_ai

精选

有人用单张RTX 3060 12GB GPU和768GB二手Intel Optane持久内存运行了1万亿参数的Kimi K2.5模型，速度超过4 tokens/sec。Kimi K2.5是混合专家模型，总参数1T但每token仅激活32B。RTX 3060的12GB VRAM处理路由、注意力等延迟敏感部分，专家权重存储在Optane PMem中，192GB DDR4 ECC作为缓存。Optane PMem延迟比最佳NVMe SSD低很多，但比DRAM慢2-3倍。llama.cpp通过override-tensor标志调整张量放置，实现混合GPU/CPU推理。

AI模型 Kimi K2.5 混合专家模型推理模型开源/仓库大模型

推荐理由：用旧硬件跑万亿模型，省钱又酷

原文

13:52

rohanpaul_ai@rohanpaul_ai

精选75°

DeepSeek 通过 MoE、DSA 和 V4-Pro 的 CSA/HCA 技术，将 1M-token 单 token 推理 FLOPs 降至 V3.2 的 27%，KV 缓存降至 10%。其 Engram 研究线利用可扩展查找内存替代密集计算。Reuters 报道 V4-Pro 永久降价 75%，同时面临华为昇腾供应限制。这些举措旨在减少对 HBM 和高端 GPU 的依赖，使中国内存、加速器和系统适用于前沿 AI。

AI模型 DeepSeek MoE DSA 推理模型大模型

推荐理由：DeepSeek 用架构创新绕过硬件瓶颈

原文

5月20日

15:58

arXiv cs.AI@Zijun Jia, Yuanchang Ye, Sen Jia, Yiyao Qian, Haoning Wang, Baojie Chen, Diyin Tang, Jinsong Yu, Zhiyuan Wang

精选

BalanceRAG 提出了一种针对级联检索增强生成（RAG）系统的联合风险校准方法。传统级联RAG会先尝试仅用大模型回答，不确定时再启用RAG，但各阶段独立校准可能过于保守。BalanceRAG 将阈值对视为二维网格上的操作点，通过序贯图形测试识别安全操作点，实现系统级错误率控制。该方法支持多风险校准，能在保证风险水平的同时保留更多样本，减少不必要的检索调用。在多个开放域问答基准测试中，BalanceRAG 在满足预设风险水平的前提下，提高了覆盖率和正确样本接受数。

论文 RAG 风险校准级联系统问答大模型

推荐理由：做RAG系统优化的团队终于有了一个能精确控制风险与检索成本的校准工具——BalanceRAG 用联合阈值替代逐级保守校准，在保证准确率的同时减少不必要的检索调用，建议做问答系统的开发者点开看看。

原文

5月19日

14:39

arXiv cs.LG@Ruitao Liu, Xinyang Tian, Shuo Chen, Tingrui Zhang, Guang Yang, Alan Zhao, Wei Xu

精选

论文提出 RRFP（Runtime-Readiness-First Pipeline），一种基于任务就绪状态的流水线并行运行时系统。传统流水线并行依赖静态或自适应生成的调度顺序，当实际任务就绪状态与预设顺序不一致时，会导致阶段错位和空闲气泡。RRFP 将调度视为非绑定的提示顺序，优先执行已就绪的任务，结合消息驱动的异步通信和轻量级张量并行协调。在 128 GPU 上测试，RRFP 在纯语言和多模态任务上分别实现最高 1.77 倍和 2.77 倍加速，并优于现有外部系统。

论文流水线并行分布式训练大模型运行时优化 RRFP

推荐理由：大模型训练中流水线并行的空闲气泡问题一直困扰着分布式训练团队，RRFP 用就绪优先的思路直接提升 GPU 利用率，做大规模训练的工程师值得关注这个新方案。

原文

11:41

arXiv cs.AI@Tej Sanibh Ranade

精选72°

TRACE 是一种无需训练的推理时幻觉纠正算法，它通过分析大模型内部各层的候选轨迹，动态选择最合适的纠正方式（如标量反转、早期状态恢复或候选空间修正），而不是固定使用单一干预形式。实验覆盖 15 个模型、8 个模型家族和 3 个事实性基准，所有评估指标均有提升，平均 MC1 提高 12.26 点，MC2 提高 8.65 点，最高提升分别达 47.20 和 43.38 点。该方法无需标签、检索、预训练、微调或逐模型校准。

论文大模型幻觉纠正推理优化无需训练 TRACE

推荐理由：TRACE 解决了大模型幻觉纠正中“一刀切”干预的缺陷，做 LLM 推理优化或事实性研究的开发者可以直接在现有模型上试用，无需额外训练成本。

原文

10:06

arXiv cs.AI@Mingyang Rao, Kehua Feng, Zhihui Zhu, Jiangzhen Fu, Hao Yu, Keyan Ding, Huajun Chen

精选

大模型在理解化学反应图方面存在视觉缺陷和语义脱节两大瓶颈。ChemVA框架通过视觉锚点机制和语义对齐方法，将化学结构图转化为模型能理解的实体名称，显著提升理解能力。在OCRD-Bench基准测试中，ChemVA实现92%的结构识别准确率，并在9种不同大模型上平均提升约20个百分点，使开源模型在复杂化学推理任务上媲美闭源系统。

论文大模型化学推理视觉理解开源/仓库 ChemVA

推荐理由：做化学信息学或AI辅助药物研发的团队，终于有了让大模型真正看懂反应图的方法——开源框架可直接用，效果提升明显。

原文

5月15日

09:54

arXiv cs.AI@Paolo Mandica, Michał Brzozowski, Zuzanna Dubanowska, Neo Christopher Chung

精选

GPart 提出一种全新的参数高效微调方法，通过全局等距分区矩阵直接将低维可训练向量映射到模型全权重空间，完全去除了低秩瓶颈。与 LoRA 等现有方法不同，GPart 保持了映射的距离保持性（等距性），避免了优化景观扭曲问题。该方法仅需一个随机投影、一个超参数（维度 d）和 d+1 个存储值（向量加随机种子），极其简洁高效。实验表明，GPart 在自然语言理解、计算机视觉和数学推理任务上达到或超越现有 PEFT 方法的性能。这项工作为参数高效微调提供了更优雅的理论基础和实践路径。

论文参数高效微调 LoRA 等距映射 GPart 大模型

推荐理由：GPart 用极简设计解决了 LoRA 等方法的优化扭曲问题，做模型微调的研究者和工程师可以直接参考其理论框架，尤其适合追求极致参数效率的团队。

原文

5月13日

13:05

13:05IT之家（博客/媒体）

精选70°

面壁智能联合清华大学及 OpenBMB 开源社区发布 MiniCPM-V 4.6，参数规模 1.3B，仅需约 6GB 内存即可在端侧流畅运行。该模型在 Artificial Analysis 评测中以 13 分超越 Ministral 3 3B，整体能力接近 Qwen3.5-2B 级别。效率方面，基于 vLLM 框架的 Token 吞吐量是 Qwen3.5-0.8B 的 1.5 倍，计算 Token 消耗仅为后者的 2.5%。技术创新包括 LLaMA-UHD v4 架构，将图像编码计算量降低 55.8%，处理 3132×3132 高清图首字延迟仅 75.7 毫秒。模型已全面开源，支持 iOS、Android 和 HarmonyOS 等系统。

AI模型大模型多模态开源/仓库 MiniCPM-V 面壁智能

推荐理由：1.3B模型6G内存就能跑

原文

10:14

10:14IT之家（博客/媒体）

精选

苹果发布 Xcode 26.5，增强智能体编程能力。新功能包括编程智能体消息队列，允许开发者连续发送多条消息而无需等待回复，提升协作流畅度。智能体现在可以在任务描述不完整时主动提出澄清问题，避免执行偏差。此外，更新还支持新的 StoreKit Testing 计费方案。

AI产品编程助手 Agent 大模型 Xcode 苹果

推荐理由：Xcode 26.5 通过消息队列和主动澄清机制，显著提升 AI 编程智能体的交互效率和准确性，对使用苹果生态的开发者有实际帮助。

原文