VOL.2026.06.29·58 STORIES·AITOP DAILY

AITOP日报

二〇二六年六月二十九日 星期一DAILY · 每早八时
01

模型发布/更新

Model Releases
5

DeepSeek DSpark 推测解码框架将生成速度提升85%

X·KOLX:pandaily (@contact@pandaily.com (Pandaily))原文 ↗

DeepSeek 在获 70 亿美元融资后发布首篇论文,提出 DSpark 推测解码框架,在无需额外训练的情况下将大模型生成速度提升 85%。该框架通过轻量级草稿模型配合验证机制加速推理,在多个基准测试中达到与原始模型相当的质量。DSpark 支持即插即用,可适配现有 DeepSeek 系列模型,显著降低延迟。

02

产品发布/更新

Product
5

Anthropic 发布 Claude Tag,在 Slack 中 @ 即可派活

X·KOLX:宝玉 (@dotey)原文 ↗

Anthropic 上周推出 Claude Tag 的 beta 版,面向 Claude Team 和 Enterprise 用户。它允许用户在 Slack 频道中 @ Claude,后台自动拆解任务并回复结果。Andrej Karpathy 将其视为 LLM 交互的第三次重大重新设计(从网页到桌面 App 再到异步持久实体)。Gergely Orosz 指出核心不是 Slack,而是云端 AI 连接内部系统后开箱即用。他认为真正受益的是新员工、非工程师和不熟悉代码库的开发者,而集成难度是最大挑战。

RepoPrompt 社区版开源,作者被 OpenAI 招安

X·KOLX:宝玉 (@dotey)原文 ↗

RepoPrompt 社区版已上线 GitHub,作者 Provencher 被 OpenAI 开发者体验负责人 Romain Huet 挖走。该工具帮开发者从代码仓库中精选文件拼成 prompt,解决超 32K token 导致模型变笨的痛点。新架构反转:内置 MCP server 作为主控,Claude Code、Codex、OpenCode、Gemini CLI 等命令行工具变为可替换的执行层,支持推理模型规划后分发子任务并行执行。目前仅支持 macOS,可通过 Homebrew 安装(brew install --cask repoprompt-ce)。

全国首个开源鸿蒙机器人操作系统 M-Robots OS 完整捐献至开放原子

官方IT之家原文 ↗

深圳开鸿数字产业发展有限公司将 M-Robots OS 完整捐献至开放原子开源基金会,该系统是全国首个开源鸿蒙机器人操作系统。1.0 版本于 2025 年 4 月发布,2.0 版本于 2025 年 5 月发布。系统支持 20KB~XGB 灵活部署,中断响应时延≤1μs,本体间音视频时延低至 4ms,相比 Fast-DDS 降低 42%。同时兼容 ROS1/ROS2 等中间件,应用迁移成本降低 80%。

03

行业动态

Industry
5

监管前沿API模型而不监管开源AI是合理的

X·KOLX:Clement Delangue (@ClementDelangue)原文 ↗

Hugging Face CEO Clement Delangue认为,当前最危险的AI系统是闭源前沿API模型(如通过编程助手分发的LLM),它们由巨头秘密构建、完全黑箱、控制力集中且分发到数亿用户。而开源模型风险低几个数量级:易于分析、能力较弱、传播更可控,且保护者与攻击者平等获取。监管前沿API只需针对少数巨头,成本低且容易执行;监管开源则会伤害小企业、研究者、大学等群体,并降低透明度。

苹果因AI挤兑提前放弃2nm,2028年A22 Pro用1.4nm制程

官方IT之家原文 ↗

AI芯片需求爆发使台积电3nm产能接近饱和,每月17.5万片晶圆仍供不应求。苹果为避开AI企业对2nm的争夺,计划于2028年在A22 Pro芯片上转向1.4nm制程。台积电2nm晶圆每片约4.5万美元,成本高昂但苹果愿意承担。A19 Pro相比A18系列面积缩小10%且性能能效更优,A20 Pro封装尺寸预计与A19 Pro一致。苹果2025年iPhone出货超2.4亿部,仍无法抗衡AI企业的采购量。

04

论文研究

Research
3
05

技巧与观点

Tips & Takes
5

Brian Armstrong分享如何让AI支出减半而token用量持续增长

X·KOLX:Clement Delangue (@ClementDelangue)原文 ↗

Brian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到,通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7,91%的员工从未触及使用上限。通过改进缓存,LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半,同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。

在 Colab 搭建稳定 Fable 5 Traces 工作流:解析工具调用、审计数据与训练基线

X·KOLX:marktechpost (@Sana Hassan)原文 ↗

本教程基于 Hugging Face 的 Fable 5 Traces 数据集,在 Colab 中构建稳定工作流。手动解析合并的 JSONL 文件避免依赖问题,检查仓库文件并标准化工具调用。通过审计结构、脱敏密钥和可视化分布,导出安全的无 CoT 聊天数据集。最后使用纯 Python 的朴素贝叶斯模型在 traces 上训练基线,无需复杂框架。

58
今日事件
22
一手报道
16
新模型
28
信源
AITOP · 编辑系统自动生成