全部 AI 动态 · AI 热点

6月19日

19:18

AI Will@FinanceYF5

83°

杰夫·贝佐斯宣布成立新AI实验室Prometheus，专注物理世界工程。该实验室已筹集120亿美元，估值达410亿美元，贝佐斯为主要出资人。联合创始人Vik Bajaj曾任Google X总监。使命是构建能吸收物理世界数据的人工通用工程师，加速工程与制造。

推荐理由：贝佐斯砸120亿美元搞了个新实验室，不卷大语言模型，而是做物理世界AI工程师。有点意思。

原文

18:43

Together AI@togethercompute

Together AI 在推文中指出，当团队运行数十亿 tokens 时，缓存、吞吐量和服务效率的微小差异会转化为产品级的经济性。以 MiniMax M3 模型为例，该模型在 Together AI 平台上提供前沿品质和开放模型经济学，其服务栈专为规模化设计。这体现了开放模型在生产中的实际成本竞争力。

AI模型 MiniMax M3 Together AI 开放模型推理效率经济性

推荐理由：看看 Together AI 怎么用 MiniMax M3 把开放模型做大，跑几十亿 tokens 还省钱。不是吹概念，是实打实的缓存和吞吐量优化。

原文

18:42

Together AI@togethercompute

Together AI的James Zou与NVIDIA的Venkat Srinivasan将于7月1日在AI Engineer World's Fair上讨论开放模型如何实现集体智能。该活动聚焦开源模型在协作智能系统中的作用。演讲将结合两家公司的技术实践，分析开放模型对多智能体架构的影响。

行业 Together AI NVIDIA 开放模型 AI Engineer World's Fair

推荐理由：想了解开放模型怎么支撑多智能体协作？Together AI和NVIDIA的人要聊这个，7月1日别错过。

原文

18:41

Together AI@togethercompute

精选

AI模型 GLM-5.2 Zai_org Together AI 智能体长上下文

推荐理由：GLM-5.2 支持百万级上下文，还能控制推理深度，搞智能体编程和复杂工具链的可以试试。Together AI 上直接用。

原文

18:40

Together AI@togethercompute

TogetherAI用Kimi K2.7 Code和Claude Fable 5各生成12个落地页。Kimi的成本仅为Claude的1/16，质量表现接近。通过设计MCP服务器提供视觉上下文后，Kimi效果更佳。这表明开源模型在落地页生成工作流中已是高性价比的实用选择。

AI模型 Kimi K2.7 Code Claude Fable 5 开源模型 MCP/工具代码模型

推荐理由：想低预算做落地页？试试Kimi K2.7 Code，便宜16倍效果不输Claude Fable 5，尤其配合MCP服务器更稳。

原文

18:39

Together AI@togethercompute

Together Compute 测试了闭源和开源模型构建小型可玩游戏的能力。结果显示，开源模型成本更低、速度更快，生成游戏质量接近闭源模型。例如，Opus 4.8 成本是 MiniMax M3 的 15 倍，GPT-5.5 是 Nemotron Ultra 的 10 倍，而 Kimi K2.7 Code 比 Opus 4.8 便宜 7 倍。

AI模型 Opus 4.8 MiniMax M3 GPT-5.5 开源模型游戏生成

推荐理由：Together Compute 实测：闭源模型贵几倍，开源做小游戏又快又便宜，质量还接近，想省钱就选开源。

原文

18:38

Together AI@togethercompute

DecagonAI 通过与 Together AI 合作，将语音代理每轮对话成本降低近6倍，同时保持实时语音所需的低延迟。他们从闭源模型迁移到微调的开源模型，实现 p95 模型延迟低于400ms。采用自定义投机解码和提示缓存技术，并在 NVIDIA Blackwell 上优化服务部署。模型更新频率达到每周甚至每日，体现了从封闭 API 到开放模型的转变。

行业 DecagonAI Together AI NVIDIA Blackwell 语音代理开源模型

推荐理由：DecagonAI 把语音成本砍到原来的1/6，延迟还压到400ms以下，实时语音项目可以参考他们迁移开源模型的做法。

原文

18:37

Together AI@togethercompute

精选

Together AI分享了优化GLM 5.1推理性能的三项关键改进。他们重写了索引器的topk内核。接着融合了索引器内核以减少内存和启动开销。同时消除了限制预填充吞吐量的CPU开销。这些优化显著提升了GLM 5.1在Together AI平台上的运行效率。

AI模型 GLM 5.1 Together AI 推理优化内核重写

推荐理由：想知道Together AI怎么让GLM 5.1跑得更快？他们分享了三个工程优化点，对部署GLM 5.1有直接帮助。

原文

18:35

Together AI@togethercompute

Together AI 上线了 Cartesia Sonic 3.5 语音模型，为开发者提供超过150种语音。通过语音查找器，开发者可以试听和比较这些语音，为实时智能体挑选最合适的角色。选定后可直接在 Together AI 平台部署，简化开发流程。

AI模型 Cartesia Sonic 3.5 Together AI 语音模型实时语音智能体

推荐理由：Together AI 集成了 Cartesia Sonic 3.5，有150多种语音可选，做实时语音智能体可以试试这个新库。

原文

18:34

Together AI@togethercompute

Together AI 部署的 DeepSeek V4 Pro 在 Artificial Analysis 基准测试中同时获得输出速度和延迟两项第一。该成绩通过优化 KV 缓存、前缀复用、内核及端点配置实现。Together AI 公开了其推理系统的具体工程方案，包括缓存策略和内核调优。

AI模型 DeepSeek V4 Pro Together AI Artificial Analysis 推理优化性能基准

推荐理由：Together AI 把 DeepSeek V4 Pro 调到了速度与延迟双第一，还公开了优化方法，搞推理部署的值得看看。

原文

18:33

Together AI@togethercompute

精选

Kimi Moonshot 发布 Kimi-K2.7-Code，基于 Kimi K2.6 的专用编码智能体模型。该模型面向长周期软件工程工作流，支持工具调用和代理式推理。现已通过 Together AI 的推理栈提供，针对工具密集型编码代理场景优化。模型在多个编程基准上表现优于前代。

AI模型 Kimi-K2.7-Code 月之暗面智能体代码模型

推荐理由：月之暗面出了个专门写代码的智能体模型 K2.7-Code，在 Together AI 上就能跑，搞长期软件工程任务挺合适。

原文

18:26

Yangyi@Yangyixxxx

GLM5.2在前端审美能力上有显著进步，用户评价其表现接近Claude。该模型可能通过优化视觉布局和UI设计来增强用户体验。目前尚无公开基准测试结果，但社区对其潜力表示关注。

AI模型 GLM5.2 Claude 前端审美

推荐理由：GLM5.2的前端审美变强了，有人说快赶上Claude了，做UI设计的朋友可以留意一下。

原文

17:48

歸藏(guizang.ai)@op7418

Claude Code 约 3% 的 Max 和 Pro 用户遇到一个 bug，显示错误的每周使用限制，部分用户被阻止发送消息。该问题已被修复，并为所有受影响用户重置了 5 小时和每周使用限制。官方致歉并恢复服务。

AI产品 Claude Code 编程助手 AI代码工具

推荐理由：Claude Code 修了一个限用 bug，给你重置了 5 小时和每周额度，端午节放心用。

原文

17:12

宝玉@dotey

精选

宝玉更新了 baoyu-design skill，可在制作 PPT、动画视频或网站时调用 AI 生图技能配图。该 skill 基于声明式动画引擎，能导出 1080p 的 MP4 视频（使用 2 倍像素渲染后缩放）。它通过无头 Chromium 和 ffmpeg 逐帧截图生成视频，每 95 秒 30fps 动画需 2850 次截图。项目在 GitHub 开源（MIT 协议），已获 1.2K star。

技巧 baoyu-design AI生图 PPT生成动画视频开源项目

推荐理由：宝玉开源了 baoyu-design skill，能通过 AI 生图自动配 PPT 插图，还能导出 MP4 动画，效果比录屏好太多。

原文

17:12

Greg Brockman@gdb

Codex 桌面应用来自 OpenAI，用户展示了一个包含近 300 个子代理的会话，已持续运行超过一天。该用户表示体验流畅、无任何问题。该应用通过开源项目 lazycodex 增强，展现了强大的多代理协作稳定性。

AI产品 Codex OpenAI 智能体编程助手

推荐理由：看看 OpenAI 的 Codex 桌面端，跑 300 个代理连续一天都不卡，稳定性真的夸张。

原文

16:42

Tw93@HiTw93

这篇推特汇总了作者6篇关于AI面试准备的文章，涵盖Claude Code的架构与治理、Agent的原理与工程实践、大模型训练原理与路径、AI Coding的实战场景、GEO的可见性原理以及具身智能从机器狗到Optimus的演进。每篇文章针对AI岗位工程师转型提供了具体知识。作者祝福传统工程师转型成功。

技巧 Claude Code Agent AI Coding 具身智能面试准备

推荐理由：朋友推荐的6篇文章，从Claude Code到具身智能，面试AI岗位看这些就够了。

原文

16:39

歸藏(guizang.ai)@op7418

唐老师与马斯克在推特上讨论国内开源版本何时能达到Fable 5级别模型的标准。马斯克回应称“不会那么久”，暗示可能早于2027年。该对话引发对国内开源模型进展加速的预期。目前尚无具体时间表或模型细节。

行业 Fable 5 马斯克开源模型国内AI进展

推荐理由：马斯克说国内开源Fable 5级别模型不用等到2027年，唐老师跟进爆料，这波节奏值得盯一下。

原文

16:29

berryxia@berryxia

精选

姚金刚老师用Codex在38小时内提交301个分支，将yao-meta-skill（创建其他skill的元框架）重构为2.0版本。Codex全程拆解任务、修复问题、迭代优化，并生成2.0与1.0的详细对比报告。升级版在结构、可靠性和可扩展性上有明显提升，所有文档和对比公开，可供他人参考如何用AI agent做复杂工程重构。整个过程展示了AI agent参与自身工具迭代的能力。

技巧 Codex yao-meta-skill GitHub 元Skill 智能体

推荐理由：姚老师用Codex搞了个大工程，38小时301个分支把自己造的元Skill升级到2.0，代码和对比报告都开源了，玩agent的可以抄作业。

原文

16:28

berryxia@berryxia

Midjourney突然发布长达几分钟的技术视频，介绍其自研的“Midjourney Scanner”——一款全身超声计算断层扫描设备。该设备利用超声波阵列进行计算断层成像，目标提供比传统MRI更快、更便宜、辐射更低的3D全身扫描方案。视频展示其从AI图像生成转向真实人体结构采集与重建的技术路线。评论区讨论了超声断层成像的物理限制和落地难点。

AI产品 Midjourney Midjourney Scanner 马斯克医疗设备计算成像

推荐理由：Midjourney不搞AI画图了，直接做出医疗硬件扫描仪，马斯克都点赞。看看他们怎么用AI思维做医疗成像。

原文

16:27

berryxia@berryxia

73°

Cursor 新增 /automate 技能，用户只需用自然语言描述任务（如“自动处理 GitHub issue”），AI 就自动配置触发器、指令和工具。目前支持 Slack emoji 触发、GitHub issue/review/workflow 触发以及 cloud agents 的 computer use。该功能将 agent 自动化从手动编写配置转变为“说一句人话”，降低了创建自动化工作流的门槛。

AI产品 Cursor 自动化 Slack GitHub 编程助手

推荐理由：Cursor 现在让你用中文描述任务就能自动搭好自动化流程，不用再手配 trigger 写 prompt，傻瓜式操作。

原文

16:26

berryxia@berryxia

精选

Browser Use开源了一个浏览器agent模板B，基于Vercel的Eve构建。该模板让任何agent都能使用真实云端浏览器，并通过browser-harness实时查看操作过程。它支持初始化skills和MCPs，可直接从GitHub克隆使用。相比模拟环境或黑箱运行，模板B实现了每一步可视化、可调试，将browser automation推向更实用阶段。

AI产品 Browser Use 智能体浏览器自动化 MCP/工具开源项目

推荐理由：Browser Use直接开源了模板B，让你的Agent能连上真实云浏览器，还能实时看到它操作页面。调试方便多了，GitHub上就能clone。

原文

16:25

berryxia@berryxia

精选72°

OpenAI Codex推出Record & Replay功能，用户通过录制一次工作流（如报销流程）即可自动生成可检查、可编辑的skill。该功能将示范教学转化为可复用技能，目前仅支持macOS，欧洲国家暂不支持。录制由用户控制开始和结束，Codex将流程结构化为可迭代优化的技能，降低了Agent构建门槛。

AI产品 OpenAI Codex Record & Replay 工作流自动化技能录制

推荐理由：OpenAI Codex新功能让你录屏演示一遍就能自动生成可编辑的工作流技能，不用写Prompt，适合重复性任务自动化。

原文

16:24

berryxia@berryxia

精选

Matthew Berman 创建了 Loop Library，专门收集可直接复用的 agent 循环流程，涵盖从简单任务自动化到复杂多步工作流。该库与某个平台合作托管，用户可搜索现成模板或提交自己的流程。此前设计 agent 最耗时的退出、验证、失败处理等循环结构，现在能被社区公开验证的模板替代。这一做法将 agent 开发从每次重写循环推向模块化搭积木方向，为生态提供公共流程市场。

AI产品 Matthew Berman Loop Library agent loop 智能体工作流

推荐理由：Matthew Berman 建了个 Loop Library，把各种 agent 循环模板集中了，直接用现成的，不用自己从头设计流程。

原文

16:24

berryxia@berryxia

76°

Claude Code 新增 Artifacts 功能，可将编码会话转化为可实时刷新的共享互动页面。用户能一键生成 PR 演示、项目 dashboard 或调试过程的互动页面，并通过私有链接分享给团队。Artifacts 会随 session 持续工作自动刷新，确保团队始终看到最新版本。该功能调用整个会话上下文的代码库、插件、技能和已连接工具，分享在组织内私密进行。目前 Team 和 Enterprise 计划的 beta 版可用。

AI产品 Claude Code Artifacts 团队协作编程助手实时共享

推荐理由：Claude Code 出了个 Artifacts 功能，能把你编程过程做成实时更新的共享页面，团队点链接就能看，不用再截图粘贴了。

原文

16:13

Yangyi@Yangyixxxx

这条推文探讨了产品设计中的两种路线选择：Human First 模式（如带界面的 SaaS）和 Agent First 模式（如纯正的 CLI）。作者 Yang Yi 提出，关键取决于用户是否需要实时反馈与可视化操作，还是可以容忍黑箱执行。如果目标用户对流程控制要求高，Human First 更合适；如果追求自动化与效率，Agent First 更优。该讨论基于 163 次浏览和 1 次回复的社交数据，反映了行业对交互形态的持续思考。

技巧产品设计人机交互 Agent SaaS CLI

推荐理由：设计师和创业者都在纠结的问题：到底该做带界面的产品还是纯 CLI？Yang Yi 这条推文给了一个简洁的判断框架，帮你少走弯路。

原文

14:55

Epoch AI@EpochAIResearch

EpochAI Research在本周通讯中由@datagenproc、@joemkwon和@ansonwhho提出一种更精细的工具：包含60多项任务的前沿AI研究分类法，用于衡量AI自动化AI研发的进展。当前经济学家使用的自动化工具过于粗糙，无法准确评估。该分类法覆盖了从实验设计到论文撰写等完整研发流程。

行业 EpochAI AI自动化前沿AI研究分类法

推荐理由：EpochAI做了个60多项任务的分类，能更准地衡量AI自己搞研发的进展，比现有工具细多了。

原文

14:54

Epoch AI@EpochAIResearch

Epoch AI Research指出，超大规模企业的资本支出增速已超过运营现金流入增速。按当前趋势，到今年年底这些公司将无法完全用运营现金来支撑AI基础设施扩建。这标志着自我融资模式的终结，可能迫使企业转向外部融资或合作。

行业 EpochAIResearch AI基础设施资本支出融资超大规模企业

推荐理由：Epoch AI最新分析显示，大厂光靠内部现金已撑不住AI基建，年底前可能得借钱或找合作。别错过这趋势判断。

原文

14:54

Epoch AI@EpochAIResearch

Claude Fable 5 在 Epoch Capabilities Index (ECI) 上取得 161 分的新高，比 GPT-5.5 Pro 高出 1 分。这是 Anthropic 一年多来首次在 ECI 上领先。该指数衡量模型综合能力，Claude Fable 5 的表现重新夺回了榜首位置。

AI模型 Claude Fable 5 GPT-5.5 Pro Anthropic 基准成绩

推荐理由：Claude Fable 5 在 ECI 上拿 161 分，超 GPT-5.5 Pro 一分，Anthropic 终于又领先了。

原文

14:42

Simon Willison@simonw

精选

Jeremy Howard 称 GLM 5.2 是开放权重模型中的奇迹，性能至少与 Opus 4.8 和 GPT 5.5 持平。它速度快、成本低、输出简洁，且擅长长上下文处理。该模型由 Zai_org 发布，目前尚未在 Groq 或 Cerebras 等超快推理提供商上运行，但社区期待其部署。

AI模型 GLM-5.2 Zai_org 开放权重推理模型

推荐理由：GLM 5.2 开放权重、性能比肩闭源顶尖模型，还便宜又快，写代码或处理长文档会很顺手。

原文

14:40

@koltregaskes@koltregaskes

73°

Project Glasswing的部分用户报告他们仍能访问Anthropic的Claude Fable 5模型。尽管美国政府命令导致其他版本完全关闭，但获批组织保留了对该预览系统的访问权限。目前尚无关于Claude Fable 5全面回归的消息。

行业 Claude Fable 5 Anthropic Project Glasswing 监管 AI安全

推荐理由：Anthropic的Claude Fable 5模型因美国政府命令部分受限，但Project Glasswing用户还能用，想知道怎么回事就看这条。

原文

14:36

小互@imxiaohu

豆包实时语音模型3.0 API 正式上线，支持全双工模式，可同时听和说并随时插话。采用端到端语音进语音出，无需转录，响应更快更自然。模型能精准遵循指令，例如在多人聊天中设定规则后静待话题出现再参与。支持自定义工具调用，可在实时对话中完成预定日历、发邮件、总结文档等任务，向语音 Agent 迈进。

AI模型豆包实时语音模型3.0 全双工语音Agent 工具调用

推荐理由：豆包出了3.0语音模型，能同时听说、随时插话，还能在对话里调工具办事情，比传统语音助手强一大截。

原文

14:29

腾讯混元 Tencent Hunyuan@TencentCloud

Tencent Cloud Day Korea 2026 本周初在首尔成功举办，吸引超过170位行业领袖、创新者、客户和合作伙伴参与。活动以“AI in Action – Powering Efficiency with Tencent Cloud”为主题，展示了AI在游戏、媒体、企业生产和智能基础设施等领域的实际应用。来自游戏、媒体、互联网和企业部门的领导者讨论了AI如何重塑业务效率、内容创作、客户互动和运营优化。除了会议，活动还通过高管会议、社交环节和生态合作创造了深度协作机会，强化了腾讯云对韩国AI驱动数字化转型的长期承诺。

行业 Tencent Cloud 腾讯云 AI应用数字化转型云计算

推荐理由：腾讯云在首尔办了场AI落地大会，170多位行业领袖到场，聊了游戏、媒体、企业里的AI实际用法，不是空谈。

原文

14:00

小互@imxiaohu

精选73°

Codex推出Record & Replay功能，用户演示一次操作流程（如发YouTube视频：拉元数据、配缩略图、上传存为私密、核对），Codex即自动学习并生成可复用的Skill技能。下次遇到相同任务，Codex可独立完成全流程，无需用户干预。该功能还适用于贴发票、批量重命名文件、填写周报表、订票等重复性电脑操作。从每次写提示词到演示一次即够，大幅降低重复劳动成本。

AI产品 Codex Record & Replay 自动化工作流演示学习

推荐理由：Codex出了个新功能，你只要做一遍操作给它看，它就能学会并自动帮你干重复的电脑活，超级省时间。

原文

13:43

Marc Andreessen@pmarca

Anthropic CEO Dario Amodei在Polymarket上透露，参与测试Mythos模型的公司警告其威力堪比超级武器，并建议使用需要类似枪支许可证的严格管控。该言论引发对AI安全与监管的讨论。目前Mythos模型的具体细节尚未公开。

行业 Anthropic Dario Amodei Mythos AI安全 AI监管

推荐理由：Anthropic老板自己爆料的内部警告——他们测试的Mythos模型被说成超级武器，建议持证才能用，这瓜很劲爆。

原文

13:39

Greg Brockman@gdb

OpenAI 为 ChatGPT Enterprise 管理员新增了信用使用分析和更新后的消费控制功能。管理员可在工作区、组和用户三级粒度管理 Codex 的消费限额。用户现在能查看自己的信用消耗情况，并可通过请求额外信用来扩展使用。该功能已在全球管理控制台中上线。

AI产品 ChatGPT Enterprise OpenAI Codex 企业功能消费控制

推荐理由：OpenAI 给企业版加了好用功能，管理员能按工作区、组、用户分级别管 Codex 的钱，用户也能看自己用了多少信用还能申请加量。

原文

13:12

向阳乔木@vista8

开发者vista8发布了一个MCP工具，让Codex能调用Claude Code完成写作（使用4.6 sonnet）、前端网页（使用4.8）等任务。该工具还支持在Codex中随时调用国产便宜模型，如智谱GLM-5.2、Deepseek V4 Flash，用于开发、翻译等场景。多模型可进行多轮讨论后由Codex总结方案。项目已免费开源。

技巧 Codex Claude Code 智谱GLM-5.2 Deepseek V4 MCP/工具

推荐理由：作者自己写了MCP让Codex调用Claude Code，还能用智谱GLM-5.2、Deepseek V4便宜模型，开发翻译都方便，已开源快去用。

原文

12:51

Cohere@cohere

精选

Cohere宣布其首个开源智能体编码模型的4-bit量化版本已可用。该量化版模型体积显著缩小，可在Mac上本地运行。用户可通过链接获取模型权重。此次发布使得开发者能够更便捷地在个人设备上运行智能体编码模型。

AI模型 Cohere 4-bit量化智能体编码模型开源模型

推荐理由：Cohere把自己最新的编程智能体模型压缩到4-bit，Mac上就能跑，本地开发效率直接拉满！

原文

12:42

Fireworks AI@FireworksAI_HQ

Jeremy Howard在X平台上称赞Zai_org的GLM 5.2模型，称其至少与Opus 4.8和GPT 5.5一样优秀。他指出该模型速度极快、成本低廉且回答不冗长，在处理长上下文时表现非常出色。Howard表示从未见过如此优秀的开源权重模型。

AI模型 GLM 5.2 Zai_org Opus 4.8 GPT 5.5 开源模型

推荐理由：想试试媲美顶级闭源模型的开源模型吗？GLM 5.2又快又便宜，长上下文超强，看看Jeremy Howard怎么夸的。

原文

11:30

Yangyi@Yangyixxxx

培养AI-first思维的两个核心习惯：想找人问时先问AI，要求AI干活前先请教它怎么干。这样做能依靠AI解决大部分日常问题。同时还能在过程中熟悉解决问题的方法路径。是一条来自@yangyi的实用经验分享。

技巧 AI-first 工作效率提示词工程实用技巧

推荐理由：教你两个最简单的小习惯，立刻就能把AI用得更顺手，少走弯路。

原文

11:29

Augment Code@augmentcode

Augment Code 引入新工作流：人类先审查设计，然后由 Code Review 专家（AI）在几分钟内读取完整 diff，并对照已批准的设计进行检查。实现规模不再是限制，工作单元从单个 PR 扩展为整个项目。一个 AI 代理现在可以独立将项目从设计审批推进到代码合并。

AI产品 Augment Code 智能体代码审查工作流 AI代理

推荐理由：Augment Code 出了新工作流，人类只管审设计，AI 代理几分钟读完完整 diff 并自动合并，再也不用逐行看代码了。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。