全部 AI 动态 · AI 热点

6月24日

23:40

Geek@geekbb

精选

Pi Coding Agent 的 Web UI 采用双进程架构，会话守护进程与 Web 服务分离，确保 Agent 会话在服务器端持久运行。即使关闭浏览器或重启前端服务，会话也不会中断。该方案支持跨设备监督桌面和服务器上的 AI 编码 Agent，适合需要长期稳定运行编码任务的场景。

推荐理由：Pi Coding Agent 的 Web UI 让你关掉浏览器后编码任务还在服务器跑，跨设备也能接着监督，很实用。

原文

23:29

elvis@omarsar0

Perplexity 发布了新功能 /learn 技能，通过智能体自动生成学习计划。该计划包含一个动态学习中心（artifact），可根据学习者的需求和进度实时调整。目前该功能已在 Perplexity 平台上线，用户可体验个性化学习路径。

AI产品 Perplexity /learn 智能体学习计划个性化

推荐理由：Perplexity 新出的 /learn 技能，能自动帮你制定学习计划，还会根据你学的情况动态调整，比自己瞎找资料高效多了。

原文

23:24

The Rundown AI@therundownai

74°

OpenAI 发布第一代自研芯片 Jalapeño，专为运行 LLM 设计，声称能效比“大幅超越当前最先进水平”。该芯片与 Broadcom 合作，仅用 9 个月完成开发。OpenAI 还利用自身 AI 模型辅助芯片设计与优化。

AI产品 OpenAI Jalapeño Broadcom AI芯片

推荐理由：OpenAI 自己造芯片了，叫 Jalapeño，专门跑大模型，能效比吊打目前最好的，9 个月就和 Broadcom 搞出来了。

原文

23:23

OpenRouter@OpenRouterAI

OpenRouter 发布全新专用 Image API，支持类型化动态能力。该 API 统一接入来自 Google、OpenAI、Black Forest Labs、Recraft、ByteDance、Sourceful、Microsoft 和 xAI 共8家提供商的30多个图像生成模型。开发者可通过单一接口调用多种模型，简化多模型集成流程。

AI产品 OpenRouter Image API 图像生成多模型接入模型聚合

推荐理由：OpenRouter 把30多个图像生成模型集中到一个API里，开发者不用挨个对接不同的服务商，省事多了。

原文

22:58

eric zakariasson@ericzakariasson

Gergely Orosz指出Anthropic正从追求最佳模型转向构建工具生态，推出了Slack集成。该集成允许用户在Slack中随时切换不同模型（如GPT-4、Claude等），从而避免对单一模型供应商的依赖。这一策略帮助Anthropic在开发者及非开发者工作流中建立更广泛的集成。推文讨论的Agent目前虽未正式发布，但反映了Anthropic的生态方向。

行业 Anthropic Slack 模型无关智能体

推荐理由：想摆脱模型锁定？看看Anthropic在Slack里的这个集成，能随时切换模型，不用吊死在一棵树上。

原文

22:54

Geek@geekbb

OpenAI宣布推出其首款自研AI芯片Jalapeño，专为LLM工作负载设计，用于支持ChatGPT、Codex、API及未来智能体产品。该芯片由OpenAI从零设计，并与Broadcom合作生产。Jalapeño是OpenAI全栈平台从产品到模型再到基础设施的扩展，旨在扩大AI服务的规模和访问。

AI产品 OpenAI Jalapeño Broadcom AI芯片

推荐理由：OpenAI自己造芯片了，叫Jalapeño，专门跑ChatGPT之类的大模型，和Broadcom合作，以后能更快更便宜地提供服务。

原文

22:46

LangChain@LangChainAI

精选

Jeff Barg在Interrupt会议上透露，Clay每月运行3.5亿个GTM智能体。他指出，缓存可将LLM调用成本降低高达70%。限制工具调用范围不仅能节省成本，还能提升输出质量。在多租户负载下，引入公平队列机制至关重要。

技巧 Clay GTM agents LLM成本缓存工具调用

推荐理由：做AI智能体上线的小伙伴必看，Clay的AI负责人亲自讲了怎么降本70%和优化队列，干货12分钟。

原文

22:40

阿里通义 Qwen@Alibaba_Qwen

精选

Qwen发布Paradigm II，一种基于世界建模的Agent基础模型。它通过单轮环境预测直接测试于多轮工具调用任务，无需Agent强化学习或任务特定调优。在7项基准上均取得提升，域内Terminal-Bench 2.0提升6.3%、SWE-Bench提升3.4%、WideSearch提升12.8%。域外基准Claw-Eval提升11.3%、QwenClawBench提升9.7%、BFCL v4提升9.0%。世界建模将'先预测后行动'内化为可迁移的推理模式。

AI模型 Qwen Paradigm II 推理模型智能体世界模型

推荐理由：Qwen做了个新Agent模型Paradigm II，不用额外训练就在终端、编码、搜索和工具调用任务上全涨分，尤其没见过的任务也管用。

原文

22:39

阿里通义 Qwen@Alibaba_Qwen

精选73°

阿里Qwen团队开源了Qwen-AgentWorld-35B-A3B模型，采用MoE架构，总参数量35B，每次推理激活3B参数，支持256K上下文长度。同时发布了AgentWorldBench基准，用于评估智能体的世界建模能力。该模型在多个现实环境模拟任务上表现优于同等规模模型。相关论文已发布于arXiv，代码和模型权重在GitHub和Hugging Face上开放。

AI模型 Qwen AgentWorld MoE 智能体世界建模

推荐理由：阿里新开源了35B参数的MoE模型，只激活3B，256K超长上下文，配合AgentWorldBench，研究智能体世界建模的赶紧试试。

原文

22:39

阿里通义 Qwen@Alibaba_Qwen

精选71°

Qwen-AgentWorld是阿里Qwen团队发布的原生语言世界模型，在单一模型中模拟MCP、搜索、终端、SWE、Web、OS和Android共7种智能体环境。环境建模被设定为训练目标，而非后处理适配。在AgentWorldBench基准上，该模型超越Claude Opus 4.8和GPT-5.4。可控SimRL利用此世界模型作为环境进行强化学习，效果超过在真实环境中训练。仅通过预测环境的预热训练，无需智能体特定微调，预测知识即可零微调迁移至智能体任务。

AI模型 Qwen-AgentWorld 智能体世界模型模拟环境强化学习

推荐理由：阿里Qwen造了个能模拟7种环境的AgentWorld，在AgentWorldBench上干掉了Claude和GPT最新版，训练智能体不用真实环境也能更强，零微调迁移呢。

原文

22:36

小互@imxiaohu

字节跳动推出新 AI 音乐模型 SeedMusic 1.0 Preview，用户输入一句话提示词即可在 2-3 分钟内生成一首完整歌曲。该模型支持古风、流行等风格混合，效果流畅且节奏感强。测试提示词为“来一首古风歌曲，但有现代流行节奏感”，输出结果朗朗上口。

AI模型 SeedMusic 字节跳动音乐生成 AI创作

推荐理由：字节跳动新出的 SeedMusic 1.0 Preview 能一句话生成完整歌曲，2-3分钟出活，古风混流行节奏的效果挺不错。

原文

22:28

Ray Dalio@RayDalio

Ray Dalio在推文中阐述管理原则，强调员工个人进化与组织机器设计必须同步演进，才能实现指数级回报。他提出对员工优劣势进行坦诚评估，并通过培训或岗位匹配来弥补弱点，同时持续客观评估员工能否卓越履职。Dalio指出，与下属的私人关系可能影响评估客观性，而创意择优需要纯粹客观。该推文获70次点赞和近2.9万次阅读，属于#principleoftheday系列。

行业 Ray Dalio 管理原则个人发展组织进化

推荐理由：桥水创始人Ray Dalio分享管理心法，教你如何让员工成长和系统优化双轮驱动，适合带团队的人读。

原文

22:24

OpenAI@OpenAI

OpenAI 在 X 平台发布了一条推文，内容指向 openai.com 的未知页面。该推文获得 264 次点赞、25 次转发和 58825 次查看。目前具体内容尚未明确，可能涉及新产品或更新。

行业 OpenAI 推文

推荐理由：OpenAI 突然发链接，说不定有新东西，点进去看看。

原文

22:18

shao__meng@shao__meng

89°

OpenAI 联合 Broadcom 和 Celestica 从零设计并成功流片了首款自研 LLM 推理加速器 Jalapeño，耗时 9 个月，宣称能效显著优于当前 SOTA。该芯片专为 ChatGPT、Codex 和 API 等工作负载优化，计划从 2026 年底起以吉瓦级规模部署。此举是 OpenAI 垂直整合战略的一部分，与 Google TPU、Amazon Trainium 等路径一致，旨在通过自研芯片提升推理效率、降低成本和改善用户体验。

AI模型 Jalapeño OpenAI Broadcom 推理芯片自研硬件

推荐理由：OpenAI 和 Broadcom 联手搞了颗推理芯片 Jalapeño，9 个月就流片了，能效比现在最好的还强，计划 2026 年底大规模部署，想自己掌控底层硬件。

原文

21:57

OpenAI@OpenAI

93°

OpenAI宣布已设计并制造出首款自研AI芯片Jalapeño，该芯片由OpenAI从头设计，并与Broadcom合作实现量产。Jalapeño专为支撑ChatGPT、Codex、API及未来智能体产品的LLM工作负载而构建。此举扩大了OpenAI从产品到模型再到基础设施的全栈平台，旨在规模化扩展智能、服务更多用户并扩大AI访问权限。

AI产品 OpenAI Jalapeño Broadcom 芯片 LLM

推荐理由：OpenAI自己造芯片了，名字叫Jalapeño，专跑ChatGPT和Codex那类LLM任务，还拉上Broadcom合作量产。

原文

20:54

@koltregaskes@koltregaskes

AI产品 Seedance 2.5 ByteDance 视频生成版权 AI内容创作

推荐理由：字节跳动的Seedance 2.5要搞版权通行证了，用受版权保护的内容做视频还能合法分成，比Suno那些还没落地的强。

原文

20:24

shao__meng@shao__meng

精选

用户shao__meng今天开始使用Zcode编程助手，搭配GLM-5.2模型，体验快速且好用。但与Codex相比，Zcode在Computer Use等全面能力上仍有差距。用户感谢SeTriones赞助GLM API Key，并认为Zcode的能力全面性有待提升。

AI产品 Codex Zcode GLM-5.2 编程助手 Computer Use

推荐理由：老TL分享了Zcode和Codex的对比体验，GLM-5.2模型真的快，但Zcode的Computer Use还比不上Codex。

原文

19:54

Geek@geekbb

Deepseek V4 Flash 是一款小型模型，能完成约 80% 原本需要 Claude 或 Codex 处理的任务。每任务成本仅为 Fable 的 1/137，性价比极高。该模型展示了小模型在特定场景下的实用价值，但需要更优的编排来发挥全部潜力。

AI模型 Deepseek V4 Flash Claude Codex 小模型成本

推荐理由：小模型 Deepseek V4 Flash 能搞定八成任务，成本只有 Fable 的零头，超划算！

原文

19:24

The Rundown AI@therundownai

Anthropic的Claude现在作为agentic coworker集成到Slack中。用户可以直接在Slack对话中调用Claude执行任务、回答问题和编写代码。该功能利用Claude 3.5 Sonnet的agentic能力实现自主工作。Meta同时宣布加大AI智能眼镜研发投入，但未公布具体数字。

AI产品 Claude Slack Anthropic 智能体协作工具

推荐理由：Claude现在能直接在Slack里当同事用，不用切窗口就能让它写报告查数据，团队协作效率拉满。

原文

19:12

orange.ai@oran_ge

Cola上线了Seed 2.1 Pro模型，这是一款原生多模态模型，官方声称是目前多模态最强。相比Seed 2.0版本，该模型在Coding和Agent能力上有所增强。用户可通过colaos.ai进行体验。

AI模型 Cola Seed 2.1 Pro 多模态智能体代码能力

推荐理由：Cola刚发了Seed 2.1 Pro，说是多模态最强，coding和agent比2.0强不少，想试试去colaos.ai就行。

原文

18:32

AI Will@FinanceYF5

传统AI使用方式是一问一答、改完再问，效率低下。顶尖AI工程师设计自动化循环，让循环去提示AI。这种方法将用户从引擎角色解放出来，让AI自主迭代。通过循环设计，可以减少人工干预，大幅提升生产力。

技巧提示词工程工作流自动化 AI效率

推荐理由：别再做人工提示苦力了，学学工程师怎么用循环驱动AI，效率翻倍。

原文

18:27

AI Will@FinanceYF5

Thariq 完全没碰视频剪辑软件，而是让 Claude 写代码并调用多个工具完成编辑。Claude 使用了转录服务、FFmpeg 做音视频处理、Figma MCP 做调色、Remotion UI 制作界面并完成渲染。整个过程由 AI 编程生成复杂脚本，替代传统剪辑工具。

技巧 Claude Figma MCP Remotion FFmpeg 视频生成

推荐理由：看看人家怎么用 Claude 写代码搞定视频剪辑，不用碰任何剪辑软件，全程 AI 自动化。

原文

18:26

AI Will@FinanceYF5

三星已在全球Device Experience（DX）部门部署ChatGPT Enterprise和OpenAI Codex。三年前，三星因数据安全风险禁止员工使用ChatGPT，此次在受控企业环境中重新开放AI工具。该部署覆盖全球范围内的DX部门，涉及产品设计、研发等环节。

行业三星 ChatGPT Enterprise OpenAI Codex 企业部署 AI安全

推荐理由：三星这回学聪明了，用企业版ChatGPT和Codex来办公，安全可控还有效，大公司可以抄作业。

原文

18:25

AI Will@FinanceYF5

78°

NVIDIA Robotics推出Halos for Robotics，这是行业首个全栈安全系统，专为物理AI设计，基于IGX Thor和Holoscan平台。Agility Robotics率先将其集成到人形机器人中，用于工厂和仓库场景。该系统通过多层级防护保障机器人与人类协作时的安全，已在Automate 2026上展示。

AI产品 NVIDIA Halos for Robotics 机器人安全物理AI Agility Robotics 人形机器人

推荐理由：英伟达专门为机器人搞的安全系统，Agility已经用上了，工厂里人机协作更安心。

原文

18:24

AI Will@FinanceYF5

83°

英伟达推出 Halos for Robotics 全栈安全系统，这是业界首款针对物理 AI 的安全系统。该系统由 IGX Thor 和 Holoscan 平台驱动。Agilityrobotics 已将其首次集成到工厂和仓库中的人形机器人中。

AI产品英伟达 Halos IGX Thor 物理AI 人形机器人

推荐理由：英伟达搞了个新安全系统 Halos，专门保护人形机器人和物理 AI，而且已经有公司在工厂里用上了。

原文

17:30

Latent.Space@latentspacepod

精选76°

Anthropic发布了Claude Tag，一个针对Slack的Claude AI bot更新。它支持多玩家协作和主动监控功能，类似于Claude Code的增强版。内部版本已合并65%的产品PRs。这是Anthropic首个原生多玩家和主动式产品。

AI产品 Claude Anthropic Slack 智能体协作

推荐理由：Anthropic的Claude Tag让Slack里的Agent能多人协作、主动干活，内部已合并65% PR，值得试试。

原文

17:29

shao__meng@shao__meng

精选

字节跳动发布豆包2.1系列模型，豆包2.1 Pro在Coding和Agent能力上有显著提升，VLM能力介于Claude Opus 4.6和4.8之间。作者使用TRAE Work测试其前端设计图还原能力，模型会先思考规划再分步骤实现，通过本地预览和视觉验证确保质量。最终输出包含自适应布局和实际配图，而非仅占位符，交互和细节还原到位。

技巧豆包2.1 Pro TRAE Work 字节跳动前端设计编程助手

推荐理由：有人拿TRAE Work测了豆包2.1 Pro，前端的视觉还原和配图能力很惊艳，做设计稿转代码可以试试。

原文

17:28

Viking@vikingmute

skills.sh 提供 CLI 工具，可统一安装、更新、卸载多个 coding agent 的 skills。它直接打通 GitHub，有交互界面，支持选择安装特定 agents 的 skills。用户分享用其作为 skills 唯一来源，解决 Cline、Codex、Claude 等 agent 的 skills 文件散落混乱的问题。

技巧 skills.sh Cline Codex Claude 技能管理

推荐理由：用 skills.sh 一个命令行搞定所有 coding agent 的 skills 管理，不用再写脚本软链接了。

原文

17:25

AI Will@FinanceYF5

AGI Summit SF 2026定于7月18-19日在硅谷举办，预计吸引15000名参会者、200多位演讲嘉宾、500多家风险投资公司和来自30多个国家的代表。OpenAI、Anthropic、Google DeepMind、BlackRock等机构已确认到场。第二天正值世界杯决赛日，活动将结合观赛体验。

行业 AGI Summit OpenAI Anthropic Google DeepMind AI峰会

推荐理由：7月硅谷AI峰会，OpenAI、Anthropic、DeepMind都来，15000人规模还能看世界杯决赛，值得去。

原文

16:57

Geek@geekbb

Pi AI 聊天推出浏览器版本，替代原有的终端 TUI 界面。新版本支持同时运行多个对话，方便用户切换主题。支持跨设备访问，不同平台可无缝衔接。断线不中断会话功能确保网络波动时聊天记录不丢失。经测试，浏览器界面流畅度较高，解决了终端审美疲劳问题。

AI产品 Pi AI聊天浏览器跨设备断线续传

推荐理由：Pi 终于有了好用的浏览器版，多对话、跨设备、断线续传，比终端舒服多了。试试看。

原文

16:09

berryxia@berryxia

精选

Anthropic内部工程师运行300多个自改进的agent swarm来提升系统可靠性。核心方法是给模型验证自身输出的机制，包括计划模式、动态工作流和自我检查，根据真实反馈迭代。这种闭环系统让agent从一次性工具变为能自我迭代的系统，可靠性大幅提升但token消耗更高。效果远超大多数300美元的agent课程。

技巧 Anthropic 智能体 agent 工作流自改进

推荐理由：Anthropic工程师自己怎么用agent？300个自改进swarm加闭环验证，比花300美元买课实用多了。

原文

15:29

@OpenAIDevs@OpenAIDevs

OpenAI Devs在X平台发起活动，邀请用户展示使用Codex构建时的各种工作环境（凌乱桌、整洁桌、沙发桌、机场地板桌）。用户可通过codex-billboard.vercel.app自定义生成自己的Codex广告牌。该推文已获得447个点赞、67988次查看和87条回复。

AI产品 Codex OpenAI 创意活动广告牌 AI编程

推荐理由：OpenAI搞了个Codex工作台活动，可以自己生成创意广告牌，挺有趣的，去看看别人的桌面多乱。

原文

15:24

Stanford AI Lab@StanfordAILab

精选

斯坦福团队提出SPIRAL框架，通过强化学习让LLM在测试时自动协调顺序推理、并行采样和结果聚合。与传统只优化单链推理的训练方法不同，SPIRAL使用set RL训练模型生成对聚合器集体有用的多个候选答案，并用标准RL优化聚合器从这些候选合成改进答案。该方法使所有测试时计算维度（长链、并行样本、聚合）端到端可学习，缩小训练与部署的差距。

AI模型 SPIRAL LLM 强化学习推理模型测试时计算扩展

推荐理由：斯坦福团队发了SPIRAL，让LLM训练时就学会并行采样和聚合答案，不是只会单链思考，更符合实际推理场景。

原文

14:34

AI Will@FinanceYF5

Anthropic 今天在 Slack 上推出了 Claude Tag 的 beta 版本，面向 Claude Enterprise 和 Team 方案用户。Claude Tag 允许用户在 Slack 对话中直接@Claude 并触发特定功能或工作流。该功能目前处于早期测试阶段，Anthropic 计划未来将 Claude Tag 推广给更多用户和方案。

AI产品 Claude Slack Anthropic Claude Enterprise Claude Team

推荐理由：Anthropic 在 Slack 里直接集成了 Claude Tag，企业版和 Team 版用户可以抢先体验，不用切窗口就能召唤 Claude。

原文

14:33

AI Will@FinanceYF5

Claude Tag 正式发布，允许用户在 Slack 中将 Claude 添加为团队成员。Claude 可以访问选定的频道和工具，用户通过 @Claude 直接委派任务。该功能已吸引 750 次浏览。

AI产品 Claude Slack Anthropic 团队协作 Slack集成

推荐理由：现在你可以在 Slack 里直接 @Claude 让它帮忙干事了，像叫同事一样简单。

原文

13:27

Marc Andreessen@pmarca

Marc Andreessen 在 X 上发帖，称帖子明显由 Claude 写成。他引用 Slack，认为第三个范式能成功的理由是基础设施早已存在：Slack 天生为开放协作构建，团队、工具和上下文共处一处。AI 无需改变工作方式，只需一个让它真正能用的地方。该推文获得 85 次喜欢、16 次转发和 17528 次浏览。

技巧 Claude Slack AI工作流协作工具

推荐理由：Marc Andreessen 用 Claude 在 Slack 里发帖，说基础设施早已就位——想用 AI 但嫌工具割裂？看看他为什么觉得 Slack 才是 AI 的归宿。

原文

13:13

vLLM@vllm_project

vLLM 项目宣布支持 DFlash 投机解码，用户只需将 EAGLE-3 检查点替换为 DFlash 检查点即可启用，无需修改代码。该功能通过开源 Speculators 库将 DFlash 草案模型与目标模型的隐藏状态连接。在单块 Blackwell Ultra GPU 上运行 Gemma-4 31B 模型，Math500 基准取得 5.8 倍吞吐量提升，GSM8K 提升 5.3 倍，HumanEval 提升 5.6 倍，MBPP 提升 4.4 倍。

AI模型 DFlash vLLM Gemma-4 NVIDIA 推理优化

推荐理由：vLLM 和 NVIDIA 合作推出 DFlash 投机解码，Gemma-4 31B 推理速度提升近 6 倍，配置只需改一行 checkpoint 路径。

原文

12:54

宝玉@dotey

精选

@dotey 分享了一种极客风格的 Skills 管理方式：只在项目内安装所需 Skills，不装全局，以节约 Agent 的上下文窗口空间。核心方法是使用软链接（symlink）将 Skills 原件统一存放在 ~/GitHub 仓库中，项目内通过 .agents/skills 软链指向原件，再创建 .claude/skills → .agents/skills 的链接供 Claude Code 使用。更新时只需拉取仓库代码，所有项目自动同步；修 bug 可直接修改原件并反哺开源社区。用户不必记住软链接命令，用自然语言告诉 Agent 即可完成操作。

技巧 Skills Claude Code 软链接编程助手提示词工程

推荐理由：@dotey 分享了用软链接管理 Skills 的方法，只装项目内省上下文，更新一次全局同步，还能顺手给开源社区修 bug，极客必备。

原文

12:40

小互@imxiaohu

精选

百度发布新 OCR 模型 UnlimitedOCR，支持单次推理解析数百页文档，同时保持高吞吐速度。在 OmniDocBench v1.5 基准上，其准确率达到 93%，比原始 DeepSeek-OCR 基线提升 6 个百分点。模型已开源，可在 Hugging Face 和 GitHub 下载。

AI模型 UnlimitedOCR Baidu OmniDocBench DeepSeek-OCR 文档解析

推荐理由：百度新出的 UnlimitedOCR 能一次处理几百页，速度还很快，直接比 DeepSeek-OCR 高了 6 个点，真正好用。

原文

12:39

小互@imxiaohu

精选

百度开源的Unlimited OCR模型采用参考滑动窗口注意力（R-SWA）技术，能在32K上下文内一次前向推理处理数十页文档，无需分页。模型仅3B参数、500M激活，显存和算力不随页数增长。传统逐页OCR需要拼接结果，而R-SWA模拟人类连续抄写，始终记忆固定大小的文本。该模型据称基于DeepSeek OCR核心贡献者开发，已在标准长度文档上测试。

AI模型 Unlimited OCR 百度 R-SWA OCR 开源模型

推荐理由：百度开源了一款OCR模型，3B参数就能一次处理几十页PDF，不用切页，比传统逐页OCR强太多。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。