23:40Geek@geekbb精选Pi Coding Agent 的 Web UI 采用双进程架构,会话守护进程与 Web 服务分离,确保 Agent 会话在服务器端持久运行。即使关闭浏览器或重启前端服务,会话也不会中断。该方案支持跨设备监督桌面和服务器上的 AI 编码 Agent,适合需要长期稳定运行编码任务的场景。技巧Pi Coding AgentWeb UI双进程架构持久化运行编程助手推荐理由:Pi Coding Agent 的 Web UI 让你关掉浏览器后编码任务还在服务器跑,跨设备也能接着监督,很实用。原文
23:29elvis@omarsar0Perplexity 发布了新功能 /learn 技能,通过智能体自动生成学习计划。该计划包含一个动态学习中心(artifact),可根据学习者的需求和进度实时调整。目前该功能已在 Perplexity 平台上线,用户可体验个性化学习路径。AI产品Perplexity/learn智能体学习计划个性化推荐理由:Perplexity 新出的 /learn 技能,能自动帮你制定学习计划,还会根据你学的情况动态调整,比自己瞎找资料高效多了。原文
23:24The Rundown AI@therundownai74°OpenAI 发布第一代自研芯片 Jalapeño,专为运行 LLM 设计,声称能效比“大幅超越当前最先进水平”。该芯片与 Broadcom 合作,仅用 9 个月完成开发。OpenAI 还利用自身 AI 模型辅助芯片设计与优化。AI产品OpenAIJalapeñoBroadcomAI芯片10 个信源在谈推荐理由:OpenAI 自己造芯片了,叫 Jalapeño,专门跑大模型,能效比吊打目前最好的,9 个月就和 Broadcom 搞出来了。原文
23:23OpenRouter@OpenRouterAIOpenRouter 发布全新专用 Image API,支持类型化动态能力。该 API 统一接入来自 Google、OpenAI、Black Forest Labs、Recraft、ByteDance、Sourceful、Microsoft 和 xAI 共8家提供商的30多个图像生成模型。开发者可通过单一接口调用多种模型,简化多模型集成流程。AI产品OpenRouterImage API图像生成多模型接入模型聚合10 个信源在谈推荐理由:OpenRouter 把30多个图像生成模型集中到一个API里,开发者不用挨个对接不同的服务商,省事多了。原文
22:58eric zakariasson@ericzakariassonGergely Orosz指出Anthropic正从追求最佳模型转向构建工具生态,推出了Slack集成。该集成允许用户在Slack中随时切换不同模型(如GPT-4、Claude等),从而避免对单一模型供应商的依赖。这一策略帮助Anthropic在开发者及非开发者工作流中建立更广泛的集成。推文讨论的Agent目前虽未正式发布,但反映了Anthropic的生态方向。行业AnthropicSlack模型无关智能体10 个信源在谈推荐理由:想摆脱模型锁定?看看Anthropic在Slack里的这个集成,能随时切换模型,不用吊死在一棵树上。原文
22:54Geek@geekbbOpenAI宣布推出其首款自研AI芯片Jalapeño,专为LLM工作负载设计,用于支持ChatGPT、Codex、API及未来智能体产品。该芯片由OpenAI从零设计,并与Broadcom合作生产。Jalapeño是OpenAI全栈平台从产品到模型再到基础设施的扩展,旨在扩大AI服务的规模和访问。AI产品OpenAIJalapeñoBroadcomAI芯片10 个信源在谈推荐理由:OpenAI自己造芯片了,叫Jalapeño,专门跑ChatGPT之类的大模型,和Broadcom合作,以后能更快更便宜地提供服务。原文
22:46LangChain@LangChainAI精选Jeff Barg在Interrupt会议上透露,Clay每月运行3.5亿个GTM智能体。他指出,缓存可将LLM调用成本降低高达70%。限制工具调用范围不仅能节省成本,还能提升输出质量。在多租户负载下,引入公平队列机制至关重要。技巧ClayGTM agentsLLM成本缓存工具调用推荐理由:做AI智能体上线的小伙伴必看,Clay的AI负责人亲自讲了怎么降本70%和优化队列,干货12分钟。原文
22:40阿里通义 Qwen@Alibaba_Qwen精选Qwen发布Paradigm II,一种基于世界建模的Agent基础模型。它通过单轮环境预测直接测试于多轮工具调用任务,无需Agent强化学习或任务特定调优。在7项基准上均取得提升,域内Terminal-Bench 2.0提升6.3%、SWE-Bench提升3.4%、WideSearch提升12.8%。域外基准Claw-Eval提升11.3%、QwenClawBench提升9.7%、BFCL v4提升9.0%。世界建模将'先预测后行动'内化为可迁移的推理模式。AI模型QwenParadigm II推理模型智能体世界模型推荐理由:Qwen做了个新Agent模型Paradigm II,不用额外训练就在终端、编码、搜索和工具调用任务上全涨分,尤其没见过的任务也管用。原文
22:39阿里通义 Qwen@Alibaba_Qwen精选73°阿里Qwen团队开源了Qwen-AgentWorld-35B-A3B模型,采用MoE架构,总参数量35B,每次推理激活3B参数,支持256K上下文长度。同时发布了AgentWorldBench基准,用于评估智能体的世界建模能力。该模型在多个现实环境模拟任务上表现优于同等规模模型。相关论文已发布于arXiv,代码和模型权重在GitHub和Hugging Face上开放。AI模型QwenAgentWorldMoE智能体世界建模推荐理由:阿里新开源了35B参数的MoE模型,只激活3B,256K超长上下文,配合AgentWorldBench,研究智能体世界建模的赶紧试试。原文
22:39阿里通义 Qwen@Alibaba_Qwen精选71°Qwen-AgentWorld是阿里Qwen团队发布的原生语言世界模型,在单一模型中模拟MCP、搜索、终端、SWE、Web、OS和Android共7种智能体环境。环境建模被设定为训练目标,而非后处理适配。在AgentWorldBench基准上,该模型超越Claude Opus 4.8和GPT-5.4。可控SimRL利用此世界模型作为环境进行强化学习,效果超过在真实环境中训练。仅通过预测环境的预热训练,无需智能体特定微调,预测知识即可零微调迁移至智能体任务。AI模型Qwen-AgentWorld智能体世界模型模拟环境强化学习推荐理由:阿里Qwen造了个能模拟7种环境的AgentWorld,在AgentWorldBench上干掉了Claude和GPT最新版,训练智能体不用真实环境也能更强,零微调迁移呢。原文
22:36小互@imxiaohu字节跳动推出新 AI 音乐模型 SeedMusic 1.0 Preview,用户输入一句话提示词即可在 2-3 分钟内生成一首完整歌曲。该模型支持古风、流行等风格混合,效果流畅且节奏感强。测试提示词为“来一首古风歌曲,但有现代流行节奏感”,输出结果朗朗上口。AI模型SeedMusic字节跳动音乐生成AI创作推荐理由:字节跳动新出的 SeedMusic 1.0 Preview 能一句话生成完整歌曲,2-3分钟出活,古风混流行节奏的效果挺不错。原文
22:28Ray Dalio@RayDalioRay Dalio在推文中阐述管理原则,强调员工个人进化与组织机器设计必须同步演进,才能实现指数级回报。他提出对员工优劣势进行坦诚评估,并通过培训或岗位匹配来弥补弱点,同时持续客观评估员工能否卓越履职。Dalio指出,与下属的私人关系可能影响评估客观性,而创意择优需要纯粹客观。该推文获70次点赞和近2.9万次阅读,属于#principleoftheday系列。行业Ray Dalio管理原则个人发展组织进化推荐理由:桥水创始人Ray Dalio分享管理心法,教你如何让员工成长和系统优化双轮驱动,适合带团队的人读。原文
22:24OpenAI@OpenAIOpenAI 在 X 平台发布了一条推文,内容指向 openai.com 的未知页面。该推文获得 264 次点赞、25 次转发和 58825 次查看。目前具体内容尚未明确,可能涉及新产品或更新。行业OpenAI推文10 个信源在谈推荐理由:OpenAI 突然发链接,说不定有新东西,点进去看看。原文
22:18shao__meng@shao__meng89°OpenAI 联合 Broadcom 和 Celestica 从零设计并成功流片了首款自研 LLM 推理加速器 Jalapeño,耗时 9 个月,宣称能效显著优于当前 SOTA。该芯片专为 ChatGPT、Codex 和 API 等工作负载优化,计划从 2026 年底起以吉瓦级规模部署。此举是 OpenAI 垂直整合战略的一部分,与 Google TPU、Amazon Trainium 等路径一致,旨在通过自研芯片提升推理效率、降低成本和改善用户体验。AI模型JalapeñoOpenAIBroadcom推理芯片自研硬件10 个信源在谈推荐理由:OpenAI 和 Broadcom 联手搞了颗推理芯片 Jalapeño,9 个月就流片了,能效比现在最好的还强,计划 2026 年底大规模部署,想自己掌控底层硬件。原文
21:57OpenAI@OpenAI93°OpenAI宣布已设计并制造出首款自研AI芯片Jalapeño,该芯片由OpenAI从头设计,并与Broadcom合作实现量产。Jalapeño专为支撑ChatGPT、Codex、API及未来智能体产品的LLM工作负载而构建。此举扩大了OpenAI从产品到模型再到基础设施的全栈平台,旨在规模化扩展智能、服务更多用户并扩大AI访问权限。AI产品OpenAIJalapeñoBroadcom芯片LLM10 个信源在谈推荐理由:OpenAI自己造芯片了,名字叫Jalapeño,专跑ChatGPT和Codex那类LLM任务,还拉上Broadcom合作量产。原文
20:54@koltregaskes@koltregaskes字节跳动旗下Seedance 2.5视频生成模型将提供付费通行证,允许用户使用受版权保护的材料进行创作。字节跳动从中抽成并转交给版权所有者。这是AI视频生成领域首个此类商业化尝试,可能推动其他实验室跟进。但定价模式、可用素材范围、跨境法律合规性等细节尚未明确。音乐领域的类似版权许可机制预计也将出现。AI产品Seedance 2.5ByteDance视频生成版权AI内容创作6 个信源在谈推荐理由:字节跳动的Seedance 2.5要搞版权通行证了,用受版权保护的内容做视频还能合法分成,比Suno那些还没落地的强。原文
20:24shao__meng@shao__meng精选用户shao__meng今天开始使用Zcode编程助手,搭配GLM-5.2模型,体验快速且好用。但与Codex相比,Zcode在Computer Use等全面能力上仍有差距。用户感谢SeTriones赞助GLM API Key,并认为Zcode的能力全面性有待提升。AI产品CodexZcodeGLM-5.2编程助手Computer Use推荐理由:老TL分享了Zcode和Codex的对比体验,GLM-5.2模型真的快,但Zcode的Computer Use还比不上Codex。原文
19:54Geek@geekbbDeepseek V4 Flash 是一款小型模型,能完成约 80% 原本需要 Claude 或 Codex 处理的任务。每任务成本仅为 Fable 的 1/137,性价比极高。该模型展示了小模型在特定场景下的实用价值,但需要更优的编排来发挥全部潜力。AI模型Deepseek V4 FlashClaudeCodex小模型成本推荐理由:小模型 Deepseek V4 Flash 能搞定八成任务,成本只有 Fable 的零头,超划算!原文
19:24The Rundown AI@therundownaiAnthropic的Claude现在作为agentic coworker集成到Slack中。用户可以直接在Slack对话中调用Claude执行任务、回答问题和编写代码。该功能利用Claude 3.5 Sonnet的agentic能力实现自主工作。Meta同时宣布加大AI智能眼镜研发投入,但未公布具体数字。AI产品ClaudeSlackAnthropic智能体协作工具10 个信源在谈推荐理由:Claude现在能直接在Slack里当同事用,不用切窗口就能让它写报告查数据,团队协作效率拉满。原文
19:12orange.ai@oran_geCola上线了Seed 2.1 Pro模型,这是一款原生多模态模型,官方声称是目前多模态最强。相比Seed 2.0版本,该模型在Coding和Agent能力上有所增强。用户可通过colaos.ai进行体验。AI模型ColaSeed 2.1 Pro多模态智能体代码能力3 个信源在谈推荐理由:Cola刚发了Seed 2.1 Pro,说是多模态最强,coding和agent比2.0强不少,想试试去colaos.ai就行。原文
18:32AI Will@FinanceYF5传统AI使用方式是一问一答、改完再问,效率低下。顶尖AI工程师设计自动化循环,让循环去提示AI。这种方法将用户从引擎角色解放出来,让AI自主迭代。通过循环设计,可以减少人工干预,大幅提升生产力。技巧提示词工程工作流自动化AI效率推荐理由:别再做人工提示苦力了,学学工程师怎么用循环驱动AI,效率翻倍。原文
18:27AI Will@FinanceYF5Thariq 完全没碰视频剪辑软件,而是让 Claude 写代码并调用多个工具完成编辑。Claude 使用了转录服务、FFmpeg 做音视频处理、Figma MCP 做调色、Remotion UI 制作界面并完成渲染。整个过程由 AI 编程生成复杂脚本,替代传统剪辑工具。技巧ClaudeFigma MCPRemotionFFmpeg视频生成1 个信源在谈推荐理由:看看人家怎么用 Claude 写代码搞定视频剪辑,不用碰任何剪辑软件,全程 AI 自动化。原文
18:26AI Will@FinanceYF5三星已在全球Device Experience(DX)部门部署ChatGPT Enterprise和OpenAI Codex。三年前,三星因数据安全风险禁止员工使用ChatGPT,此次在受控企业环境中重新开放AI工具。该部署覆盖全球范围内的DX部门,涉及产品设计、研发等环节。行业三星ChatGPT EnterpriseOpenAI Codex企业部署AI安全10 个信源在谈推荐理由:三星这回学聪明了,用企业版ChatGPT和Codex来办公,安全可控还有效,大公司可以抄作业。原文
18:25AI Will@FinanceYF578°NVIDIA Robotics推出Halos for Robotics,这是行业首个全栈安全系统,专为物理AI设计,基于IGX Thor和Holoscan平台。Agility Robotics率先将其集成到人形机器人中,用于工厂和仓库场景。该系统通过多层级防护保障机器人与人类协作时的安全,已在Automate 2026上展示。AI产品NVIDIA Halos for Robotics机器人安全物理AIAgility Robotics人形机器人5 个信源在谈推荐理由:英伟达专门为机器人搞的安全系统,Agility已经用上了,工厂里人机协作更安心。原文
18:24AI Will@FinanceYF583°英伟达推出 Halos for Robotics 全栈安全系统,这是业界首款针对物理 AI 的安全系统。该系统由 IGX Thor 和 Holoscan 平台驱动。Agilityrobotics 已将其首次集成到工厂和仓库中的人形机器人中。AI产品英伟达HalosIGX Thor物理AI人形机器人推荐理由:英伟达搞了个新安全系统 Halos,专门保护人形机器人和物理 AI,而且已经有公司在工厂里用上了。原文
17:30Latent.Space@latentspacepod精选76°Anthropic发布了Claude Tag,一个针对Slack的Claude AI bot更新。它支持多玩家协作和主动监控功能,类似于Claude Code的增强版。内部版本已合并65%的产品PRs。这是Anthropic首个原生多玩家和主动式产品。AI产品ClaudeAnthropicSlack智能体协作10 个信源在谈推荐理由:Anthropic的Claude Tag让Slack里的Agent能多人协作、主动干活,内部已合并65% PR,值得试试。原文
17:29shao__meng@shao__meng精选字节跳动发布豆包2.1系列模型,豆包2.1 Pro在Coding和Agent能力上有显著提升,VLM能力介于Claude Opus 4.6和4.8之间。作者使用TRAE Work测试其前端设计图还原能力,模型会先思考规划再分步骤实现,通过本地预览和视觉验证确保质量。最终输出包含自适应布局和实际配图,而非仅占位符,交互和细节还原到位。技巧豆包2.1 ProTRAE Work字节跳动前端设计编程助手推荐理由:有人拿TRAE Work测了豆包2.1 Pro,前端的视觉还原和配图能力很惊艳,做设计稿转代码可以试试。原文
17:28Viking@vikingmuteskills.sh 提供 CLI 工具,可统一安装、更新、卸载多个 coding agent 的 skills。它直接打通 GitHub,有交互界面,支持选择安装特定 agents 的 skills。用户分享用其作为 skills 唯一来源,解决 Cline、Codex、Claude 等 agent 的 skills 文件散落混乱的问题。技巧skills.shClineCodexClaude技能管理推荐理由:用 skills.sh 一个命令行搞定所有 coding agent 的 skills 管理,不用再写脚本软链接了。原文
17:25AI Will@FinanceYF5AGI Summit SF 2026定于7月18-19日在硅谷举办,预计吸引15000名参会者、200多位演讲嘉宾、500多家风险投资公司和来自30多个国家的代表。OpenAI、Anthropic、Google DeepMind、BlackRock等机构已确认到场。第二天正值世界杯决赛日,活动将结合观赛体验。行业AGI SummitOpenAIAnthropicGoogle DeepMindAI峰会10 个信源在谈推荐理由:7月硅谷AI峰会,OpenAI、Anthropic、DeepMind都来,15000人规模还能看世界杯决赛,值得去。原文
16:57Geek@geekbbPi AI 聊天推出浏览器版本,替代原有的终端 TUI 界面。新版本支持同时运行多个对话,方便用户切换主题。支持跨设备访问,不同平台可无缝衔接。断线不中断会话功能确保网络波动时聊天记录不丢失。经测试,浏览器界面流畅度较高,解决了终端审美疲劳问题。AI产品PiAI聊天浏览器跨设备断线续传推荐理由:Pi 终于有了好用的浏览器版,多对话、跨设备、断线续传,比终端舒服多了。试试看。原文
16:09berryxia@berryxia精选Anthropic内部工程师运行300多个自改进的agent swarm来提升系统可靠性。核心方法是给模型验证自身输出的机制,包括计划模式、动态工作流和自我检查,根据真实反馈迭代。这种闭环系统让agent从一次性工具变为能自我迭代的系统,可靠性大幅提升但token消耗更高。效果远超大多数300美元的agent课程。技巧Anthropic智能体agent工作流自改进10 个信源在谈推荐理由:Anthropic工程师自己怎么用agent?300个自改进swarm加闭环验证,比花300美元买课实用多了。原文
15:29@OpenAIDevs@OpenAIDevsOpenAI Devs在X平台发起活动,邀请用户展示使用Codex构建时的各种工作环境(凌乱桌、整洁桌、沙发桌、机场地板桌)。用户可通过codex-billboard.vercel.app自定义生成自己的Codex广告牌。该推文已获得447个点赞、67988次查看和87条回复。AI产品CodexOpenAI创意活动广告牌AI编程10 个信源在谈推荐理由:OpenAI搞了个Codex工作台活动,可以自己生成创意广告牌,挺有趣的,去看看别人的桌面多乱。原文
15:24Stanford AI Lab@StanfordAILab精选斯坦福团队提出SPIRAL框架,通过强化学习让LLM在测试时自动协调顺序推理、并行采样和结果聚合。与传统只优化单链推理的训练方法不同,SPIRAL使用set RL训练模型生成对聚合器集体有用的多个候选答案,并用标准RL优化聚合器从这些候选合成改进答案。该方法使所有测试时计算维度(长链、并行样本、聚合)端到端可学习,缩小训练与部署的差距。AI模型SPIRALLLM强化学习推理模型测试时计算扩展推荐理由:斯坦福团队发了SPIRAL,让LLM训练时就学会并行采样和聚合答案,不是只会单链思考,更符合实际推理场景。原文
14:34AI Will@FinanceYF5Anthropic 今天在 Slack 上推出了 Claude Tag 的 beta 版本,面向 Claude Enterprise 和 Team 方案用户。Claude Tag 允许用户在 Slack 对话中直接@Claude 并触发特定功能或工作流。该功能目前处于早期测试阶段,Anthropic 计划未来将 Claude Tag 推广给更多用户和方案。AI产品ClaudeSlackAnthropicClaude EnterpriseClaude Team10 个信源在谈推荐理由:Anthropic 在 Slack 里直接集成了 Claude Tag,企业版和 Team 版用户可以抢先体验,不用切窗口就能召唤 Claude。原文
14:33AI Will@FinanceYF5Claude Tag 正式发布,允许用户在 Slack 中将 Claude 添加为团队成员。Claude 可以访问选定的频道和工具,用户通过 @Claude 直接委派任务。该功能已吸引 750 次浏览。AI产品ClaudeSlackAnthropic团队协作Slack集成10 个信源在谈推荐理由:现在你可以在 Slack 里直接 @Claude 让它帮忙干事了,像叫同事一样简单。原文
13:27Marc Andreessen@pmarcaMarc Andreessen 在 X 上发帖,称帖子明显由 Claude 写成。他引用 Slack,认为第三个范式能成功的理由是基础设施早已存在:Slack 天生为开放协作构建,团队、工具和上下文共处一处。AI 无需改变工作方式,只需一个让它真正能用的地方。该推文获得 85 次喜欢、16 次转发和 17528 次浏览。技巧ClaudeSlackAI工作流协作工具10 个信源在谈推荐理由:Marc Andreessen 用 Claude 在 Slack 里发帖,说基础设施早已就位——想用 AI 但嫌工具割裂?看看他为什么觉得 Slack 才是 AI 的归宿。原文
13:13vLLM@vllm_projectvLLM 项目宣布支持 DFlash 投机解码,用户只需将 EAGLE-3 检查点替换为 DFlash 检查点即可启用,无需修改代码。该功能通过开源 Speculators 库将 DFlash 草案模型与目标模型的隐藏状态连接。在单块 Blackwell Ultra GPU 上运行 Gemma-4 31B 模型,Math500 基准取得 5.8 倍吞吐量提升,GSM8K 提升 5.3 倍,HumanEval 提升 5.6 倍,MBPP 提升 4.4 倍。AI模型DFlashvLLMGemma-4NVIDIA推理优化10 个信源在谈推荐理由:vLLM 和 NVIDIA 合作推出 DFlash 投机解码,Gemma-4 31B 推理速度提升近 6 倍,配置只需改一行 checkpoint 路径。原文
12:54宝玉@dotey精选@dotey 分享了一种极客风格的 Skills 管理方式:只在项目内安装所需 Skills,不装全局,以节约 Agent 的上下文窗口空间。核心方法是使用软链接(symlink)将 Skills 原件统一存放在 ~/GitHub 仓库中,项目内通过 .agents/skills 软链指向原件,再创建 .claude/skills → .agents/skills 的链接供 Claude Code 使用。更新时只需拉取仓库代码,所有项目自动同步;修 bug 可直接修改原件并反哺开源社区。用户不必记住软链接命令,用自然语言告诉 Agent 即可完成操作。技巧SkillsClaude Code软链接编程助手提示词工程推荐理由:@dotey 分享了用软链接管理 Skills 的方法,只装项目内省上下文,更新一次全局同步,还能顺手给开源社区修 bug,极客必备。原文
12:40小互@imxiaohu精选百度发布新 OCR 模型 UnlimitedOCR,支持单次推理解析数百页文档,同时保持高吞吐速度。在 OmniDocBench v1.5 基准上,其准确率达到 93%,比原始 DeepSeek-OCR 基线提升 6 个百分点。模型已开源,可在 Hugging Face 和 GitHub 下载。AI模型UnlimitedOCRBaiduOmniDocBenchDeepSeek-OCR文档解析8 个信源在谈推荐理由:百度新出的 UnlimitedOCR 能一次处理几百页,速度还很快,直接比 DeepSeek-OCR 高了 6 个点,真正好用。原文
12:39小互@imxiaohu精选百度开源的Unlimited OCR模型采用参考滑动窗口注意力(R-SWA)技术,能在32K上下文内一次前向推理处理数十页文档,无需分页。模型仅3B参数、500M激活,显存和算力不随页数增长。传统逐页OCR需要拼接结果,而R-SWA模拟人类连续抄写,始终记忆固定大小的文本。该模型据称基于DeepSeek OCR核心贡献者开发,已在标准长度文档上测试。AI模型Unlimited OCR百度R-SWAOCR开源模型8 个信源在谈推荐理由:百度开源了一款OCR模型,3B参数就能一次处理几十页PDF,不用切页,比传统逐页OCR强太多。原文