06:40Stanford AI Lab@StanfordAILab精选斯坦福AI实验室发布M*运行时,用于统一服务多模态模型。相比专业系统,M*在omni TTS任务上提速2.7倍,在world-model rollouts任务上提速12.5倍。它匹配或超越所有专门系统的性能。AI产品M*斯坦福多模态运行时推荐理由:斯坦福新发的M*运行时,一个系统就能搞定各种多模态模型,速度比专业方案快2到12倍,值得做部署的看看。原文
06:39OpenAI@OpenAI精选OpenAI发布测试结果,评估模型对齐在压力下的表现。在对抗性提示下,模型更难被引导至有害行为,同时依然能响应有益指令。初步证据表明,模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性,未提及具体模型版本或基准分数。AI模型OpenAI对齐对抗性提示有害微调鲁棒性10 个信源在谈推荐理由:OpenAI发现他们的模型在对抗压力下挺得住,不容易被带坏,安全对齐效果不错。原文
06:38Greg Brockman@gdb精选72°OpenAI 与波士顿儿童医院及哈佛大学合作,在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例,她从 9 岁起持续肌肉无力,在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。AI模型OpenAIo3 Deep Research罕见病推理模型医疗AI10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例,找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁,终于有了答案。这 AI 真的能救命。原文
06:37OpenAI@OpenAIOpenAI 发布声明称,这是朝向更鲁棒有益和对齐模型的早期步骤。他们正在训练模型将有益特质带入新情境,使AI在能力增强的同时变得更可靠、透明和有用。该工作属于对齐研究的一部分,尚未披露具体模型或基准测试结果。AI模型OpenAIAI安全对齐10 个信源在谈推荐理由:OpenAI 开始教模型把好习惯带到新场景,让AI更靠谱。这个对齐实验挺关键,关注未来进展。原文
06:25Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue认为,事后API护栏无法消除模型的危险能力,只能隐藏在脆弱的接口后面,容易被越狱(jailbroken)。他建议不要训练高风险能力,除非有强评估、理由和遏制措施;采用分阶段发布(staged release),从可信测试者到更广泛访问,并开放发布以透明和问责。他呼吁大力支持开源AI,缩小封闭实验室和政府之间的能力差距;推动独立评估,而非信任黑盒API;赋予执法、法院、监管者、审计员、记者和公民社会强大的AI工具来检测和追究非法使用。行业AI安全开源模型独立评估分阶段发布API护栏推荐理由:Hugging Face CEO提出一个务实的AI安全路线:别只靠事后护栏,要加强独立评估、分阶段发布和开源生态。原文
06:22OpenAI@OpenAI73°OpenAI发布新研究,旨在训练AI模型将有益和安全行为推广到训练范围之外的新领域,并在压力下维持。该方法聚焦于让模型具备广泛且持久的利他性,论文名为《Beneficial RL》。研究通过强化学习框架,让模型学会在更长、更高风险的任务中自主保持符合人类意图的行为,而不仅是拟合训练数据。相关论文和代码已发布在alignment.openai.com/beneficial-rl/。论文OpenAIAI安全智能体强化学习10 个信源在谈推荐理由:OpenAI发了篇新论文,研究怎么让AI在超出训练场景的长期任务里也乖乖做好事,关心AI安全的朋友可以看看。原文
06:13cat@_catwu72°Claude Team 与 Claude Enterprise 用户现可通过 Claude Code 部署 HTML 网站并与团队成员分享。新功能 Artifacts 能从会话中生成交互式页面,例如 PR 审查或项目仪表板,并通过私有链接共享。该功能目前以公测形式提供给 Team 和 Enterprise 计划。Artifacts 改变了内部沟通方式,适用于架构变更、数据分析和原型展示。AI产品ClaudeClaude CodeArtifacts团队协作HTML部署推荐理由:Claude Code 出了 Artifacts,可以在团队里建交互页面并分享私有链接,做 PR 审查或项目仪表板特别方便。原文
06:02Dify@dify_aiDify指出企业AI项目常犯的错误是花数月时间重建模型编排、知识检索、监控、权限等底层平台。一个生产就绪的AI平台应直接提供模型灵活性(可切换供应商)、内置RAG(基于自有数据)、工作流编排(业务人员可读)以及监控与访问控制。这样IT团队就能专注交付业务价值,更快将更多应用推上线。技巧Dify企业AIAI平台RAG工作流编排推荐理由:Dify告诉你别重复造轮子,用现成平台更快把AI应用推上线,专注业务价值少踩坑。原文
05:34宝玉@dotey精选76°Anthropic 在 Claude Code CLI 和桌面应用中新增 Artifact 功能,可将终端会话内容(如 PR 走查、调试时间线、发布清单)生成实时更新的私有网页,团队成员通过链接可直接查看。Artifact 会利用当前会话的完整上下文(包括代码库、外部工具和对话内容)自动更新,历史版本可回溯。该功能以 beta 形式向 Claude Team 和 Enterprise 组织开放,个人用户暂时无法使用。AI产品Claude CodeArtifactAnthropic团队协作编程助手10 个信源在谈推荐理由:Claude Code 能把终端里的调试记录、PR 走查一键变成网页发给队友,不用再口述解释 agent 做了什么,适合团队协作。原文
05:16Ate-a-Pi@svpino一个AI代理产品允许用户直接标记目标并用自然语言下达指令,无需学习任何提示词技巧或理解工作原理。用户只需说出需求,代理即可自动执行并回答。这种零门槛交互方式大幅降低了AI使用门槛,使得更多非技术用户能够轻松上手。该产品因简单易用而逐渐流行起来。技巧智能体自然语言交互零门槛推荐理由:这个AI代理不用学提示词,直接说话就行,效率拉满。原文
05:14Ate-a-Pi@svpinoCheckmarx对2350名工程师的调查显示,依赖AI生成代码的公司漏洞部署率是较少使用AI公司的3.4倍。96%的开发者使用安全工具,但仅9%的公司能在三个月内修复90%以上已发现的漏洞。75%的团队承认曾发布明知有缺陷的代码,30%因认为无人发现而为之。报告指出AI生成代码的安全隐患已成为严重问题。行业CheckmarxAI生成代码漏洞安全工具AI安全推荐理由:Checkmarx报告用数据告诉你:AI写代码虽快,但漏洞风险飙升,别只图效率忽视安全。原文
05:13Ate-a-Pi@svpinoViktor是一个专为Microsoft Teams设计的AI员工。用户可以直接在Teams频道中要求它拉取数据并生成摘要。Viktor能自动拉取结果、撰写分析报告,并将内容发布到频道中。它让团队协作中的信息汇总变得自动化。AI产品Microsoft TeamsViktor智能体数据分析1 个信源在谈推荐理由:Viktor这个AI员工能在Teams里自动拉数据、写分析、发报告,跟真实同事一样高效。原文
05:12Ate-a-Pi@svpino用户在 Mac 使用 17 年后,尝试在 Framework 13 Pro 笔记本上全职使用 Omarchy Linux 发行版 90 天,已满 30 天。他喜欢 Hyprland 平铺窗口系统和完全可自定义的配置(所有设置保存在文本文件中),并提到 Claude Code 能有效辅助系统配置。但 Omarchy 仍有不少 bug,音频和蓝牙体验不佳,许多专业应用及外设驱动缺乏 Linux 版本,且缺少 AirDrop、Continuity 等苹果生态功能。他感觉操作速度远超鼠标,但日常小问题仍让他怀念 Mac。技巧LinuxOmarchyHyprlandFramework 13经验分享推荐理由:想换 Linux 但担心体验?看看这位老 Mac 用户 30 天的真实吐槽和爽点,全是细节。原文
05:07GitHub@github精选MicrosoftAI 的 MAI-Code-1-Flash 模型现已扩展至 GitHub Copilot CLI 和 GitHub Copilot 应用。该模型专为 Copilot 设计调优,在其尺寸下提供最佳质量。早期测试中,它超越其他小模型。AI模型MAI-Code-1-FlashMicrosoftGitHub Copilot编程助手推荐理由:微软把专为 Copilot 调的小模型放到命令行了,代码质量比别的小模型好,试试吧。原文
05:01a16z@a16za16z合伙人Anish Acharya在纽约证券交易所发表观点,认为AI能让消费者在医疗、养老等领域获得更多信息与自主权,减少次优决策。他指出这项技术不仅带来经济效益,更是亲社会的技术,能促进人类福祉。Acharya强调,从细节看AI已经在这样做了。行业a16zAnish AcharyaAI赋能消费者社会影响推荐理由:听听a16z大佬怎么说AI让普通人掌握主动权,尤其医疗养老这些老大难问题。原文
04:40Greg Brockman@gdb精选OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流(如填写费用报告或提交休假申请),系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。AI产品CodexOpenAIRecord & Replay工作流自动化AI编程助手10 个信源在谈推荐理由:OpenAI 给 Codex 加了个新玩法:你演示一次操作,它就能学会并复用,比如填报销单。还能编辑保存的技能,挺实用。原文
04:33Marc Andreessen@pmarcaPew Research Center最新数据显示,约50%的美国成年人报告使用AI聊天机器人,较2024年夏季(约30%)大幅上升。其中25%的用户每天使用这些工具,表明AI聊天机器人正快速普及。该报告基于2026年的调查,反映了AI技术从少数用户向主流社会的渗透速度之快。行业Pew Research CenterAI聊天机器人采用率行业报告推荐理由:Pew的调查数据告诉你,AI聊天机器人普及有多快:半年内用户翻倍,每天都有1/4美国人在用。原文
04:32The Rundown AI@therundownaiOpenAI于3月取消了与迪士尼的10亿美元合作计划。迪士尼幻想工程随后与Adobe合作,利用自家IP(米奇、冰雪奇缘、汽车总动员)训练AI,旨在加速主题公园设计。迪士尼还宣布将在7月推出新的beta工具,该工具能为小广告主生成完整电视广告(包括脚本、视频和音乐)。该工具主要面向预算有限、无法负担创意代理的小型企业。行业DisneyOpenAIAdobe广告生成视频生成10 个信源在谈推荐理由:迪士尼不跟OpenAI玩了,自己联手Adobe用经典IP训练AI,还要出广告生成工具,挺实在的。原文
04:32宝玉@dotey精选73°OpenAI Codex 桌面端新增 Record & Replay 功能,允许用户在 Mac 上录制一系列操作,Codex 自动生成可编辑的 Skill 文件。目前仅支持 macOS,欧盟地区不可用,使用前需开启 Computer Use。该功能旨在简化日常重复性任务,如报销填单、发布视频、创建 issue 等。录制完成后,用户可在新对话中调用 Skill 并传入不同参数,由 Codex 结合 Computer Use、浏览器和插件自动执行。AI产品OpenAI CodexRecord & ReplayComputer Use自动化智能体10 个信源在谈推荐理由:OpenAI Codex 这次不用你写指令了,Mac 上演示一遍操作就能生成可复用的 Skill,下次改改参数自动跑,报销填单之类的好用了。原文
04:31Latent.Space@latentspacepod73°AMP 创始人 Anjney Midha 在播客中分享 Google 内部将 95% GPU 利用率视为“故障”的标准,指出单纯购买更多 GPU 已非 AI 竞争核心。他介绍 AMP 正推动将 FLOPs 像兆瓦级电力一样调度,并警告数据中心阻力可能成为 AI 最大瓶颈之一。同时分析 Anthropic 通过独特文化和准备在编码领域取得突破,DeepMind 的研究囤积导致市场失灵,强调下一个前沿属于能在计算、资本、文化和科学上“最大化输出”的团队。行业AnthropicDeepMindAMPGPU数据中心计算效率10 个信源在谈推荐理由:想知道为什么买更多 GPU 不灵了?Anthropic 是怎么靠文化和准备搞定编码的?AMP 创始人讲得特别透,全是内行视角的干货。原文
04:28marktechpost@Asif RazzaqPerplexity推出了Brain,一种自我改进的记忆系统,专门用于其Computer agent。Brain记录代理工作的历史,包括成功、失败和修正,并构建可追溯的上下文图。它会在夜间自动分析这些记录,优化后续行为。早期测试显示,Brain在正确性、召回率和成本方面均有提升。AI产品PerplexityBrainComputer Agent智能体自我改进推荐理由:Perplexity给自家Agent装了个能记住工作过程、夜里自学的大脑,据说测试下来又快又准还省钱。原文
04:25Clement Delangue@ClementDelangue精选Poolside 发布了其最新模型 Laguna M.1,拥有 256K 上下文长度。该模型采用 Apache 2.0 许可,权重已开放至 Hugging Face。包括基础版和微调版检查点可供下载。AI模型PoolsideLaguna M.1Hugging Face开源模型长上下文2 个信源在谈推荐理由:Poolside 把最强的 Laguna M.1 模型完全开放了,256K 上下文,Apache 2.0 许可,直接去 Hugging Face 下载权重用。原文
04:21Cursor@cursor_ai精选/automate 是 Cursor 新推出的智能体技能,用户只需用自然语言描述任务即可完成自动化配置。Cursor 会自动设置触发器、指令和工具,无需手动编写代码。该功能旨在降低自动化流程的搭建门槛。AI产品Cursor/automate智能体自动化自然语言5 个信源在谈推荐理由:Cursor 新技能,说句话就能让智能体帮你配自动化流程,省掉写代码的麻烦。原文
04:20Cursor@cursor_ai精选Cursor 发布了新更新,新增针对 GitHub Issues、代码审查和 Workflow 运行的触发器。Cloud Agents 获得了计算机使用(computer use)能力,可执行更复杂的云端自动化操作。完整变更日志已发布在 cursor.com/changelog 上。AI产品CursorGitHubCloud Agents编程助手自动化6 个信源在谈推荐理由:Cursor 给云端智能体加了电脑操控能力,还能用 GitHub 事件自动触发,做自动化工作流很方便。原文
04:09a16z@a16za16z GP Anish Acharya 在纽约证券交易所的访谈中指出,非程序员过去只能通过 YouTube 成为创作者,现在 AI agents 让他们能凭借非技术背景开发软件。他认为这是被低估的新现象,将很快出现。该观点源于对青少年数字创业趋势的观察,强调 AI 降低了软件开发门槛。行业a16zAI agents非程序员创业数字创业推荐理由:a16z 投资人点出了 AI agents 的核心价值:让不会写代码的人也能做软件创业,不再只依赖 YouTube 当网红。原文
04:08Aravind Srinivas@AravSrinivasAravSrinivas在X上发推指出Context graphs是企业部署智能体框架的最佳方案。推文获得34次转发、19条评论、354个点赞。他指出许多公司存在跨工具上下文碎片化问题。自改进、自组织的全局视图能够捕获隐性知识。推文还获得84次收藏和18123次查看。行业上下文图智能体企业AI隐性知识推荐理由:Perplexity CEO说,用上下文图把公司散落的工具信息整合起来,还能自学习,组智能体更好用。原文
04:07Amjad Masad@amasadReplit 宣布集成到 Slack,通过 Slackbot 的 MCP 客户端,用户可以在聊天中直接使用 Replit 构建应用。该客户端已支持超过 20 个合作伙伴应用,包括 Amplitude 实时图表、Linear 任务更新和 Canva 设计创建。所有操作无需离开对话界面,支持多人协作。AI产品ReplitSlackMCP/工具编程助手4 个信源在谈推荐理由:Replit 现在跟 Slack 打通了,不用来回切换,直接在聊天框里写代码、拉数据、改任务,太方便了!原文
04:02Browser Use@browser_useBrowser Use发布了B浏览器代理模板,基于Eve by Vercel构建。该模板使用Browser Use Cloud浏览器和browser-harness,支持实时浏览。用户只需简单配置即可快速部署一个可运行的浏览器代理。示例展示了从创建到运行的完整流程。技巧Browser UseBEve浏览器代理部署推荐理由:Browser Use搞了个浏览器代理模板B,几分钟就能部署,还能实时看它上网干活,超简单。原文
04:02lmarena.ai@lmarena_ai82°Agent Arena推出了因果追踪方法论,通过分析人类与AI代理协作的追踪数据来量化协作的真实价值,并能观测到广泛的模型行为。基于该方法的新排行榜显示,GLM-5.2 (Max)进入前十,成为最强开源模型,确认成功率比基线高+9.4%,表扬-抱怨比高+14.9%。Claude Fable 5在几乎所有指标上曾排名第一,但因美国政府指令暂停访问。排行榜基于数百万个真实世界长期代理任务,使用因果追踪评估模型相对于平均模型的表现。AI模型Agent ArenaGLM-5.2Claude Fable 5Anthropic智能体10 个信源在谈推荐理由:想看看人机协作到底有没有用?Agent Arena拿数据说话,GLM-5.2开源最强,Claude Fable 5刚登顶就被叫停,这瓜值得吃。原文
03:46Jeff Dean@JeffDean73°Jeff Dean宣布一篇将发表于IEEE Micro 2026年7/8月刊的论文,详细回顾Google从TPU v2到Ironwood共五代训练超算的架构演变。论文披露TPU每芯片每瓦TFLOPS提升了约30倍,每个pod的芯片数从TPU v2的256颗扩增至Ironwood的9216颗。冷却方式从风冷(TPU v2)转为水冷(TPU v3起),互连从2D torus升级为3D torus。论文还指出工作负载已大幅转向Transformer模型。论文TPUGoogleIronwoodAI芯片能效1 个信源在谈推荐理由:想看TPU五代真实进化数据和能效提升细节?这篇论文从256芯片到9216芯片、从风冷到水冷、30倍每瓦算力提升,全是硬货。原文
03:37Jerry Liu@jerryjliu0LlamaIndex 推出 LiteParse v2.1,号称全球最快的 PDF 转 Markdown 解析器。在 olmOCR0-bench、opendataloader-bench 和 ParseBench 三个标准化基准上,其准确率超过 pymupdf4llm、opendataloader、pdf-inspector、markitdown 等所有开源无模型解析器。该工具完全开源(Apache 2.0)且免费,支持 CLI、Rust、Node、Python 和 WASM 调用,也可作为一键 Agent Skill 安装。AI产品LiteParseLlamaIndexPDF解析Markdown转换开源工具1 个信源在谈推荐理由:LlamaIndex 出了个新工具 LiteParse v2.1,专门把 PDF 转成 Markdown,速度最快,准确率还吊打同类开源方案,免费直接用。原文
03:31宝玉@doteyClaude Code 推出了 Artifacts 功能,允许用户从对话中创建交互式页面(如 PR 审查或项目仪表盘)。页面可通过私有链接与团队成员共享。该功能目前处于 beta 阶段,仅适用于 Team 和 Enterprise 计划。相比此前 Codex 的 Sites 功能,Claude Code 降低了使用门槛。AI产品Claude CodeArtifactsClaude编程助手团队协作推荐理由:Claude Code 现在能一键生成交互页面共享给团队,协作更方便,比 Codex Sites 更好上手。原文
03:29Decoder@Matthias BastianOpenAI发布了ChatGPT的医疗功能升级,基于GPT-5.5 Instant模型。在内部对比测试中,该模型在准确性、清晰度和完整性上均超过医生撰写的答案。健康相关陈述的错误率降低了71%。OpenAI声称这是医疗问答能力的一次显著提升。AI模型GPT-5.5ChatGPTOpenAI医疗AI10 个信源在谈推荐理由:OpenAI用GPT-5.5 Instant让ChatGPT在医疗问答上比医生答得更好,准确率提升了71%,值得试。原文
03:28Decoder@Matthias BastianAnthropic 为 Claude Code 新增 Artifacts 功能,将编码会话结果转化为交互式网页。页面从完整会话上下文提取内容,并能在数据变更时自动更新。该功能保留了版本历史,方便团队成员查看和协作。开发者可以通过共享链接让他人访问这些实时生成的页面。AI产品Claude CodeAnthropicArtifacts编程助手协作10 个信源在谈推荐理由:Anthropic 给 Claude Code 加了 Artifacts,编码结果能一键变成可分享的交互网页,自动更新还能看历史版本,团队协作超方便。原文
03:18OpenAI Blog(博客/媒体)OpenAI为ChatGPT Enterprise推出了新的支出控制和用量分析功能。管理员可设置预算限额并实时监控使用趋势。这些工具帮助组织更精准地管理AI成本,支持安全规模化部署。目前该功能已面向所有企业用户开放。AI产品ChatGPT EnterpriseOpenAI企业应用成本管理用量分析10 个信源在谈推荐理由:OpenAI给企业版ChatGPT加了支出控制和用量分析,以后管团队花多少钱用多少量就方便多了,不用等月底账单吓一跳。原文
03:09Sebastian Raschka@rasbt73°GLM-5.2是智谱发布的最新开放权重模型,基于GLM-5和GLM-5.1架构,复用了DeepSeek V3.2的Multi-head Latent Attention(MLA)和DeepSeek Sparse Attention(DSA)机制。新增的IndexShare机制在每四层运行一次完整索引器,后续三层复用选中的token索引,使100万token推理成本大幅降低。目前GLM-5.2在开放权重模型中表现最佳。AI模型GLM-5.2DeepSeek V3.2IndexShare推理模型开源模型2 个信源在谈推荐理由:智谱的GLM-5.2开放权重模型,用DeepSeek V3.2的注意力机制加上自己的IndexShare,把1M长上下文推理搞便宜了,值得看看。原文
03:08vLLM@vllm_project精选72°Anyscale 与 Google Cloud GKE 合作推出 Ray Serve LLM 新版本,在 vLLM 基础上实现显著性能飞跃。预填密集型负载吞吐量提升 4.4 倍,解码密集型负载提升 24 倍。三个关键优化包括:控制平面端点选择器的直接流式传输、新的 vLLM Ray V2 执行器后端、以及基于 HAProxy 的 C 语言级路由。Ray 的容错、可观察性和跨 K8s/VM 可移植性为复杂推理部署奠定基础。AI模型Ray Serve LLMvLLMAnyscaleGoogle Cloud推理优化推荐理由:Anyscale 和 Google Cloud 联手让 vLLM 推理快了好几倍,预填负载快 4.4 倍,解码负载快 24 倍,用 Ray V2 执行器就能体验。原文
03:07Mike Krieger@mikeykClaude Code新增Artifacts功能,可创建交互式页面,如PR回顾或项目仪表板。这些页面通过私有链接与团队共享,目前以Beta形式面向Team和Enterprise计划用户。Labs团队与Claude Code团队合作开发该功能,鼓励让Claude通过Artifacts解释其思考过程。AI产品Claude CodeArtifactsAnthropic编程助手团队协作10 个信源在谈推荐理由:Claude Code现在能生成交互式页面了,比如PR回顾或者项目面板,还能生成链接直接分享给团队。用它做代码审查演示很方便。原文
03:07Claude@claudeaiClaude Code 推出了 Artifacts 功能,能从当前会话构建交互式页面,如 PR walkthrough 或项目仪表盘。用户可生成私人链接与团队成员分享。该功能目前以 Beta 版本提供给 Team 和 Enterprise 计划用户。AI产品Claude CodeArtifactsAnthropic产品功能协作10 个信源在谈推荐理由:Claude Code 新出了 Artifacts,能把聊天中的代码和思路变成可交互的页面发链接分享给团队,做 Code Review 很方便。原文
03:04vLLM@vllm_project精选Poolside 发布开源智能体编程模型 Laguna M.1,采用 70 层稀疏 MoE 架构,总参数量 225B,每 token 激活 23B,支持 256K 上下文。模型使用 256 个专家,top-k=16 路由,专为长程智能体编程设计。支持工具调用间交错推理,可每请求切换,采用 Apache 2.0 许可。vLLM v0.21.0 已提供 Day-0 支持。AI模型Laguna M.1Poolside开源模型编程助手智能体2 个信源在谈推荐理由:Poolside 刚开源了 Laguna M.1,225B 参数的智能体编程模型,256K 上下文,vLLM 已原生支持,想玩 agentic coding 的可以试试。原文