全部 AI 动态 · AI 热点

AITOP

6月19日

06:40

Stanford AI Lab@StanfordAILab

精选

斯坦福AI实验室发布M*运行时，用于统一服务多模态模型。相比专业系统，M*在omni TTS任务上提速2.7倍，在world-model rollouts任务上提速12.5倍。它匹配或超越所有专门系统的性能。

AI产品 M*斯坦福多模态运行时

推荐理由：斯坦福新发的M*运行时，一个系统就能搞定各种多模态模型，速度比专业方案快2到12倍，值得做部署的看看。

原文

06:39

OpenAI@OpenAI

精选

OpenAI发布测试结果，评估模型对齐在压力下的表现。在对抗性提示下，模型更难被引导至有害行为，同时依然能响应有益指令。初步证据表明，模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性，未提及具体模型版本或基准分数。

AI模型 OpenAI 对齐对抗性提示有害微调鲁棒性

推荐理由：OpenAI发现他们的模型在对抗压力下挺得住，不容易被带坏，安全对齐效果不错。

原文

06:38

Greg Brockman@gdb

精选72°

OpenAI 与波士顿儿童医院及哈佛大学合作，在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例，她从 9 岁起持续肌肉无力，在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。

AI模型 OpenAI o3 Deep Research 罕见病推理模型医疗AI

推荐理由：OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例，找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁，终于有了答案。这 AI 真的能救命。

原文

06:37

OpenAI@OpenAI

OpenAI 发布声明称，这是朝向更鲁棒有益和对齐模型的早期步骤。他们正在训练模型将有益特质带入新情境，使AI在能力增强的同时变得更可靠、透明和有用。该工作属于对齐研究的一部分，尚未披露具体模型或基准测试结果。

AI模型 OpenAI AI安全对齐

推荐理由：OpenAI 开始教模型把好习惯带到新场景，让AI更靠谱。这个对齐实验挺关键，关注未来进展。

原文

06:25

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue认为，事后API护栏无法消除模型的危险能力，只能隐藏在脆弱的接口后面，容易被越狱（jailbroken）。他建议不要训练高风险能力，除非有强评估、理由和遏制措施；采用分阶段发布（staged release），从可信测试者到更广泛访问，并开放发布以透明和问责。他呼吁大力支持开源AI，缩小封闭实验室和政府之间的能力差距；推动独立评估，而非信任黑盒API；赋予执法、法院、监管者、审计员、记者和公民社会强大的AI工具来检测和追究非法使用。

行业 AI安全开源模型独立评估分阶段发布 API护栏

推荐理由：Hugging Face CEO提出一个务实的AI安全路线：别只靠事后护栏，要加强独立评估、分阶段发布和开源生态。

原文

06:22

OpenAI@OpenAI

73°

OpenAI发布新研究，旨在训练AI模型将有益和安全行为推广到训练范围之外的新领域，并在压力下维持。该方法聚焦于让模型具备广泛且持久的利他性，论文名为《Beneficial RL》。研究通过强化学习框架，让模型学会在更长、更高风险的任务中自主保持符合人类意图的行为，而不仅是拟合训练数据。相关论文和代码已发布在alignment.openai.com/beneficial-rl/。

论文 OpenAI AI安全智能体强化学习

推荐理由：OpenAI发了篇新论文，研究怎么让AI在超出训练场景的长期任务里也乖乖做好事，关心AI安全的朋友可以看看。

原文

06:13

cat@_catwu

72°

Claude Team 与 Claude Enterprise 用户现可通过 Claude Code 部署 HTML 网站并与团队成员分享。新功能 Artifacts 能从会话中生成交互式页面，例如 PR 审查或项目仪表板，并通过私有链接共享。该功能目前以公测形式提供给 Team 和 Enterprise 计划。Artifacts 改变了内部沟通方式，适用于架构变更、数据分析和原型展示。

AI产品 Claude Claude Code Artifacts 团队协作 HTML部署

推荐理由：Claude Code 出了 Artifacts，可以在团队里建交互页面并分享私有链接，做 PR 审查或项目仪表板特别方便。

原文

06:02

Dify@dify_ai

Dify指出企业AI项目常犯的错误是花数月时间重建模型编排、知识检索、监控、权限等底层平台。一个生产就绪的AI平台应直接提供模型灵活性（可切换供应商）、内置RAG（基于自有数据）、工作流编排（业务人员可读）以及监控与访问控制。这样IT团队就能专注交付业务价值，更快将更多应用推上线。

技巧 Dify 企业AI AI平台 RAG 工作流编排

推荐理由：Dify告诉你别重复造轮子，用现成平台更快把AI应用推上线，专注业务价值少踩坑。

原文

05:34

宝玉@dotey

精选76°

Anthropic 在 Claude Code CLI 和桌面应用中新增 Artifact 功能，可将终端会话内容（如 PR 走查、调试时间线、发布清单）生成实时更新的私有网页，团队成员通过链接可直接查看。Artifact 会利用当前会话的完整上下文（包括代码库、外部工具和对话内容）自动更新，历史版本可回溯。该功能以 beta 形式向 Claude Team 和 Enterprise 组织开放，个人用户暂时无法使用。

AI产品 Claude Code Artifact Anthropic 团队协作编程助手

推荐理由：Claude Code 能把终端里的调试记录、PR 走查一键变成网页发给队友，不用再口述解释 agent 做了什么，适合团队协作。

原文

05:16

Ate-a-Pi@svpino

一个AI代理产品允许用户直接标记目标并用自然语言下达指令，无需学习任何提示词技巧或理解工作原理。用户只需说出需求，代理即可自动执行并回答。这种零门槛交互方式大幅降低了AI使用门槛，使得更多非技术用户能够轻松上手。该产品因简单易用而逐渐流行起来。

技巧智能体自然语言交互零门槛

推荐理由：这个AI代理不用学提示词，直接说话就行，效率拉满。

原文

05:14

Ate-a-Pi@svpino

Checkmarx对2350名工程师的调查显示，依赖AI生成代码的公司漏洞部署率是较少使用AI公司的3.4倍。96%的开发者使用安全工具，但仅9%的公司能在三个月内修复90%以上已发现的漏洞。75%的团队承认曾发布明知有缺陷的代码，30%因认为无人发现而为之。报告指出AI生成代码的安全隐患已成为严重问题。

行业 Checkmarx AI生成代码漏洞安全工具 AI安全

推荐理由：Checkmarx报告用数据告诉你：AI写代码虽快，但漏洞风险飙升，别只图效率忽视安全。

原文

05:13

Ate-a-Pi@svpino

Viktor是一个专为Microsoft Teams设计的AI员工。用户可以直接在Teams频道中要求它拉取数据并生成摘要。Viktor能自动拉取结果、撰写分析报告，并将内容发布到频道中。它让团队协作中的信息汇总变得自动化。

AI产品 Microsoft Teams Viktor 智能体数据分析

推荐理由：Viktor这个AI员工能在Teams里自动拉数据、写分析、发报告，跟真实同事一样高效。

原文

05:12

Ate-a-Pi@svpino

用户在 Mac 使用 17 年后，尝试在 Framework 13 Pro 笔记本上全职使用 Omarchy Linux 发行版 90 天，已满 30 天。他喜欢 Hyprland 平铺窗口系统和完全可自定义的配置（所有设置保存在文本文件中），并提到 Claude Code 能有效辅助系统配置。但 Omarchy 仍有不少 bug，音频和蓝牙体验不佳，许多专业应用及外设驱动缺乏 Linux 版本，且缺少 AirDrop、Continuity 等苹果生态功能。他感觉操作速度远超鼠标，但日常小问题仍让他怀念 Mac。

技巧 Linux Omarchy Hyprland Framework 13 经验分享

推荐理由：想换 Linux 但担心体验？看看这位老 Mac 用户 30 天的真实吐槽和爽点，全是细节。

原文

05:07

GitHub@github

精选

MicrosoftAI 的 MAI-Code-1-Flash 模型现已扩展至 GitHub Copilot CLI 和 GitHub Copilot 应用。该模型专为 Copilot 设计调优，在其尺寸下提供最佳质量。早期测试中，它超越其他小模型。

AI模型 MAI-Code-1-Flash Microsoft GitHub Copilot 编程助手

推荐理由：微软把专为 Copilot 调的小模型放到命令行了，代码质量比别的小模型好，试试吧。

原文

05:01

a16z@a16z

a16z合伙人Anish Acharya在纽约证券交易所发表观点，认为AI能让消费者在医疗、养老等领域获得更多信息与自主权，减少次优决策。他指出这项技术不仅带来经济效益，更是亲社会的技术，能促进人类福祉。Acharya强调，从细节看AI已经在这样做了。

行业 a16z Anish Acharya AI赋能消费者社会影响

推荐理由：听听a16z大佬怎么说AI让普通人掌握主动权，尤其医疗养老这些老大难问题。

原文

04:40

Greg Brockman@gdb

精选

OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流（如填写费用报告或提交休假申请），系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。

AI产品 Codex OpenAI Record & Replay 工作流自动化 AI编程助手

推荐理由：OpenAI 给 Codex 加了个新玩法：你演示一次操作，它就能学会并复用，比如填报销单。还能编辑保存的技能，挺实用。

原文

04:33

Marc Andreessen@pmarca

Pew Research Center最新数据显示，约50%的美国成年人报告使用AI聊天机器人，较2024年夏季（约30%）大幅上升。其中25%的用户每天使用这些工具，表明AI聊天机器人正快速普及。该报告基于2026年的调查，反映了AI技术从少数用户向主流社会的渗透速度之快。

行业 Pew Research Center AI聊天机器人采用率行业报告

推荐理由：Pew的调查数据告诉你，AI聊天机器人普及有多快：半年内用户翻倍，每天都有1/4美国人在用。

原文

04:32

The Rundown AI@therundownai

OpenAI于3月取消了与迪士尼的10亿美元合作计划。迪士尼幻想工程随后与Adobe合作，利用自家IP（米奇、冰雪奇缘、汽车总动员）训练AI，旨在加速主题公园设计。迪士尼还宣布将在7月推出新的beta工具，该工具能为小广告主生成完整电视广告（包括脚本、视频和音乐）。该工具主要面向预算有限、无法负担创意代理的小型企业。

行业 Disney OpenAI Adobe 广告生成视频生成

推荐理由：迪士尼不跟OpenAI玩了，自己联手Adobe用经典IP训练AI，还要出广告生成工具，挺实在的。

原文

04:32

宝玉@dotey

精选73°

OpenAI Codex 桌面端新增 Record & Replay 功能，允许用户在 Mac 上录制一系列操作，Codex 自动生成可编辑的 Skill 文件。目前仅支持 macOS，欧盟地区不可用，使用前需开启 Computer Use。该功能旨在简化日常重复性任务，如报销填单、发布视频、创建 issue 等。录制完成后，用户可在新对话中调用 Skill 并传入不同参数，由 Codex 结合 Computer Use、浏览器和插件自动执行。

AI产品 OpenAI Codex Record & Replay Computer Use 自动化智能体

推荐理由：OpenAI Codex 这次不用你写指令了，Mac 上演示一遍操作就能生成可复用的 Skill，下次改改参数自动跑，报销填单之类的好用了。

原文

04:31

Latent.Space@latentspacepod

73°

AMP 创始人 Anjney Midha 在播客中分享 Google 内部将 95% GPU 利用率视为“故障”的标准，指出单纯购买更多 GPU 已非 AI 竞争核心。他介绍 AMP 正推动将 FLOPs 像兆瓦级电力一样调度，并警告数据中心阻力可能成为 AI 最大瓶颈之一。同时分析 Anthropic 通过独特文化和准备在编码领域取得突破，DeepMind 的研究囤积导致市场失灵，强调下一个前沿属于能在计算、资本、文化和科学上“最大化输出”的团队。

行业 Anthropic DeepMind AMP GPU 数据中心计算效率

推荐理由：想知道为什么买更多 GPU 不灵了？Anthropic 是怎么靠文化和准备搞定编码的？AMP 创始人讲得特别透，全是内行视角的干货。

原文

04:28

marktechpost@Asif Razzaq

Perplexity推出了Brain，一种自我改进的记忆系统，专门用于其Computer agent。Brain记录代理工作的历史，包括成功、失败和修正，并构建可追溯的上下文图。它会在夜间自动分析这些记录，优化后续行为。早期测试显示，Brain在正确性、召回率和成本方面均有提升。

AI产品 Perplexity Brain Computer Agent 智能体自我改进

推荐理由：Perplexity给自家Agent装了个能记住工作过程、夜里自学的大脑，据说测试下来又快又准还省钱。

原文

04:25

Clement Delangue@ClementDelangue

精选

AI模型 Poolside Laguna M.1 Hugging Face 开源模型长上下文

推荐理由：Poolside 把最强的 Laguna M.1 模型完全开放了，256K 上下文，Apache 2.0 许可，直接去 Hugging Face 下载权重用。

原文

04:21

Cursor@cursor_ai

精选

/automate 是 Cursor 新推出的智能体技能，用户只需用自然语言描述任务即可完成自动化配置。Cursor 会自动设置触发器、指令和工具，无需手动编写代码。该功能旨在降低自动化流程的搭建门槛。

AI产品 Cursor /automate 智能体自动化自然语言

推荐理由：Cursor 新技能，说句话就能让智能体帮你配自动化流程，省掉写代码的麻烦。

原文

04:20

Cursor@cursor_ai

精选

Cursor 发布了新更新，新增针对 GitHub Issues、代码审查和 Workflow 运行的触发器。Cloud Agents 获得了计算机使用（computer use）能力，可执行更复杂的云端自动化操作。完整变更日志已发布在 cursor.com/changelog 上。

AI产品 Cursor GitHub Cloud Agents 编程助手自动化

推荐理由：Cursor 给云端智能体加了电脑操控能力，还能用 GitHub 事件自动触发，做自动化工作流很方便。

原文

04:09

a16z@a16z

a16z GP Anish Acharya 在纽约证券交易所的访谈中指出，非程序员过去只能通过 YouTube 成为创作者，现在 AI agents 让他们能凭借非技术背景开发软件。他认为这是被低估的新现象，将很快出现。该观点源于对青少年数字创业趋势的观察，强调 AI 降低了软件开发门槛。

行业 a16z AI agents 非程序员创业数字创业

推荐理由：a16z 投资人点出了 AI agents 的核心价值：让不会写代码的人也能做软件创业，不再只依赖 YouTube 当网红。

原文

04:08

Aravind Srinivas@AravSrinivas

AravSrinivas在X上发推指出Context graphs是企业部署智能体框架的最佳方案。推文获得34次转发、19条评论、354个点赞。他指出许多公司存在跨工具上下文碎片化问题。自改进、自组织的全局视图能够捕获隐性知识。推文还获得84次收藏和18123次查看。

行业上下文图智能体企业AI 隐性知识

推荐理由：Perplexity CEO说，用上下文图把公司散落的工具信息整合起来，还能自学习，组智能体更好用。

原文

04:07

Amjad Masad@amasad

Replit 宣布集成到 Slack，通过 Slackbot 的 MCP 客户端，用户可以在聊天中直接使用 Replit 构建应用。该客户端已支持超过 20 个合作伙伴应用，包括 Amplitude 实时图表、Linear 任务更新和 Canva 设计创建。所有操作无需离开对话界面，支持多人协作。

AI产品 Replit Slack MCP/工具编程助手

推荐理由：Replit 现在跟 Slack 打通了，不用来回切换，直接在聊天框里写代码、拉数据、改任务，太方便了！

原文

04:02

Browser Use@browser_use

Browser Use发布了B浏览器代理模板，基于Eve by Vercel构建。该模板使用Browser Use Cloud浏览器和browser-harness，支持实时浏览。用户只需简单配置即可快速部署一个可运行的浏览器代理。示例展示了从创建到运行的完整流程。

技巧 Browser Use B Eve 浏览器代理部署

推荐理由：Browser Use搞了个浏览器代理模板B，几分钟就能部署，还能实时看它上网干活，超简单。

原文

04:02

lmarena.ai@lmarena_ai

82°

Agent Arena推出了因果追踪方法论，通过分析人类与AI代理协作的追踪数据来量化协作的真实价值，并能观测到广泛的模型行为。基于该方法的新排行榜显示，GLM-5.2 (Max)进入前十，成为最强开源模型，确认成功率比基线高+9.4%，表扬-抱怨比高+14.9%。Claude Fable 5在几乎所有指标上曾排名第一，但因美国政府指令暂停访问。排行榜基于数百万个真实世界长期代理任务，使用因果追踪评估模型相对于平均模型的表现。

AI模型 Agent Arena GLM-5.2 Claude Fable 5 Anthropic 智能体

推荐理由：想看看人机协作到底有没有用？Agent Arena拿数据说话，GLM-5.2开源最强，Claude Fable 5刚登顶就被叫停，这瓜值得吃。

原文

03:46

Jeff Dean@JeffDean

73°

Jeff Dean宣布一篇将发表于IEEE Micro 2026年7/8月刊的论文，详细回顾Google从TPU v2到Ironwood共五代训练超算的架构演变。论文披露TPU每芯片每瓦TFLOPS提升了约30倍，每个pod的芯片数从TPU v2的256颗扩增至Ironwood的9216颗。冷却方式从风冷（TPU v2）转为水冷（TPU v3起），互连从2D torus升级为3D torus。论文还指出工作负载已大幅转向Transformer模型。

论文 TPU Google Ironwood AI芯片能效

推荐理由：想看TPU五代真实进化数据和能效提升细节？这篇论文从256芯片到9216芯片、从风冷到水冷、30倍每瓦算力提升，全是硬货。

原文

03:37

Jerry Liu@jerryjliu0

LlamaIndex 推出 LiteParse v2.1，号称全球最快的 PDF 转 Markdown 解析器。在 olmOCR0-bench、opendataloader-bench 和 ParseBench 三个标准化基准上，其准确率超过 pymupdf4llm、opendataloader、pdf-inspector、markitdown 等所有开源无模型解析器。该工具完全开源（Apache 2.0）且免费，支持 CLI、Rust、Node、Python 和 WASM 调用，也可作为一键 Agent Skill 安装。

AI产品 LiteParse LlamaIndex PDF解析 Markdown转换开源工具

推荐理由：LlamaIndex 出了个新工具 LiteParse v2.1，专门把 PDF 转成 Markdown，速度最快，准确率还吊打同类开源方案，免费直接用。

原文

03:31

宝玉@dotey

Claude Code 推出了 Artifacts 功能，允许用户从对话中创建交互式页面（如 PR 审查或项目仪表盘）。页面可通过私有链接与团队成员共享。该功能目前处于 beta 阶段，仅适用于 Team 和 Enterprise 计划。相比此前 Codex 的 Sites 功能，Claude Code 降低了使用门槛。

AI产品 Claude Code Artifacts Claude 编程助手团队协作

推荐理由：Claude Code 现在能一键生成交互页面共享给团队，协作更方便，比 Codex Sites 更好上手。

原文

03:29

Decoder@Matthias Bastian

OpenAI发布了ChatGPT的医疗功能升级，基于GPT-5.5 Instant模型。在内部对比测试中，该模型在准确性、清晰度和完整性上均超过医生撰写的答案。健康相关陈述的错误率降低了71%。OpenAI声称这是医疗问答能力的一次显著提升。

AI模型 GPT-5.5 ChatGPT OpenAI 医疗AI

推荐理由：OpenAI用GPT-5.5 Instant让ChatGPT在医疗问答上比医生答得更好，准确率提升了71%，值得试。

原文

03:28

Decoder@Matthias Bastian

Anthropic 为 Claude Code 新增 Artifacts 功能，将编码会话结果转化为交互式网页。页面从完整会话上下文提取内容，并能在数据变更时自动更新。该功能保留了版本历史，方便团队成员查看和协作。开发者可以通过共享链接让他人访问这些实时生成的页面。

AI产品 Claude Code Anthropic Artifacts 编程助手协作

推荐理由：Anthropic 给 Claude Code 加了 Artifacts，编码结果能一键变成可分享的交互网页，自动更新还能看历史版本，团队协作超方便。

原文

03:18

03:18OpenAI Blog（博客/媒体）

OpenAI为ChatGPT Enterprise推出了新的支出控制和用量分析功能。管理员可设置预算限额并实时监控使用趋势。这些工具帮助组织更精准地管理AI成本，支持安全规模化部署。目前该功能已面向所有企业用户开放。

AI产品 ChatGPT Enterprise OpenAI 企业应用成本管理用量分析

推荐理由：OpenAI给企业版ChatGPT加了支出控制和用量分析，以后管团队花多少钱用多少量就方便多了，不用等月底账单吓一跳。

原文

03:09

Sebastian Raschka@rasbt

73°

AI模型 GLM-5.2 DeepSeek V3.2 IndexShare 推理模型开源模型

推荐理由：智谱的GLM-5.2开放权重模型，用DeepSeek V3.2的注意力机制加上自己的IndexShare，把1M长上下文推理搞便宜了，值得看看。

原文

03:08

vLLM@vllm_project

精选72°

Anyscale 与 Google Cloud GKE 合作推出 Ray Serve LLM 新版本，在 vLLM 基础上实现显著性能飞跃。预填密集型负载吞吐量提升 4.4 倍，解码密集型负载提升 24 倍。三个关键优化包括：控制平面端点选择器的直接流式传输、新的 vLLM Ray V2 执行器后端、以及基于 HAProxy 的 C 语言级路由。Ray 的容错、可观察性和跨 K8s/VM 可移植性为复杂推理部署奠定基础。

AI模型 Ray Serve LLM vLLM Anyscale Google Cloud 推理优化

推荐理由：Anyscale 和 Google Cloud 联手让 vLLM 推理快了好几倍，预填负载快 4.4 倍，解码负载快 24 倍，用 Ray V2 执行器就能体验。

原文

03:07

Mike Krieger@mikeyk

Claude Code新增Artifacts功能，可创建交互式页面，如PR回顾或项目仪表板。这些页面通过私有链接与团队共享，目前以Beta形式面向Team和Enterprise计划用户。Labs团队与Claude Code团队合作开发该功能，鼓励让Claude通过Artifacts解释其思考过程。

AI产品 Claude Code Artifacts Anthropic 编程助手团队协作

推荐理由：Claude Code现在能生成交互式页面了，比如PR回顾或者项目面板，还能生成链接直接分享给团队。用它做代码审查演示很方便。

原文

03:07

Claude@claudeai

Claude Code 推出了 Artifacts 功能，能从当前会话构建交互式页面，如 PR walkthrough 或项目仪表盘。用户可生成私人链接与团队成员分享。该功能目前以 Beta 版本提供给 Team 和 Enterprise 计划用户。

AI产品 Claude Code Artifacts Anthropic 产品功能协作

推荐理由：Claude Code 新出了 Artifacts，能把聊天中的代码和思路变成可交互的页面发链接分享给团队，做 Code Review 很方便。

原文

03:04

vLLM@vllm_project

精选

Poolside 发布开源智能体编程模型 Laguna M.1，采用 70 层稀疏 MoE 架构，总参数量 225B，每 token 激活 23B，支持 256K 上下文。模型使用 256 个专家，top-k=16 路由，专为长程智能体编程设计。支持工具调用间交错推理，可每请求切换，采用 Apache 2.0 许可。vLLM v0.21.0 已提供 Day-0 支持。

AI模型 Laguna M.1 Poolside 开源模型编程助手智能体

推荐理由：Poolside 刚开源了 Laguna M.1，225B 参数的智能体编程模型，256K 上下文，vLLM 已原生支持，想玩 agentic coding 的可以试试。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。