全部 AI 动态 · AI 热点

6月12日

12:27

Sakana AI@SakanaAILabs

Sakana AI 宣布将于 7 月 7 日（周二）在首尔举办晚餐交流会，面向 ICML 2026 参会者。活动旨在为机器学习前沿研究者提供交流与社交空间。名额有限，若申请超额将抽签决定，结果于 6 月 30 日前通知。这是与顶尖 AI 研究者面对面交流的难得机会。

推荐理由：ICML 参会者别错过——Sakana AI 的晚餐会能让你直接和前沿研究者聊技术，名额有限建议尽早申请。

原文

12:26

xiaomimimo@xiaomimimo

精选

小米旗下 MiMo 团队发布了 MiMo Code V0.1，一款开源的终端 AI 编程助手。它内置了 MiMo V2.5 多模态模型，支持百万 token 上下文窗口，并具备无限上下文、智能体-模型协同、设计优先的 Compose 模式、自进化系统、语音输入等功能。该工具兼容 Claude Code，可零成本迁移现有技能和 MCP 服务器，并支持多种主流模型提供商。项目采用 MIT 许可，已在 GitHub 开源。

AI产品编程助手开源/仓库 MiMo Code 多模态模型终端工具

推荐理由：小米把终端 AI 编程助手做成了开源产品，百万 token 上下文和自进化系统对处理大型项目的开发者很实用，兼容 Claude Code 让迁移几乎无感，建议试试。

原文

12:26

Sakana AI@SakanaAILabs

精选

Sakana AI 在东京成立专门研究递归自我改进（RSI）的实验室「RSI Lab」，旨在让 AI 自动生成并改进 AI 模型。该实验室基于此前在 LLM-Squared、The AI Scientist 等项目上的积累，目标是在不依赖无限计算资源的前提下实现 RSI。2026 年以来，RSI 已成为全球 AI 研究的重要趋势，Sakana AI 希望凭借其独特方法，在计算资源有限的日本推动这一领域的发展。实验室将招募全球研究人员和工程师，并与社区共享成果。

行业递归自我改进 Sakana AI RSI Lab AI 研究东京

推荐理由：RSI 是让 AI 自我进化的前沿方向，做 AI 研究和模型开发的团队值得关注——Sakana AI 试图用更少的算力实现它，这对资源有限的团队尤其有启发。

原文

12:25

Sakana AI@SakanaAILabs

精选

Sakana AI 宣布成立递归自我改进（RSI）实验室，专注于用 AI 重新设计 AI 开发流程。该实验室整合了多项突破性成果，包括 LLM² 自动优化偏好算法、Darwin Gödel Machine 自主重写代码库、ShinkaEvolve 高效程序进化等。团队认为递归自我改进可在适度算力下实现，不应被超大规模集群垄断。目前正在东京招募前沿科学家和工程师，以构建开放、自适应的集体自我改进架构。

AI产品 Sakana AI 递归自我改进 AI 自动化东京实验室开源/仓库

推荐理由：Sakana AI 把自我改进 AI 从理论推向实践，整合了多项已验证的技术成果。做 AI 研究和开发的团队值得关注——他们正在探索一条不同于堆算力的路径，可能改变未来 AI 开发范式。

原文

12:24

elvis@omarsar0

Alex Rives 与 UC Berkeley 联合宣布了激光相位板技术，这是原子分辨率成像领域的突破。该技术使用世界上最亮的连续波激光，强度是太阳表面的1亿倍，解决了电子显微镜中相位对比度难以实现的长期难题。在冷冻电子断层扫描中，低对比度一直阻碍着对细胞内除最大蛋白质以外的结构解析。激光相位板消除了这一障碍，结合AI进步，将开启结构生物学新前沿，使科学家能够看到细胞内的分子机器及其复杂动态系统。

论文激光相位板原子分辨率成像冷冻电子断层扫描结构生物学 AI

推荐理由：这项技术解决了冷冻电镜中对比度不足的核心瓶颈，做结构生物学和细胞成像的研究者可以直接关注——它将让AI辅助下的分子机器解析成为现实。

原文

12:22

向阳乔木@vista8

一位用户分享其践行AI First原则，即遇到任何任务先尝试用AI解决。具体案例是使用OpenAI的Codex模型及其Computer Use功能，自动填写Word合同。这展示了AI在办公自动化中的实际应用，尤其适合重复性文档处理场景。该实践降低了手动操作成本，值得关注AI办公效率的团队参考。

AI产品 AI First原则 Codex Computer Use 办公自动化 Word合同

推荐理由：AI First原则是当前高效工作法的核心，用Codex的Computer Use填合同解决了文档自动化的痛点，做行政、法务或日常办公的团队可以直接借鉴。

原文

12:22

向阳乔木@vista8

开发者@vista8分享了使用Fable 5开发在线Photoshop的案例，核心是先用一个专门为AI设计的PRD文档生成Prompt，生成需求文档后再交给AI Agent开发。这种方法能显著提升功能完整度和丰富性，比直接让AI开发更精准高效。视频展示了P0需求点的开发效果，并提供了开源地址和安装指令。

AI产品 AI Agent PRD生成 Fable 5 在线Photoshop 开源/仓库

推荐理由：AI Agent开发效率虽高，但PRD质量直接影响结果——这个专门为AI设计的PRD Prompt解决了需求不精准的痛点，做AI应用开发的团队可以直接拿来用，提升开发效果。

原文

12:20

Tri Dao (FlashAttention)@tri_dao

精选

通过数学重写，研究者发现 Transformer 的所有操作本质上可以归结为一系列 GEMM（通用矩阵乘法）加 epilogue（后处理）。这意味着只要提供几个优化好的基础原语，LLM 甚至新手人类都能为所有 Transformer 操作编写达到光速的内核。这一发现简化了模型优化，让高性能内核的编写门槛大幅降低。

论文 Transformer GEMM 内核优化 LLM 数学重写

推荐理由：对做模型推理优化和内核开发的团队来说，这揭示了 Transformer 的底层统一结构，可以直接用 LLM 生成高效代码，建议关注。

原文

12:20

Tri Dao (FlashAttention)@tri_dao

精选

WentaoGuo7 提出了一种对混合专家模型（MoE）反向传播的数学重写方法，显著降低了激活内存占用，并大幅提升了训练速度，尤其适用于细粒度MoE。该方法还利用了NVIDIA Blackwell架构的新特性（如2CTA MMA和CLC）来构建超快MoE内核。这一进展对于训练大规模MoE模型的团队具有重要意义，能有效缓解内存瓶颈并加速迭代。

AI模型 MoE 反向传播内存优化 Blackwell 加速

推荐理由：做MoE模型训练和推理的开发者，这个数学重写能直接降低你的显存压力并加速训练，尤其适合细粒度MoE场景，建议试试Blackwell新特性带来的性能提升。

原文

12:19

Tri Dao (FlashAttention)@tri_dao

精选

一位开发者宣布，快速 muon 优化器即将支持消费级显卡。所有代码均以 matmul + epilogue 形式编写，因此一旦为 Blackwell 消费级显卡实现了主循环，所有高级对称矩阵乘法即可自动获得光速性能。这意味着普通用户也能在自家显卡上高效运行该优化器，无需依赖专业硬件。

AI模型 muon优化器消费级显卡 Blackwell 矩阵乘法开源/仓库

推荐理由：这个优化器让消费级显卡也能跑出专业级训练性能，做模型微调或自训练的开发者可以直接关注，省下买高端硬件的钱。

原文

12:18

Nat Friedman (Meta)@natfriedman

前 GitHub CEO Nat Friedman 本周正式加入 Meta，负责打造让数十亿人喜爱的 AI 产品。他在推文中表示，虽然不会一蹴而就，但几天下来对前景充满信心。这一人事变动表明 Meta 正在加大 AI 产品化投入，尤其是面向大众市场的消费级 AI 应用。Friedman 在开源和开发者生态方面的经验，可能为 Meta 的 AI 战略带来新视角。

行业 Meta Nat Friedman AI 产品人事变动消费级 AI

推荐理由：Nat Friedman 的加入意味着 Meta 在 AI 产品化上押注更重，关注 AI 消费级应用的从业者和投资者值得留意他的动向。

原文

12:16

向阳乔木@vista8

开发者发现人类喜欢的 PRD 与 AI 理解的 PRD 存在差异，为此专门编写了一个服务于 AI 的 PRD 文档生成 Prompt。该 Prompt 能生成更符合 AI 开发需求的文档，使功能完整度和丰富性远超人工构思。目前已开发为 Skill，可通过 npx skills add joeseesun/qiaomu-ai-prd 安装，开源地址和 Prompt 在评论区。

AI产品 AI Agent PRD 开发效率 Prompt 开源

推荐理由：做 AI 开发或使用 AI Agent 写代码的团队，这个 Prompt 能帮你产出 AI 更易理解的 PRD，减少沟通成本，建议直接试试。

原文

12:14

Mark Chen (OpenAI 研究)@markchen90

Mark Chen 在 X 上发文反驳了某种观点，强调科学在当前时代比以往更重要。他认为未来不能只是向社区大量抛售结果，而需要与科学家合作，利用 AI 加速发现，同时保留科学的艺术性。他对 Sebastien Bubeck 和 ahelkky 两位杰出科学家承担这一使命表示兴奋。这反映了 AI 在科学研究中应扮演辅助角色而非替代者的理念。

行业 AI 加速科学科学发现 AI 与科学家合作 Mark Chen Sebastien Bubeck

推荐理由：AI 与科学交叉领域的从业者值得关注——Mark Chen 点出了当前 AI 应用在科研中的关键误区：不能只追求产出而忽视科学家的创造力。做 AI for Science 的团队可以反思自己的方法论。

原文

12:14

Allen AI (Ai2)@allen_ai

精选

艾伦人工智能研究所发布ModSleuth工具，用于追踪现代大语言模型训练中依赖的其他模型和数据集。研究发现，Olmo 3依赖89个模型和183个数据集，Nemotron 3则依赖273个模型和560个数据集。这表明LLM训练已从纯人类数据转向模型间相互生成、过滤和评估数据的模式。ModSleuth帮助开发者理解模型供应链的复杂性和潜在风险。

论文大语言模型训练数据模型依赖 ModSleuth 艾伦AI研究所

推荐理由：大模型训练越来越依赖其他模型生成数据，做模型开发或数据工程的团队需要理解这种依赖链——ModSleuth能帮你理清关系，建议点开看看。

原文

12:13

MIT CSAIL@MIT_CSAIL

MIT 研究人员指出，许多影响患者护理的 AI 工具可能未受美国 FDA 监管，存在安全隐患。他们建议增加公开披露、加强行业与监管机构的结构化对话，并更新 FDA 指南。这一发现对医疗 AI 领域有重要影响，因为当前监管空白可能导致患者风险。研究呼吁更严格的监管框架以确保 AI 工具的安全性和有效性。

行业医疗 AI FDA 监管患者安全 MIT 研究行业合规

推荐理由：医疗 AI 开发者和管理者需要关注监管合规风险——MIT 的发现揭示了当前监管空白，建议及时调整策略以避免法律和伦理问题。

原文

12:10

vLLM@vllm_project

精选73°

GoogleDeepMind 推出了 DiffusionGemma，这是一个基于 Gemma4 架构的 26B 参数扩散语言模型（dLLM），并成为 vLLM 原生支持的首个扩散语言模型。与传统自回归模型逐个生成 token 不同，DiffusionGemma 能并行去噪 256 个 token 的块，在单张 H200（FP8）上以 batch size 1 实现超过 1200 输出 token/秒的吞吐量。该模型通过 vLLM 的 model runner v2 的 ModelState 和现有推测解码路径实现，对调度器和运行器改动极小。FP8 和 NVFP4 检查点已托管在 RedHat AI 中心，由 GoogleDeepMind、RedHat AI 和 NVIDIA AI 团队合作完成。这一进展标志着扩散模型在高效文本生成领域迈出重要一步。

AI模型扩散语言模型 vLLM GoogleDeepMind 并行生成推理加速

推荐理由：DiffusionGemma 用并行去噪替代逐 token 生成，大幅提升推理速度，做大规模文本生成或实时应用的团队可以直接在 vLLM 中体验，值得关注。

原文

12:10

vLLM@vllm_project

精选

Inferoa 是一个由 @agenticin 构建的社区智能体框架，基于 vLLM 技术栈。它通过推理经济学来塑造智能体循环，包括前缀缓存管理、上下文优化以及在自托管模型和前沿模型之间的路由。该框架旨在帮助开发者更高效地运行智能体，降低推理成本。vLLM 项目团队对此表示期待，并希望开发者能进一步扩展其功能。

AI产品智能体 vLLM 推理优化社区框架开源/仓库

推荐理由：Inferoa 把推理成本优化直接嵌入智能体循环，做智能体应用或自托管模型的开发者值得关注，能帮你省下不少推理开销。

原文

12:09

vLLM@vllm_project

精选

vLLM 宣布对 Cohere 的 North Mini Code 模型提供 Day-0 支持，该模型是一个开源的编码模型，专为智能体工作流设计。模型采用 Mixture-of-Experts 架构，总参数量 30B，活跃参数 3B，支持 256K 上下文和 64K 最大生成长度。它具备推理、工具使用和结构化输出能力，可直接通过最新稳定版 vLLM 部署。这一支持让开发者能快速在 vLLM 上运行该模型，用于构建复杂的智能体应用。

AI产品 vLLM Cohere North Mini Code 编码模型智能体

推荐理由：做智能体工作流和编码应用的开发者，现在可以直接用 vLLM 部署 Cohere 的 North Mini Code 模型，省去适配麻烦，建议试试。

原文

12:09

vLLM@vllm_project

精选

vLLM 项目宣布推出 vime，一个在 vLLM 生态中用于 LLM 后训练的强化学习框架。vime 基于 slime 的训练设计，并利用 vLLM 推理引擎，提供简单、稳定且高效的 RL 训练方案。该框架旨在与 NeMo RL、OpenRLHF、verl 等共存，为用户提供更多选择。vime 的推出丰富了 vLLM 后训练生态，推动互操作性和创新。

AI产品 vLLM RLHF 后训练强化学习开源/仓库

推荐理由：做 LLM 后训练的团队终于有了 vLLM 生态内的 RL 框架选择——vime 简单稳定，直接可用，想尝试不同 RL 框架的开发者值得关注。

原文

12:08

vLLM@vllm_project

精选

vLLM-Omni 项目在 GitHub 上达到 5000 星标，从去年 11 月社区启动至今，已发展为支持 30 多种多模态模型的高效推理引擎。它覆盖 Qwen3-Omni、HunyuanImage-3.0、Wan 2.2、BAGEL、MiMo-Audio 和 Flux2 等模型，并兼容 NVIDIA、AMD、华为昇腾、Intel 等多种硬件。该项目致力于提供可扩展、开源的多模态推理方案，吸引了大量社区贡献。

AI产品 vLLM-Omni 多模态推理开源/仓库推理引擎 GitHub Stars

推荐理由：多模态推理开发者终于有了一个统一的高效引擎——vLLM-Omni 支持 30+ 模型和多种硬件，做多模态应用或推理优化的团队可以直接拿来用，省去重复造轮子的时间。

原文

12:05

Allen AI (Ai2)@allen_ai

精选

Allen AI 宣布其机器人基础模型 MolmoAct 2 在不到一个月内被下载超过 40 万次。现在他们开源了完整的代码和训练数据，允许开发者进行微调或在此基础上构建。这标志着机器人领域的一个重要开放资源，降低了进入门槛。

AI模型机器人开源/仓库基础模型微调 Allen AI

推荐理由：机器人开发者终于有了一个完全开源的基础模型可用，MolmoAct 2 的完整代码和数据让你可以直接微调或构建自己的机器人应用，值得立即尝试。

原文

12:04

LMSYS Org (SGLang)@lmsysorg

精选

SGLang 宣布 Day-0 支持 Google 的 DiffusionGemma 模型，这是 Gemma 4 的文本扩散变体（26B A4B MoE）。与传统逐 token 解码不同，DiffusionGemma 通过并行去噪 token 块实现极低批处理生成速度。该模型支持离散文本扩散、多模态输入（文本、图像、视频）输出文本、稀疏 MoE 架构（8/128 专家）以及可配置思考模式。开发者现在即可通过 SGLang 运行该模型。

AI模型 SGLang DiffusionGemma Gemma 4 文本扩散 MoE

推荐理由：文本扩散模型大幅提升生成效率，适合需要低延迟批量推理的 AI 应用开发者，建议立即在 SGLang 中体验。

原文

12:02

LMSYS Org (SGLang)@lmsysorg

精选

LMSYS 在博客中介绍了 Token-In-Token-Out (TITO) 技术，用于解决强化学习中推理与训练 token 不一致导致的策略偏移问题。TITO 通过确保训练器使用推理引擎产生的精确 token，使每个 token 保持在策略上，从而提升训练效率。该技术将每个任务视为一个样本而非每个回合，在 30-50 回合的轨迹上可节省约 10 倍计算量。Miles 框架通过推理会话服务器、追加式 token 缓冲区、可插拔 TITO tokenizer 和 TokenSeqComparator 等组件实现 TITO。该技术已支持 Qwen3、GLM、Kimi-K2、Nemotron、Minimax 和 DeepSeek 等模型系列。

论文强化学习 TITO Miles token 对齐开源/仓库

推荐理由：做 RL 训练或大模型推理的团队终于有了解决策略偏移的实用方案——TITO 让每个 token 都对齐，计算量还能省 10 倍，搞 Agent 训练的开发者值得点开看看。

原文

12:02

Black Forest Labs (FLUX)@bfl_ml

BFL 在 X 上分享了对视觉智能的愿景，指出通过联合训练视频、图像和音频，模型能获得对真实世界的物理级理解。这种通用视觉处理能力不仅会提升图像和视频生成质量，还能通过动作预测接入机器人，将人类学习方式映射到机器上。内容创作、视频和物理 AI 被视为解决基础视觉智能后的自然延伸。

AI模型视觉智能多模态 BFL 物理AI 内容创作

推荐理由：BFL 的视觉智能路线图揭示了多模态联合训练如何通向物理级世界理解，做内容生成、视频或机器人开发的团队值得关注这一方向。

原文

11:58

Nous Research@NousResearch

NousResearch 宣布 Hermes Agent 新增自动化蓝图功能，允许用户将传统的 Cron 定时任务转换为可点击、可填写、可对话的工作流。这一更新降低了自动化任务的配置门槛，使非技术用户也能通过自然语言或简单界面管理定时任务。Hermes Agent 作为开源智能体框架，此次升级进一步强化了其在实际工作流自动化中的实用性。

AI产品智能体自动化工作流开源/仓库 Hermes Agent Cron

推荐理由：自动化蓝图让 Cron 任务变得像填表一样简单，做运维或日常任务自动化的团队可以直接用，省去写脚本的麻烦。

原文

11:58

Nous Research@NousResearch

Nous Research 发布了 Hermes Agent，一个旨在让 AI 智能体更自由、更灵活地执行任务的框架。该框架通过模块化设计和动态任务规划，使智能体能够自主适应复杂环境，减少人工干预。Hermes Agent 支持多种工具集成，并优化了推理效率，为开发者提供了更强大的智能体构建能力。这一发布标志着智能体技术向更高自主性迈进一步，尤其适合需要复杂任务自动化的场景。

AI产品智能体开源/仓库任务自动化 Nous Research 框架

推荐理由：Hermes Agent 解决了智能体自主性不足的痛点，做自动化任务和智能体开发的团队可以直接用它来构建更灵活的 AI 系统，值得一试。

原文

11:57

Nous Research@NousResearch

精选

NousResearch 发布了 Hermes Agent Profile Builder，允许用户在仪表盘中一站式构建完整的智能体配置。用户可以完全控制身份/名称/描述、模型/提供商、内置及可选技能、技能中心安装以及 MCP 服务器。该工具简化了智能体配置流程，让开发者能更高效地管理和部署 AI 智能体。

AI产品智能体 MCP/工具配置管理 Hermes NousResearch

推荐理由：做智能体开发的团队终于有了一个统一配置面板，不用再手动拼凑模型、技能和 MCP 服务，建议直接上手试试。

原文

11:56

Nous Research@NousResearch

NousResearch 宣布 Claude Fable 5 模型现已集成到 Hermes Agent 中，用户可通过 Nous Portal 使用。为推广新模型，前 500 名新用户可免费获得一个月 Plus 计划访问权限，用于体验 Fable 5 的能力。这一集成扩展了 Hermes Agent 的模型选择，为开发者提供了更多灵活性和性能选项。

AI产品 Claude Fable 5 Hermes Agent Nous Portal 模型集成免费试用

推荐理由：对于使用 Hermes Agent 的开发者来说，Claude Fable 5 的加入意味着更强的模型支持和更多实验空间，前 500 名新用户还能免费试用一个月，值得抓紧机会体验。

原文

11:55

Together AI@togethercompute

精选

Together AI 的前沿智能体负责人 James Zou 在 EinsteinArena 中分享了智能体如何推动开放科学问题的重大进展。他强调了智能体在解决复杂科学问题上的能力提升，特别是在开放科学领域。这一进展展示了 AI 智能体在科学研究中的实际应用潜力，为科研人员提供了新的工具和方法。

AI产品智能体开放科学 Together AI EinsteinArena 科研工具

推荐理由：做开放科学或 AI 智能体研究的开发者可以看看，智能体在科学问题上的突破可能改变你的研究方式。

原文

11:54

World Labs (李飞飞)@theworldlabs

Magnific 推出3D Scenes功能，基于Marble技术将单张图片转化为可控3D环境。设计师无需依赖提示词，可直接通过镜头、光照、构图和空间等传统视觉语言进行创作。该功能为创意团队提供了对广告视觉的一致性和控制力，降低了3D场景制作的门槛。案例研究展示了其在品牌营销中的实际应用。

AI产品 3D场景创意工具设计师 Magnific 可控生成

推荐理由：设计师终于不用写提示词了——Magnific 3D Scenes让创意团队用熟悉的镜头语言控制3D场景，做广告视觉或品牌内容的可以直接上手试试。

原文

11:52

Epoch AI@EpochAIResearch

Epoch AI 研究团队分析了 Mythos 在网络安全方面的公开证据，发现其在漏洞发现方面是否领先趋势尚不明确，但在漏洞利用能力上实现了显著跃升。该研究由多位学者共同完成，通过对比历史数据和当前表现，揭示了 Mythos 在攻击性安全任务中的突破性进展。这一发现对 AI 安全领域具有重要警示意义，表明 AI 在自动化攻防中的能力正在快速提升。

AI模型 Mythos 网络安全漏洞利用 AI安全能力评估

推荐理由：网络安全团队和 AI 安全研究者需要警惕——Mythos 在漏洞利用上的跃升意味着攻击面正在扩大，建议点开了解具体数据，评估自身防御策略。

原文

11:52

Epoch AI@EpochAIResearch

精选

Epoch AI Research 发布数据显示，单个数据中心的计算能力纪录每7个月翻一番。Colossus 1、Anthropic-Amazon New Carlisle 和 Meta Prometheus 先后成为算力最强的数据中心。这一趋势反映了AI算力需求的急剧增长，以及科技巨头在基础设施上的激烈竞争。对于AI模型训练和部署而言，算力密度的快速提升意味着更高效的训练和更复杂的模型成为可能。

行业算力数据中心 Colossus Anthropic Meta

推荐理由：算力密度翻倍周期缩短到7个月，做AI基础设施或大模型训练的团队需要关注这个节奏，它直接决定了你的训练成本和模型规模天花板。

原文

11:51

Epoch AI@EpochAIResearch

Epoch AI Research 在 X 上发布了一条关于 AGI 收益分配方案的讨论。根据@pawtrammell和@ansonwhho的观点，目前主流的 AGI 后普遍再分配方案主要区别在于：给予公民对资本的直接控制权程度。该讨论旨在帮助人们思考如何公平分享 AGI 带来的巨大收益，涉及经济、社会和政治层面的深远影响。

行业 AGI 收益分配资本控制 AI治理经济影响

推荐理由：AGI 收益分配是未来社会绕不开的核心议题，关注 AI 治理和公共政策的读者值得深入思考，看完会对不同方案的利弊有更清晰的认识。

原文

11:51

Epoch AI@EpochAIResearch

EpochAI Research 推出了一个网络漏洞探索器，可视化自2022年以来向CVE项目报告的常见漏洞和暴露（CVE）。该工具旨在验证AI公司声称其模型在发现软件漏洞方面越来越好的说法是否属实。通过公开数据，用户可以直观地看到漏洞报告的趋势和分布。这为评估AI在网络安全领域的实际进展提供了数据支持。

AI产品漏洞检测 CVE 网络安全数据可视化 EpochAI

推荐理由：做安全研究和漏洞分析的团队，终于有了一个公开数据工具来验证AI模型的真实能力，建议点开看看趋势图。

原文

11:50

Epoch AI@EpochAIResearch

Epoch AI Research 数据显示，AI 相关投资（数据中心建设、计算硬件和网络设备）在 2026 年第一季度约占美国 GDP 的 0.8%，推动整个计算基础设施占比达到约 1.5%。这一比例相比此前翻倍，反映了 AI 产业对经济的巨大拉动作用。投资主要集中在数据中心、GPU 等硬件和网络设备上，表明 AI 基础设施已成为经济增长的重要驱动力。

行业 AI 基础设施美国 GDP 数据中心投资趋势 Epoch AI

推荐理由：AI 基础设施投资占 GDP 比例翻倍，说明 AI 产业正在重塑经济结构，关注宏观趋势的投资者和科技从业者值得了解这一信号。

原文

11:48

Noam Brown (OpenAI 推理)@polynoamial

精选

自OpenAI o1发布以来，业界已知LLM的测试时计算扩展（test-time compute scaling）能显著提升模型性能。然而两年后，实验室仍仅报告标量评估结果，安全组织在发现脚手架通过100倍推理获得更好表现时仍感惊讶，且RSP（责任扩展政策）在决定关键阈值时仍忽略推理预算。这暴露了AI安全评估中的系统性盲点，即未将推理计算量作为关键变量纳入考量。

行业测试时计算扩展 AI安全推理预算 RSP OpenAI o1

推荐理由：AI安全评估的盲点被戳穿了——忽视推理预算的RSP和标量评估正在让安全组织措手不及，做AI安全或模型评估的团队值得反思自己的测试框架。

原文

11:46

Noam Brown (OpenAI 推理)@polynoamial

83°

OpenAI 的一个通用内部模型在著名的组合几何问题上取得了突破性进展。不到一年前，前沿 AI 模型在 IMO（国际数学奥林匹克）中已达到金牌水平。这表明 AI 在数学推理能力上的进步速度惊人，且预计这一趋势将持续。该突破展示了通用模型在解决复杂数学问题上的潜力，而非依赖专门训练的模型。

AI模型 OpenAI 推理模型数学突破组合几何 IMO

推荐理由：数学和 AI 研究者值得关注——OpenAI 的通用模型在组合几何难题上取得突破，展示了 AI 推理能力的快速提升，建议点开了解具体进展。

原文

11:45

Microsoft AI@MicrosoftAI

精选

微软AI实验室在MSBuild 2026上发布了7个新模型，涵盖推理、代码、图像、语音和转录能力。这些模型基于科学和清洁的商业安全数据构建，设计为无缝协作。微软AI负责人Mustafa Suleyman在主题演讲中展示了这些进展，标志着微软在AI领域的快速扩张。

AI产品微软多模态模型推理模型代码模型 MSBuild

推荐理由：微软一口气推出7个覆盖多模态的模型，做AI应用开发的团队可以直接集成这些能力，减少自研成本，值得关注。

原文

11:31

OpenAI@OpenAI

精选

OpenAI 宣布为 AI 生成图像增加新的识别方式。除了已有的 C2PA 内容凭证，现在图像还包含 SynthID 水印，用户可以使用公开验证工具检查图像是否由 OpenAI 产品生成。这一举措旨在提高 AI 内容的透明度和可追溯性，帮助人们辨别 AI 生成内容。

AI产品 OpenAI AI 生成图像水印内容验证透明度

推荐理由：AI 生成内容的真实性越来越难分辨，OpenAI 这次加码水印和验证工具，直接解决了内容溯源痛点。做内容审核、媒体传播或 AI 产品开发的团队，建议关注这个公开验证工具怎么用。

原文

11:08

小互@imxiaohu

OpenAI 宣布 Plus 和 Pro 用户可邀请最多三位朋友试用 Codex，每成功邀请一位好友（好友发送第一条消息），邀请者和被邀请者都将获得一次用量重置机会。该重置机会可保留，用户可随时选择使用，重置后 Codex 用量重新计算。这一活动旨在推广 Codex 并提升用户活跃度。

AI产品 OpenAI Codex 邀请好友用量重置活动

推荐理由：对于频繁使用 Codex 的开发者，这个活动能有效解决用量限制问题，邀请好友即可获得重置机会，建议有 Codex 需求的用户尝试。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。