全部 AI 动态 · AI 热点

6月18日

04:53

ChatGPT@ChatGPTapp

OpenAI 为 ChatGPT 推出新的任务调度功能，支持在 web 和移动端使用。新功能通过 Scheduled 页面管理，声称更快、更可靠。该更新面向 Go、Plus、Pro、Business 和 Enterprise 用户分批推送。

AI产品 ChatGPT OpenAI 任务调度 Scheduled页面

推荐理由：ChatGPT 现在可以让你更稳地安排定时任务，管理起来也方便多了，特别适合需要自动化提醒或定期输出的朋友。

原文

04:41

04:41OpenAI Blog（博客/媒体）

OpenAI 发布了 LifeSciBench，这是一个由 10 位生命科学专家编写并经过独立审查的基准测试。该基准包含 30 个任务，覆盖文献综述、实验设计、数据分析等真实研究场景。初步测试显示，GPT-4o 在多数任务上优于其他模型，但所有模型在需要跨领域推理的任务中表现仍有显著差距。LifeSciBench 旨在为 AI 在科学领域的可靠性和安全性提供更严格的评估工具。

AI模型 OpenAI LifeSciBench 基准测试 AI安全科学推理

推荐理由：OpenAI 出了个新基准 LifeSciBench，专门测 AI 做生命科学研究的能力，比一般问答难多了，能看出模型哪里不行。

原文

04:09

Aadit Sheth@aaditsh

88°

Amazon CEO于5天前向白宫举报Claude Fable 5的安全风险。该模型在24小时内被禁止海外访问。Amazon是Anthropic最大投资者，投资额达40亿美元。Anthropic CEO Dario的模型被禁，而OpenAI CEO Sam的模型未受限。这一事件凸显AI监管的地缘政治分歧。

行业 Claude Fable 5 Amazon Anthropic OpenAI AI安全

推荐理由：Amazon举报了自己投了40亿的模型？Claude Fable 5被白宫禁了，OpenAI却没事，这背后有瓜吃。

原文

03:05

@koltregaskes@koltregaskes

原本预测本周发布的 GPT-5.6 模型，过去几天内被调整为预测下周发布。这一变化来自社交媒体上的传闻，OpenAI 尚未官方确认。目前具体延期原因不明。

行业 GPT-5.6 OpenAI 发布延期传闻

推荐理由：GPT-5.6 的发布时间从本周延到下周了，关注 OpenAI 动态的可以看看这个变化。

原文

02:44

Lenny Rachitsky@lennysan

本期播客嘉宾包括谷歌DeepMind首席科学家Jeff Dean、OpenAI的ChatGPT生产力负责人Tara Seshan、Anthropic研究产品负责人Dianne Penn、Claude Code/Cowork工程负责人Fiona Fung、Codex PM与工程负责人Andrew Ambrosino，以及Netflix CPTO Elizabeth Stone。多位AI公司高管将分享前沿视角。

行业播客 Jeff Dean Google DeepMind OpenAI Anthropic Claude Code ChatGPT

推荐理由：想听谷歌DeepMind、OpenAI、Anthropic等公司高管聊内部视角？这场播客阵容超强，值得蹲。

原文

01:35

01:35OpenAI Blog（博客/媒体）

OpenAI与Molecule.one合作开发了一款近自主AI化学家，基于GPT-5.4模型。该系统针对药物化学中一项具有挑战性的反应进行优化，成功提升了反应产率。该研究展示了GPT-5.4在有机合成中的实用潜力，推动了AI辅助药物化学的进展。

论文 GPT-5.4 OpenAI Molecule.one 药物化学 AI化学家

推荐理由：OpenAI用GPT-5.4做了个AI化学家，能自动改进药物合成反应，比传统方法更高效。

原文

01:30

@OpenAIDevs@OpenAIDevs

OpenAI 宣布向 Rust 基金会提供 60 万美元资金支持，其中包含白金会员费用及额外维护者资助。这笔捐赠旨在强化 Rust 生态系统的基础设施与维护工作。Charlie Marsh 代表 OpenAI 公布了这一承诺，体现其将 Rust 作为系统编程未来方向的押注。

行业 OpenAI Rust Rust基金会开源生态

推荐理由：OpenAI 砸 60 万美元支持 Rust 基金会，不光当白金会员还掏钱养维护者，系统编程圈的大动作。

原文

6月17日

23:48

小互@imxiaohu

71°

OpenAI 宣布 Codex 产品，包含 App 客户端、命令行 CLI 和 SDK，允许开发者自由接入任何开源大模型，不强制绑定 OpenAI 自家模型。官方同时发布了手把手配置文档，指导如何将 Codex 底层模型替换为免费开源模型。这一举措为开发者提供了更多选择，降低了对 OpenAI 模型的依赖。

AI产品 OpenAI Codex 开源模型开发工具 CLI

推荐理由：OpenAI 的 Codex 现在能接 DeepSeek 这类开源模型了，开发者可以自己换底层 AI，不用非得用 OpenAI 的。

原文

23:40

Geek@geekbb

OpenAI 的编程助手 Codex 现在支持使用任何开源模型，不仅限于 OpenAI 模型。用户可以通过 Codex App、CLI 和 SDK 配置第三方模型。这一更新使开发者能灵活选择推理后端，降低对 OpenAI 模型的依赖。目前已有多个开源模型可用于代码生成和解释。

AI产品 Codex OpenAI 编程助手开源模型 CLI/SDK

推荐理由：Codex 现在能用你喜欢的任何开源模型了，CLI、App、SDK 都支持，编程助手自由度更高。

原文

23:40

shao__meng@shao__meng

精选

CC Switch是一个开源工具，允许在OpenAI Codex中切换使用不同的第三方模型。它解决了第三方API与Codex不兼容的痛点，使得更多模型能直接接入Codex。该项目在GitHub上已获得103K星，由Jason Young开发和推荐。完全开源免费，方便开发者在编码时灵活选择模型。

AI产品 CC Switch Codex OpenAI GitHub 编程助手

推荐理由：想在Codex里随便切换模型？试下CC Switch，开源免费，GitHub上10万星，作者还在持续更新，一把子解决API不兼容问题。

原文

23:33

Julien Chaumond@julien_c

Anthropic的Dario Amodei、OpenAI的Sam Altman、DeepMind的Demis Hassabis和Mistral的Arthur Mensch四位AI公司CEO，据Politico报道，将于今日进行一场2小时的午餐会面。此次闭门会议可能涉及行业合作、政策协调或技术方向讨论。四位领导者代表当前最前沿的AI机构，此举引发市场对行业格局变化的猜测。

行业 Anthropic OpenAI DeepMind Mistral AI巨头会面

推荐理由：四大AI巨头CEO私下碰头，半小时的午餐可能聊出行业大动静，想了解风向就看这个。

原文

23:33

Gary Marcus@GaryMarcus

Gary Marcus对Business Insider表示，OpenAI的财务问题可能波及高度依赖其芯片和数据中心需求的科技股，如Nvidia、Oracle和CoreWeave。他指出OpenAI现金消耗速度极快，若得不到公共资金支持将面临困境，进而威胁这些主要客户公司的未来预期。CoreWeave等供应商的估值很大程度上基于OpenAI的持续高需求。

行业 OpenAI Nvidia Oracle CoreWeave 财务风险

推荐理由：Gary Marcus警告OpenAI烧钱太快，连累给它供应芯片和数据中心的Nvidia、Oracle和CoreWeave，投资者得注意这链条风险。

原文

23:33

Thomas Wolf@Thom_Wolf

开发者 Tibo 在 X 平台分享指出，Codex App、CLI 和 SDK 均可配置使用任何开源模型，不再局限于 OpenAI 模型。配置方式详见 developers.openai.com/codex/config-a… 页面。这意味着用户可以在 Codex 中替换默认的 GPT 模型，选择 Llama、Mistral、DeepSeek 等开源替代方案。

技巧 Codex 开源模型 OpenAI 开发者工具

推荐理由：Codex 现在能跑开源模型了，不只是 OpenAI 的，快去试试把 Llama 或 Mistral 加进去

原文

23:30

Decoder@Maximilian Schreiner

精选

OpenAI研究人员提出一种新方法，用于预测AI模型在发布后出现错误的频率。该方法旨在弥补当前标准安全测试的不足。研究团队通过分析模型内部特征与测试数据来估算失败概率。该工作可能帮助开发者更早发现潜在风险。

论文 OpenAI AI安全模型测试预测方法安全测试

推荐理由：OpenAI研究者搞了个预测模型出错率的方法，能补上安全测试的漏洞，让发布更靠谱。

原文

23:18

AI Will@FinanceYF5

精选

OpenAI frontier evals 负责人 Tejal Patwardhan 指出，现有基准测试如旧考试已变得过于简单，模型接近 100% 通过后无法区分真实能力。OpenAI 正在构建新评估框架，以更准确衡量前沿模型的真正水平。此举旨在避免模型仅通过刷分应付测试，确保评测能反映实际进步。

行业 OpenAI Tejal Patwardhan 评测体系基准测试 AI安全

推荐理由：OpenAI 自己都觉得旧考试太水了，新评测体系怎么玩？来看看他们怎么重新定义能力

原文

13:58

marktechpost@Michal Sutter

精选

OpenAI于2026年6月16日推出Deployment Simulation方法，通过回放历史对话让新候选模型生成完成并评分，以估计部署时不良行为率。该方法报告了1.5倍中位数乘法误差，将预部署风险评估扩展至智能体编码场景。文章还讨论了该方法的局限性，如无法覆盖所有风险类型。

AI模型 OpenAI Deployment Simulation AI安全风险评估

推荐理由：OpenAI搞了个新方法，用历史对话模拟测试模型，能估算不良行为率，误差才1.5倍，做AI安全评估的朋友可以看看。

原文

12:59

12:59IT之家（博客/媒体）

据《The Information》报道，OpenAI 在2026年第一季度现金消耗达37亿美元，超过其同期57亿美元收入的一半。巨额支出主要来自算力基础设施、模型研发和人才招募。公司正筹备上市，已在美国保密递交IPO申请，知情人士称最早9月完成，估值或达1万亿美元。这一数据凸显头部AI企业的巨大资金压力。

行业 OpenAI 现金消耗 IPO 估值 AI企业成本

推荐理由：OpenAI烧钱有多快？一季度花37亿美元，收入才57亿，还计划上市估值1万亿，压力不小。

原文

12:01

歸藏(guizang.ai)@op7418

推文指出OpenAI在Codex大幅补贴期间仍保持服务稳定快速，用户增长迅速。相比之下，其他AI服务商近期速度变慢或降低使用额度。该推文获得14条回复和29个点赞，反映出用户的普遍关注。

AI产品 OpenAI Codex AI服务

推荐理由：看网友说OpenAI服务稳如狗，其他家都在降速，想入手Codex的可以参考。

原文

11:40

11:40IT之家（博客/媒体）

软银于6月16日推出基于OpenAI技术的“补丁即服务”网络安全解决方案，利用AI进行漏洞评估和修复规划。该服务已在软银内部大规模系统评估中取得优异成果，可帮助企业应对AI自动化网络攻击的威胁。OpenAI CEO Sam Altman表示AI正变革网络安全，并期待与软银合作加强关键基础设施防御。

AI产品 SoftBank OpenAI Patching as a Service 网络安全 AI安全

推荐理由：软银和OpenAI联手搞了个AI补丁服务，专门帮企业自动发现安全漏洞并规划修复。据说内部测试效果不错，适合想提升防御效率的团队。

原文

10:31

shao__meng@shao__meng

精选73°

OpenAI Codex 提供三种操作电脑能力：@ Browser 是线程内隔离浏览器，适合本地开发与视觉调试，无登录态和扩展；@ Chrome 使用真实 Chrome 身份，支持多标签和已登录 SaaS，操作等同于用户本人；@ Computer 控制整个桌面 GUI，用于原生 App 和无 API 流程，速度最慢但覆盖面最广。此外，Appshots 仅提供当前窗口上下文，不赋予控制权。文章还给出了基于任务场景的选择决策框架和三个典型应用案例。

技巧 OpenAI Codex Computer Use Chrome Browser 教程

推荐理由：Codex 团队手把手教你区分三种控制模式：本地开发用 Browser，登录 SaaS 用 Chrome，原生应用用 Computer。还有决策框架，实测好用。

原文

10:10

10:10IT之家（博客/媒体）

73°

微软正将 Copilot Cowork 智能体转为按使用量计费，并探索 DeepSeek V4 微调版作为更低成本替代方案。目前 Anthropic Fable 5 输出定价为 50 美元/百万 token，而 DeepSeek V4 Pro 仅 0.87 美元/百万 token，价差约 57 倍。微软承诺该模型将完全托管在 Azure 上，确保企业级安全合规。预计未来几周内公布最终模型选择。

AI产品微软 Copilot Cowork DeepSeek V4 Anthropic OpenAI 智能体

推荐理由：微软嫌 Claude 和 GPT 太贵，打算用 DeepSeek V4 微调版，价格差了 57 倍，企业用户能省一大笔钱。

原文

10:01

Fireworks AI@FireworksAI_HQ

Fireworks AI 推出 GLM-5P2 模型，强调基准测试仅是参考，真正的评估应基于实际代码库、提示词和延迟 SLO。该模型支持直接替换 OpenAI 或 Anthropic 兼容客户端（如 accounts/fireworks/models/glm-5p2），用户可在真实场景中测试。Fireworks AI 建议开发者下载模型并尝试在自有代码库上运行，以验证实际性能。推文附有详细博客链接（fireworks.ai/blog/glm-5p2）供进一步了解。

AI模型 Fireworks AI GLM-5P2 OpenAI Anthropic 开源模型

推荐理由：Fireworks AI 让你用 GLM-5P2 直接在代码库上跑分，别光看基准，试试自己的提示词和延迟

原文

05:27

Gary Marcus@GaryMarcus

Gary Marcus引用Andriy Burkov数据指出，OpenAI市场份额在2025年1月首次跌破50%。Google的Gemini凭借浏览器生态快速蚕食用户，纯LLM业务被认为缺乏粘性。普通用户难以区分ChatGPT与Gemini，倾向于使用Google整合服务。行业分析认为，控制浏览器入口将成为AI竞争的关键。

行业 OpenAI Google Gemini 市场份额大模型竞争

推荐理由：OpenAI市场份额跌破50%，Gemini靠浏览器生态追上了。谁控制浏览器谁赢，这数据挺说明问题。

原文

04:13

OpenAI@OpenAI

精选

OpenAI在Alignment博客中探讨了部署模拟的最佳实践，强调需要代表性生产数据，而外部评估者往往无法获取。他们分析了公共WildChat数据集，发现尽管其精度较低，但仍能提供部署行为的有效信号。该研究验证了WildChat在模拟中的实用性，为缺乏私域数据的研究者提供了替代方案。相关发现已发布在alignment.openai.com/validating-pub…。

论文 OpenAI WildChat 部署模拟 AI安全数据质量

推荐理由：OpenAI用WildChat数据集做部署模拟测试，发现公开数据也能提供有效信号，适合没法拿到生产数据的研究者参考。

原文

04:13

OpenAI@OpenAI

OpenAI 在推文中介绍其模拟部署方法可将评估意识降低至接近真实生产流量水平。该方法扩展至带状态工具的智能体部署，表明工具模拟器在给定充分上下文和能力时能够生成逼真的轨迹。这有助于更准确地评估模型在真实场景中的表现。

论文 OpenAI 模拟部署智能体评估意识工具模拟器

推荐理由：OpenAI 分享了模拟部署的技术细节，能大幅降低评估误差，对研究模型评估和智能体部署的人很有参考价值。

原文

04:13

OpenAI@OpenAI

精选

OpenAI提出一种新研究方法，通过模拟部署使用近期去标识化用户请求（涉及23,341次浏览）来预测模型行为。该方法在发布前评估候选模型响应，相关推文获得44条评论、27次转发和375个赞。研究旨在减少模型在实际使用中的意外行为。

论文 OpenAI 模拟部署模型安全行为预测

推荐理由：OpenAI搞了个新方法，用真实用户请求模拟部署，提前预测模型行为，比直接上线更稳妥。

原文

04:03

Gary Marcus@GaryMarcus

OpenAI市场份额已降至50%以下，微软公开寻求更便宜的替代方案。Gary Marcus指出OpenAI资金紧张且烧钱严重，认为投资者更倾向于Anthropic而非OpenAI。他预测OpenAI将以约30%的估值被微软或亚马逊收购。

行业 OpenAI Microsoft Anthropic Amazon 行业动态

推荐理由：Gary Marcus直言OpenAI市值可能缩水七成，微软已经在找替代品，反映了AI行业格局变化。

原文

04:02

Gary Marcus@GaryMarcus

微软正在探索将DeepSeek作为Copilot Cowork的底层模型，替代OpenAI和Anthropic。同时Copilot Cowork转向基于使用量的定价模式，微软表示有用户每周执行数百个任务，成本可能非常高。这一举动被分析认为伤害了OpenAI和Anthropic的潜在IPO。事件涉及Jevons悖论，即效率提升可能导致总用量增加。

行业微软 DeepSeek OpenAI Anthropic 定价策略

推荐理由：微软可能换掉OpenAI和Anthropic，改用DeepSeek给Copilot Cowork，还改了按用量收费。这事直接影响两家公司上市计划，值得关注。

原文

03:40

@koltregaskes@koltregaskes

OpenAI即将推出新语音模型GPT-Bidi-1（代号可能变更）。该模型专为生成更自然的语音交互设计。消息最早由Dev Mode服务器报道，目前无具体发布日期。

AI模型 GPT-Bidi-1 OpenAI 语音模型自然语音

推荐理由：OpenAI要发新语音模型GPT-Bidi-1，听说声音超级自然，比现在的好不少！

原文

03:36

@koltregaskes@koltregaskes

用户Kolt Regaskes在X上爆料，他在通过Linear和Github连接器使用ChatGPT时，仅讨论了Anthropic的新闻，却发现ChatGPT的思考内容被审查。OpenAI未公开审查原因。该事件引发对AI内容监管和连接器权限的讨论。

AI产品 ChatGPT OpenAI 内容审查连接器 Anthropic

推荐理由：ChatGPT居然在你用第三方工具时偷偷审查内容，连聊Anthropic都要管，这太离谱了，赶紧看看怎么回事。

原文

03:29

03:29OpenAI Blog（博客/媒体）

精选

OpenAI 发布了 Deployment Simulation，一种利用真实用户对话数据来模拟模型上线后行为的方法。该方法在多个安全评估场景中测试，能提前识别出传统评估遗漏的风险。与传统静态基准不同，Deployment Simulation 可捕捉模型在动态交互中的有害输出，提升评估准确率。

论文 OpenAI Deployment Simulation AI安全安全评估

推荐理由：OpenAI 出了一套新方法，用真实对话提前模拟模型上线后的表现，能帮你更准地发现安全问题。

原文

03:28

AI Engineer@aiDotEngineer

OpenAI、Anthropic、Google DeepMind、Amazon AGI Labs、Zai和MiniMax共六家前沿AI实验室确认参加2025年World's Fair。活动将于6月29日至7月2日在旧金山举行，由ai.engineer主办。这是模型开发者与基于这些模型构建应用的开发者首次同场交流。

行业 OpenAI Anthropic Google DeepMind 行业活动 World's Fair

推荐理由：六家顶尖AI实验室要凑一块儿了，6月底旧金山，模型开发者直接和做应用的聊，机会难得。

原文

00:43

@OpenAIDevs@OpenAIDevs

73°

OpenAI宣布本周起向欧洲经济区、英国和瑞士的Codex用户推出多项新功能。新增功能包括Computer use（计算机操控）、Codex Chrome扩展、个性化记忆（personalized memory）以及Chronicle功能。这些功能此前已向部分地区开放，现在欧洲开发者可以使用。

AI产品 Codex OpenAI 欧洲编程助手 Chrome扩展

推荐理由：OpenAI把Codex的电脑操控、Chrome扩展和个性化记忆带到欧洲了，开发者快去试试。

原文

6月16日

17:49

Decoder@Maximilian Schreiner

Anthropic 取消了原计划为 Claude Agent SDK 推出的独立计费系统。该 SDK 和第三方应用将继续从常规订阅限额中扣费。此前 Anthropic 因计费变更引发用户不满，此次调整正值与 OpenAI 的价格竞争加剧之际。

行业 Anthropic Claude Agent SDK OpenAI 智能体定价

推荐理由：Anthropic 悬崖勒马，放弃了 Claude Agent SDK 的独立计费，稳住用户比在价格战前惹毛他们更重要。

原文

17:29

17:29IT之家（博客/媒体）

据《金融时报》报道，OpenAI去年总支出达340亿美元，其中研发支出约190亿美元，销售与营销费用约60亿美元，基础设施与运营成本约90亿美元。同期营收约130亿美元，净亏损达390亿美元。公司正通过优化运营、控制研发增速、精简非核心项目为IPO做准备。

行业 OpenAI 研发支出 IPO 大模型成本数据中心

推荐理由：OpenAI去年花了340亿美元还倒亏390亿，钱主要砸在研发和数据中心。想了解AI巨头烧钱节奏和上市前动作的可以看看。

原文

17:28

17:28IT之家（博客/媒体）

OpenAI 2025 年支出达 340 亿美元（约 2302 亿元），其中研发支出 190 亿美元、销售和营销 60 亿美元。同年收入约 130 亿美元，月收入从 2024 年底的 10 亿美元/季度增长至 20 亿美元/月。净亏损达 390 亿美元，但包括约 300 亿美元非现金会计费用；剔除后实际亏损 80 亿美元。OpenAI 已按 7300 亿美元估值融资 1220 亿美元，预计最早今年秋季上市。

行业 OpenAI 融资上市财务数据 AI行业

推荐理由：OpenAI 上市前烧钱猛：去年支出 340 亿、收入 130 亿、净亏 390 亿，主要砸研发和数据中心。想知道它怎么花钱、亏在哪？看这篇财务拆解。

原文

16:12

pandaily@contact@pandaily.com (Pandaily)

AI应用层正经历大规模关闭浪潮，OpenAI、Google等公司的多款产品在数月内停止运营。行业正从功能实验转向商业可行性，包括初创公司在内的各方纷纷整合产品线。这一趋势反映出市场对AI应用盈利能力的要求日益严格。

行业 OpenAI Google AI产品关闭商业化行业整合

推荐理由：这篇文章梳理了OpenAI、Google等公司近期关闭或整合产品的动作，帮你了解AI行业为何从拼功能转向拼赚钱。

原文

12:43

@zarazhangrui@zarazhangrui

AI产品 Codex OpenAI 知识工作者数据分析

推荐理由：Codex不光是程序员在用，知识工作者增长特别快，数据分析任务一周翻了一倍多，值得关注。

原文

12:42

berryxia@berryxia

77°

据社交媒体传闻，OpenAI可能于6月23日发布GPT-5.6。该模型运行成本仅为Fable的三分之一，上下文窗口扩展至150万token，智能体编程工作流将全面升级。目前信息仍属未经证实的泄露阶段。

AI模型 GPT-5.6 OpenAI 上下文窗口智能体编程

推荐理由：传GPT-5.6成本更低、上下文超长，还能提升智能体编程，6月23日可能有动作，值得关注后续。

原文

09:30

@OpenAIDevs@OpenAIDevs

OpenAI 推出了针对 Codex 的 Developers 插件。该插件帮助开发者快速设置 OpenAI API 密钥。还能在 Codex 中直接查找相关文档。并提供调试支持以提升开发效率。

AI产品 OpenAI Codex Developers plugin 编程助手 API

推荐理由：OpenAI 官方出了个 Codex 插件，帮你省去来回切页面配 API 密钥的麻烦，写代码时还能顺手查文档和调试，开发体验直接拉满。

原文