全部 AI 动态 · AI 热点

AITOP

6月23日

14:23

小互@imxiaohu

OpenAI 发布了 Codex 的新版本，用于修复此前出现的问题。官方表示该版本已缓解了故障。Codex 是 OpenAI 发布的编程助手模型。新版本改进了稳定性。

AI产品 OpenAI Codex 问题修复

推荐理由：OpenAI 刚刚给 Codex 打了一个补丁，如果你用 Codex 写代码遇到问题，可以试试升级。

原文

14:08

Greg Brockman@gdb

精选72°

OpenAI 发布 Patch the Planet 项目，与 Trail of Bits、HackerOne 等安全研究机构合作。该项目利用 Codex Security 和前沿 AI 模型，帮助开源软件维护者将安全发现转化为合并修复。流程以人工审核为中心，旨在提升关键开源项目的安全性。

AI产品 OpenAI Codex Security 开源安全安全修复

推荐理由：OpenAI 找来 Trail of Bits 和 HackerOne 的安全研究员，用 Codex Security 帮开源项目修漏洞，还能自动生成合并修复，省心省力。

原文

13:54

@koltregaskes@koltregaskes

OpenAI的实时语音模式“Bidi 1”即将推出，目前已在UI中出现但处于隐藏状态。该功能预计在近期内开放给用户使用。消息来自X平台用户爆料。

AI产品 OpenAI Bidi 1 实时语音语音模式

推荐理由：OpenAI马上要出实时语音模式“Bidi 1”了，界面里已经藏着一个彩蛋，很快就能用上。

原文

03:57

Greg Brockman@gdb

精选73°

OpenAI推出了Codex Security插件，专为安全团队设计。该插件支持深度代码扫描、自动验证发现结果，并能够追踪攻击路径。它还可以构建威胁模型，生成针对代码库的特定补丁用于审查。此外，支持将分析结果导出到其他安全工具中。

AI产品 Codex OpenAI 安全代码扫描 AI安全

推荐理由：OpenAI给安全团队出了个Codex插件，能深度扫描代码、自动验证漏洞、画攻击路径，还生成专属补丁，省事儿不少。

原文

02:03

Greg Brockman@gdb

精选

OpenAI 在 Daybreak 项目中推出新工具和模型，加速关键漏洞的发现和修补。其模型已能为 FreeBSD、Linux kernel、cURL、Go、Python、Sigstore、pyca/cryptography 等生成补丁。新发布的包括 Codex Security 插件（在 Codex 内修复漏洞）、GPT-5.5-Cyber 模型（专为防御者设计）、Cyber Partner Program（安全公司合作）以及 Patch the Planet（开源项目维护）。

AI产品 OpenAI GPT-5.5-Cyber Codex Security Daybreak AI安全

推荐理由：OpenAI 的 Daybreak 现在不仅能找漏洞，还能自动打补丁了，连 Linux 内核和 FreeBSD 都支持，安全团队可以试试 GPT-5.5-Cyber。

原文

01:19

OpenAI@OpenAI

OpenAI 宣布启动 Daybreak Cyber Partner Program，与领先的安全软件和服务提供商合作。合作伙伴可在其安全产品和服务中使用 GPT-5.5 with Trusted Access for Cyber。客户能受益于该模型的防御能力，提升软件韧性，但直接模型访问权由合作伙伴控制。该计划旨在通过渠道模式推广 AI 安全能力。

行业 OpenAI GPT-5.5 Daybreak AI安全安全软件

推荐理由：OpenAI 联合安全厂商，让 GPT-5.5 直接嵌入安全产品，客户不用管理模型，就能享受更强的网络防御。

原文

01:19

OpenAI@OpenAI

OpenAI 宣布推出 Patch the Planet 项目，与 Trail of Bits、HackerOne 及多位安全研究员和开源维护者合作。该项目利用 Codex Security 和高级模型（如 GPT-4）协助将安全发现快速转化为合并修复。修复过程以人工审核为中心，确保补丁质量。目标是降低开源项目从漏洞披露到修复的时间门槛。

行业 OpenAI Codex Security Trail of Bits HackerOne AI安全

推荐理由：OpenAI 联手 Trail of Bits 和 HackerOne，用 Codex Security 帮开源项目快速修漏洞，人工把关，靠谱。

原文

01:18

OpenAI@OpenAI

73°

OpenAI 宣布扩大 Daybreak 计划，新增 Codex Security 插件，允许用户在 Codex 内发现、验证和修复漏洞。同时发布完整版 GPT-5.5-Cyber 模型，专为可信防御者设计。Cyber Partner Program 允许安全公司基于 OpenAI 的安全能力构建产品。Patch the Planet 项目则与维护者合作，保护关键开源项目。

AI产品 OpenAI Daybreak Codex GPT-5.5-Cyber AI安全

推荐理由：OpenAI 搞了个 Daybreak 扩展，直接在 Codex 里修漏洞，还有专门的安全模型 GPT-5.5-Cyber，想帮安全团队快速打补丁。

原文

00:53

AI Breakfast@AiBreakfast

一条推文调侃OpenAI模型发布节奏，称GPT-5.6早一天发布，关于GPT-5.7的讨论就能早一天开始。该推文获得32个点赞和5601次查看，另附4条回复与7个数据点。社区对GPT-5系列后续版本的关注度可见一斑。

行业 GPT-5.6 GPT-5.7 OpenAI 版本迭代

推荐理由：网友在催OpenAI赶紧出GPT-5.6，好直接开始聊5.7，挺有意思的行业梗。

原文

6月22日

16:32

AI Will@FinanceYF5

Calvin Zhang宣布从Scale AI离职，加入OpenAI担任研究项目经理，专注于模型评估工作。他在Scale AI期间参与了Humanity's Last Exam项目，并协助启动了Scale AI Labs。他还负责过数据、评估和研究相关合作。此次人事变动显示OpenAI正加强模型评估团队。

行业 OpenAI Scale AI 人事变动模型评估

推荐理由：Calvin Zhang在Scale AI做过Humanity's Last Exam，现在去OpenAI负责evals，可能意味着更严的模型测试要来了。

原文

16:32

AI Will@FinanceYF5

Calvin Zhang 正式加入 OpenAI，担任 Research Program Manager，负责评测工作。他此前在 Scale AI 积累了高强度、重视质量的经验。顶级评测人才的流动被视为 AI 军备竞赛的晴雨表。

行业 Calvin Zhang OpenAI Scale AI 评估 AI 军备竞赛

推荐理由：Calvin Zhang 从 Scale AI 跳槽到 OpenAI，专攻模型评测，这行的人才动向很说明问题。

原文

14:26

Aadit Sheth@aaditsh

Alisa Liu分享了加入OpenAI的求职经历：她经历了57次面试、46次招聘电话和16次offer后的沟通，最终成功入职。她强调，在AI研究招聘中，有人内推是最重要的因素，一份内推相当于40份冷投简历。正式的招聘流程只是辅助渠道，人脉网络才是真正的面试通道。内推在当前的AI招聘市场中起着决定性作用。

行业 OpenAI 招聘内推 AI research

推荐理由：作者用真实数字告诉你，投OpenAI的简历堆成山，但一封内推信就能让你直接进面试。想进AI巨头？先建人脉。

原文

03:49

@koltregaskes@koltregaskes

X用户koltregaskes分享的截图显示，ChatGPT在一段对话中回复需要更多时间进行检查，暗示GPT-5.6可能引入更严格的安全机制。目前OpenAI官方未对此消息确认。GPT-5.6是传闻中的下一代模型，但具体发布时间与功能细节仍未公布。

AI模型 GPT-5.6 OpenAI AI安全

推荐理由：OpenAI可能推出的GPT-5.6会增加安全检查，想提前了解变化可以看看这个讨论。

原文

6月21日

22:24

Viking@vikingmute

用户反馈OpenAI Codex中GPT-5.5模型token消耗速度突然增加10-20倍。Plus用户原本5小时额度仅用2-3个prompt就耗尽，Pro账户也比原来快很多。该问题在X平台引发大量点赞和讨论，目前尚未有官方回应。

AI产品 Codex GPT-5.5 OpenAI 编程助手 token消耗

推荐理由：Codex的GPT-5.5最近token消耗飞快，Plus额度几下就用完，Pro用户也受影响，快看看你的账户。

原文

22:03

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue分析指出，2016-2024年美国在开源AI领域领先，2024-2027年将在通用AI领域领先并受益。2024-2026年中国在开源AI方面领先，2026-2030年未知。他认为开源AI是通用AI的基础，能加速国家技术生态进步，OpenAI/Google从开放科学和开源AI起步，主导了AI领域。Meta由于改变策略，失去了类似机遇。

行业开源AI 通用AI Hugging Face OpenAI Google

推荐理由：Hugging Face老大用历史时间线论证为什么开源先于通用AI，中国和美国在这波AI竞赛里的角色有了新视角。

原文

15:11

@koltregaskes@koltregaskes

据 X 平台用户 koltregaskes 发帖，OpenAI 可能正在测试 GPT-5.6，以便在下周推出。OpenAI 员工 Derya 对此表现兴奋。目前尚未有官方确认，属于市场猜测。

行业 GPT-5.6 OpenAI Derya 模型发布传闻

推荐理由：有人在猜 GPT-5.6 下周就来，OpenAI 内部人也在嗨，看看是不是真的。

原文

00:21

orange.ai@oran_ge

73°

OpenAI 发布新论文《Beneficial RL》，研究对齐训练中好行为的泛化能力。实验发现，用RL在对话数据上训练模型诚实、认知谦逊、可纠正等特质后，在44个训练未见的评测上，模型欺骗、谄媚、有害建议等行为均下降。仅用健康领域数据训练，非健康领域也有效。对抗性提示和恶意微调更难使模型变坏，但正常指令仍可执行。

论文 OpenAI RL 对齐 AI安全有益强化学习

推荐理由：OpenAI 这篇论文很有意思：用 RL 给模型‘教好’会泛化到所有领域，而且抗忽悠能力变强了，像给人打了一剂道德疫苗。

原文

6月20日

12:57

歸藏(guizang.ai)@op7418

精选71°

Noam Shazeer（Transformer论文作者之一、MoE架构提出者）加入OpenAI，负责模型架构研究。谷歌此前以27亿美元收购Character.AI换取他加入谷歌。但Shazeer在谷歌停留短暂后即转投OpenAI。

行业 Noam Shazeer Transformer MoE OpenAI Character.AI 模型架构

推荐理由：Transformer论文作者Noam Shazeer，MoE提出者，跑到OpenAI研究模型架构了，谷歌27亿美元白花了？

原文

12:45

宝玉@dotey

精选74°

Codex 推出 Handoff 功能，允许用户将编程任务在笔记本和远程服务器间迁移。操作通过聊天框自然语言指令完成，例如说“把我正在跑的线程迁移到远程主机上”。迁移内容包括完整的 Git 状态（未提交代码、当前分支），确保代码从离开位置继续。使用前提是配置 SSH 连接、远程安装 Codex 并登录同一 ChatGPT 账号，且双方有相同 Git 仓库克隆。

AI产品 Codex Handoff OpenAI 编程助手远程开发

推荐理由：Codex 这个 Handoff 功能用自然语言就能把写代码的任务搬到远程服务器，Git 状态完整迁移，适合经常移动办公的开发者。

原文

03:06

Matt Wolfe@mreflow

83°

Transformer共同发明人Noam Shazeer离开Google DeepMind，加入OpenAI。AlphaFold核心开发者John Jumper（因该成果获2024年诺贝尔化学奖）也选择离职，传闻去向是Anthropic。两人分别在不同领域做出里程碑式贡献，此次出走对Google DeepMind的研发实力造成显著冲击。事件凸显了当前顶尖AI人才争夺的白热化。

行业 Noam Shazeer John Jumper Google DeepMind OpenAI Anthropic AI人才竞争

推荐理由：OpenAI和Anthropic分别挖走Google DeepMind两位大佬，Transformer发明者和AlphaFold诺奖得主同时出走，人才战太激烈了。

原文

03:05

Together AI@togethercompute

88°

OpenAI 的 GPT Image 2 模型现已在 Together AI 的 Serverless Inference 服务中上线。开发者可通过该接口将图像生成与编辑功能集成到多模态应用中。模型支持精准布局控制、可读文本生成以及参考图像引导生成。Together AI 提供无服务器推理能力，无需管理基础设施即可调用。

AI模型 GPT Image 2 OpenAI Together AI 图像生成多模态

推荐理由：OpenAI 的新图像模型 GPT Image 2 现在能用 Together AI 的无服务器接口调用了，做多模态应用时直接用它生成和编辑图片，支持布局和文字控制，挺方便。

原文

01:48

Greg Brockman@gdb

OpenAI 与波士顿儿童医院合作，使用 o3 Deep Research 工具帮助诊断罕见遗传病。相关成果发表在《NEJM AI》期刊上。该工具通过分析全外显子组测序数据，协助医生识别致病基因变异。研究团队在视频中展示了具体诊断案例。

论文 OpenAI o3 罕见遗传病 AI诊断 NEJM AI

推荐理由：OpenAI 把 o3 模型用到罕见病诊断上，还发了 NEJM AI 论文，很实在的应用。

原文

6月19日

23:54

elvis@omarsar0

精选

论文提出三阶段流水线，从GUI轨迹中分段、聚类候选技能并训练技能感知策略。八个聚类中五个纯度≥0.95。但GRPO仅将技能步准确率从18.5%提升至20.5%，低于频率先验。作者指出弱边界检测器、无序段表示和离线奖励模型是三大原因。

论文 SKILL.md Codex OpenAI 智能体 GRPO

推荐理由：这篇论文用OpenAI Codex的思路做智能体技能提取，八个聚类五个纯度超0.95，但GRPO只提了2个点，分析很实在。

原文

17:12

Greg Brockman@gdb

Codex 桌面应用来自 OpenAI，用户展示了一个包含近 300 个子代理的会话，已持续运行超过一天。该用户表示体验流畅、无任何问题。该应用通过开源项目 lazycodex 增强，展现了强大的多代理协作稳定性。

AI产品 Codex OpenAI 智能体编程助手

推荐理由：看看 OpenAI 的 Codex 桌面端，跑 300 个代理连续一天都不卡，稳定性真的夸张。

原文

13:39

Greg Brockman@gdb

OpenAI 为 ChatGPT Enterprise 管理员新增了信用使用分析和更新后的消费控制功能。管理员可在工作区、组和用户三级粒度管理 Codex 的消费限额。用户现在能查看自己的信用消耗情况，并可通过请求额外信用来扩展使用。该功能已在全球管理控制台中上线。

AI产品 ChatGPT Enterprise OpenAI Codex 企业功能消费控制

推荐理由：OpenAI 给企业版加了好用功能，管理员能按工作区、组、用户分级别管 Codex 的钱，用户也能看自己用了多少信用还能申请加量。

原文

09:26

Yangyi@Yangyixxxx

精选

OpenAI Codex 桌面端推出 Record & Replay 功能，用户可在 macOS 上演示重复性操作，Codex 自动生成可复用的 Skill 文件。生成的 Skill 包含触发条件、输入、步骤和验证方式，支持检查和编辑。重放时只需告诉 Codex 应用的 Skill 并传入新参数，Codex 结合 Computer Use、浏览器和已连 plugin 完成任务。目前仅限 macOS，欧盟暂不可用，使用前需开启 Computer Use。

AI产品 OpenAI Codex macOS Computer Use 自动化

推荐理由：OpenAI Codex 新功能让你在 Mac 上演示一遍操作，它就能自动记录并重复执行，以后填单、发视频这类固定流程再不用手写了。

原文

08:29

@koltregaskes@koltregaskes

OpenAI推出新功能，但未支持Windows平台，也不向英国和欧盟用户开放。该功能似乎并非移动端特性。此前电脑端功能等待时间不长，用户期望此次也能尽快扩展覆盖。

行业 OpenAI 地区限制 Windows 英国欧盟

推荐理由：OpenAI又发新东西了，不过这次Windows用户、英国和欧盟的朋友先别激动，暂时用不了。看看吐槽。

原文

07:44

orange.ai@oran_ge

86°

OpenAI发现对齐大模型时存在涌现失调现象，即坏行为会泛化。他们反向实验用RL训练模型诚实、谦逊、可纠正等特质，仅混入小部分此类数据。结果在训练领域内模型变得更诚实透明；在44个独立评测（未见过）中，欺骗、谄媚、有害建议等行为全面下降，即使只用健康数据训练，非健康领域也受益。模型在对抗性提示和恶意微调下更坚韧，正常指令仍可听从。

论文 OpenAI RL 涌现失调对齐 AI安全

推荐理由：OpenAI这篇论文反直觉：用RL教模型做好事，坏行为自己就减少了。实验覆盖44个新场景，效果还抗攻击。值得一看。

原文

07:11

OpenAI@OpenAI

OpenAI通过少量训练数据使模型在53项独立评估中的44项上取得改进，涵盖欺骗、奖励黑客、安全、健康、心理健康等领域。该表现优于计算匹配的基线模型。评估涉及多种领域、任务格式和评分方案。

论文 OpenAI 对齐 AI安全模型训练

推荐理由：OpenAI发现用一点额外数据就能让模型在超多对齐测试里变好，覆盖欺骗、安全、健康等方面，挺牛的。

原文

07:10

OpenAI@OpenAI

OpenAI在真实对话中训练模型，通过强化学习强化诚实、谦逊、开放纠正、公平和关怀人类福祉等特质。该训练覆盖健康、科学、教育等12个领域，旨在提升模型的对齐与安全性。方法基于RLHF改进，专注对话场景中的具体行为。

AI模型 OpenAI 强化学习 AI安全对齐模型训练

推荐理由：OpenAI训练模型时不止看能力，还用强化学习专门教它诚实、谦逊、愿意接受批评，覆盖12个领域，对AI安全性很有意义。

原文

07:06

Greg Brockman@gdb

OpenAI o1推理模型公布后，其他实验室研究者认为这是战略失误，应保密以拉开差距。Noam Brown引用研究表示，公开o1有助于推动医学推理领域的进展。这验证了OpenAI开放模型的正确性，加速了推理范式的应用。

AI模型 OpenAI o1 推理模型医学公开研究

推荐理由：Noam Brown聊了OpenAI开放o1背后的争论，告诉你为什么公开反而能让医学推理进步更快。

原文

06:39

OpenAI@OpenAI

精选

OpenAI发布测试结果，评估模型对齐在压力下的表现。在对抗性提示下，模型更难被引导至有害行为，同时依然能响应有益指令。初步证据表明，模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性，未提及具体模型版本或基准分数。

AI模型 OpenAI 对齐对抗性提示有害微调鲁棒性

推荐理由：OpenAI发现他们的模型在对抗压力下挺得住，不容易被带坏，安全对齐效果不错。

原文

06:38

Greg Brockman@gdb

精选72°

OpenAI 与波士顿儿童医院及哈佛大学合作，在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例，她从 9 岁起持续肌肉无力，在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。

AI模型 OpenAI o3 Deep Research 罕见病推理模型医疗AI

推荐理由：OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例，找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁，终于有了答案。这 AI 真的能救命。

原文

06:37

OpenAI@OpenAI

OpenAI 发布声明称，这是朝向更鲁棒有益和对齐模型的早期步骤。他们正在训练模型将有益特质带入新情境，使AI在能力增强的同时变得更可靠、透明和有用。该工作属于对齐研究的一部分，尚未披露具体模型或基准测试结果。

AI模型 OpenAI AI安全对齐

推荐理由：OpenAI 开始教模型把好习惯带到新场景，让AI更靠谱。这个对齐实验挺关键，关注未来进展。

原文

06:22

OpenAI@OpenAI

73°

OpenAI发布新研究，旨在训练AI模型将有益和安全行为推广到训练范围之外的新领域，并在压力下维持。该方法聚焦于让模型具备广泛且持久的利他性，论文名为《Beneficial RL》。研究通过强化学习框架，让模型学会在更长、更高风险的任务中自主保持符合人类意图的行为，而不仅是拟合训练数据。相关论文和代码已发布在alignment.openai.com/beneficial-rl/。

论文 OpenAI AI安全智能体强化学习

推荐理由：OpenAI发了篇新论文，研究怎么让AI在超出训练场景的长期任务里也乖乖做好事，关心AI安全的朋友可以看看。

原文

04:40

Greg Brockman@gdb

精选

OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流（如填写费用报告或提交休假申请），系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。

AI产品 Codex OpenAI Record & Replay 工作流自动化 AI编程助手

推荐理由：OpenAI 给 Codex 加了个新玩法：你演示一次操作，它就能学会并复用，比如填报销单。还能编辑保存的技能，挺实用。

原文

04:32

The Rundown AI@therundownai

OpenAI于3月取消了与迪士尼的10亿美元合作计划。迪士尼幻想工程随后与Adobe合作，利用自家IP（米奇、冰雪奇缘、汽车总动员）训练AI，旨在加速主题公园设计。迪士尼还宣布将在7月推出新的beta工具，该工具能为小广告主生成完整电视广告（包括脚本、视频和音乐）。该工具主要面向预算有限、无法负担创意代理的小型企业。

行业 Disney OpenAI Adobe 广告生成视频生成

推荐理由：迪士尼不跟OpenAI玩了，自己联手Adobe用经典IP训练AI，还要出广告生成工具，挺实在的。

原文

03:03

Greg Brockman@gdb

76°

OpenAI 发布 GPT-5.5 Instant，其健康相关问题的回答水平已与前沿思考模型持平。该模型联合 60 个国家、49 种语言、26 个专科的数百名医生共同开发。每周有超过 2.3 亿用户向 ChatGPT 咨询健康问题。GPT-5.5 Instant 在识别紧急情况、询问上下文、解释不确定性及简化复杂信息方面表现更优。该模型已面向所有免费用户开放。

AI模型 GPT-5.5 OpenAI ChatGPT 健康问答医疗AI

推荐理由：OpenAI 出了 GPT-5.5 Instant，免费版就能用，健康问答能力大幅提升，和医生合作训练的，靠谱。

原文

02:39

OpenAI@OpenAI

OpenAI 发布 GPT-5.5 Instant，该模型在健康相关问题上的表现与前端推理模型（如 o1）持平。每周超过 2.3 亿人通过 ChatGPT 咨询健康问题，新模型能更准确识别需要紧急护理的情况，主动询问相关背景，明确解释不确定性，并简化复杂医学术语。所有免费用户均可使用 GPT-5.5 Instant，无需订阅。此次改进基于医生主导的评估，确保了医疗场景下的可靠性。

AI模型 GPT-5.5 Instant OpenAI 健康推理模型 ChatGPT

推荐理由：OpenAI 把 GPT-5.5 Instant 的医疗问答能力做到了和自家顶级推理模型一样好，而且免费用户都能用，生病问AI更放心了。

原文

02:38

OpenAI@OpenAI

OpenAI在推文中称，改善人类健康将是AGI最具体、直接的影响之一。该公司表示，随着模型持续改进，目标是让ChatGPT在健康相关场景中更准确、更有用。OpenAI承诺将这一进展带给更多人，但未透露具体模型版本或时间线。

行业 OpenAI ChatGPT 医疗健康

推荐理由：OpenAI画了个大饼，说AGI能帮人更健康，还打算让ChatGPT更准更有用。虽然没细节，但方向挺有意思。

原文