14:23小互@imxiaohuOpenAI 发布了 Codex 的新版本,用于修复此前出现的问题。官方表示该版本已缓解了故障。Codex 是 OpenAI 发布的编程助手模型。新版本改进了稳定性。AI产品OpenAICodex问题修复10 个信源在谈推荐理由:OpenAI 刚刚给 Codex 打了一个补丁,如果你用 Codex 写代码遇到问题,可以试试升级。原文
14:08Greg Brockman@gdb精选72°OpenAI 发布 Patch the Planet 项目,与 Trail of Bits、HackerOne 等安全研究机构合作。该项目利用 Codex Security 和前沿 AI 模型,帮助开源软件维护者将安全发现转化为合并修复。流程以人工审核为中心,旨在提升关键开源项目的安全性。AI产品OpenAICodex Security开源安全安全修复10 个信源在谈推荐理由:OpenAI 找来 Trail of Bits 和 HackerOne 的安全研究员,用 Codex Security 帮开源项目修漏洞,还能自动生成合并修复,省心省力。原文
13:54@koltregaskes@koltregaskesOpenAI的实时语音模式“Bidi 1”即将推出,目前已在UI中出现但处于隐藏状态。该功能预计在近期内开放给用户使用。消息来自X平台用户爆料。AI产品OpenAIBidi 1实时语音语音模式10 个信源在谈推荐理由:OpenAI马上要出实时语音模式“Bidi 1”了,界面里已经藏着一个彩蛋,很快就能用上。原文
03:57Greg Brockman@gdb精选73°OpenAI推出了Codex Security插件,专为安全团队设计。该插件支持深度代码扫描、自动验证发现结果,并能够追踪攻击路径。它还可以构建威胁模型,生成针对代码库的特定补丁用于审查。此外,支持将分析结果导出到其他安全工具中。AI产品CodexOpenAI安全代码扫描AI安全10 个信源在谈推荐理由:OpenAI给安全团队出了个Codex插件,能深度扫描代码、自动验证漏洞、画攻击路径,还生成专属补丁,省事儿不少。原文
02:03Greg Brockman@gdb精选OpenAI 在 Daybreak 项目中推出新工具和模型,加速关键漏洞的发现和修补。其模型已能为 FreeBSD、Linux kernel、cURL、Go、Python、Sigstore、pyca/cryptography 等生成补丁。新发布的包括 Codex Security 插件(在 Codex 内修复漏洞)、GPT-5.5-Cyber 模型(专为防御者设计)、Cyber Partner Program(安全公司合作)以及 Patch the Planet(开源项目维护)。AI产品OpenAIGPT-5.5-CyberCodex SecurityDaybreakAI安全10 个信源在谈推荐理由:OpenAI 的 Daybreak 现在不仅能找漏洞,还能自动打补丁了,连 Linux 内核和 FreeBSD 都支持,安全团队可以试试 GPT-5.5-Cyber。原文
01:19OpenAI@OpenAIOpenAI 宣布启动 Daybreak Cyber Partner Program,与领先的安全软件和服务提供商合作。合作伙伴可在其安全产品和服务中使用 GPT-5.5 with Trusted Access for Cyber。客户能受益于该模型的防御能力,提升软件韧性,但直接模型访问权由合作伙伴控制。该计划旨在通过渠道模式推广 AI 安全能力。行业OpenAIGPT-5.5DaybreakAI安全安全软件10 个信源在谈推荐理由:OpenAI 联合安全厂商,让 GPT-5.5 直接嵌入安全产品,客户不用管理模型,就能享受更强的网络防御。原文
01:19OpenAI@OpenAIOpenAI 宣布推出 Patch the Planet 项目,与 Trail of Bits、HackerOne 及多位安全研究员和开源维护者合作。该项目利用 Codex Security 和高级模型(如 GPT-4)协助将安全发现快速转化为合并修复。修复过程以人工审核为中心,确保补丁质量。目标是降低开源项目从漏洞披露到修复的时间门槛。行业OpenAICodex SecurityTrail of BitsHackerOneAI安全10 个信源在谈推荐理由:OpenAI 联手 Trail of Bits 和 HackerOne,用 Codex Security 帮开源项目快速修漏洞,人工把关,靠谱。原文
01:18OpenAI@OpenAI73°OpenAI 宣布扩大 Daybreak 计划,新增 Codex Security 插件,允许用户在 Codex 内发现、验证和修复漏洞。同时发布完整版 GPT-5.5-Cyber 模型,专为可信防御者设计。Cyber Partner Program 允许安全公司基于 OpenAI 的安全能力构建产品。Patch the Planet 项目则与维护者合作,保护关键开源项目。AI产品OpenAIDaybreakCodexGPT-5.5-CyberAI安全10 个信源在谈推荐理由:OpenAI 搞了个 Daybreak 扩展,直接在 Codex 里修漏洞,还有专门的安全模型 GPT-5.5-Cyber,想帮安全团队快速打补丁。原文
00:53AI Breakfast@AiBreakfast一条推文调侃OpenAI模型发布节奏,称GPT-5.6早一天发布,关于GPT-5.7的讨论就能早一天开始。该推文获得32个点赞和5601次查看,另附4条回复与7个数据点。社区对GPT-5系列后续版本的关注度可见一斑。行业GPT-5.6GPT-5.7OpenAI版本迭代10 个信源在谈推荐理由:网友在催OpenAI赶紧出GPT-5.6,好直接开始聊5.7,挺有意思的行业梗。原文
16:32AI Will@FinanceYF5Calvin Zhang宣布从Scale AI离职,加入OpenAI担任研究项目经理,专注于模型评估工作。他在Scale AI期间参与了Humanity's Last Exam项目,并协助启动了Scale AI Labs。他还负责过数据、评估和研究相关合作。此次人事变动显示OpenAI正加强模型评估团队。行业OpenAIScale AI人事变动模型评估10 个信源在谈推荐理由:Calvin Zhang在Scale AI做过Humanity's Last Exam,现在去OpenAI负责evals,可能意味着更严的模型测试要来了。原文
16:32AI Will@FinanceYF5Calvin Zhang 正式加入 OpenAI,担任 Research Program Manager,负责评测工作。他此前在 Scale AI 积累了高强度、重视质量的经验。顶级评测人才的流动被视为 AI 军备竞赛的晴雨表。行业Calvin ZhangOpenAIScale AI评估AI 军备竞赛10 个信源在谈推荐理由:Calvin Zhang 从 Scale AI 跳槽到 OpenAI,专攻模型评测,这行的人才动向很说明问题。原文
14:26Aadit Sheth@aaditshAlisa Liu分享了加入OpenAI的求职经历:她经历了57次面试、46次招聘电话和16次offer后的沟通,最终成功入职。她强调,在AI研究招聘中,有人内推是最重要的因素,一份内推相当于40份冷投简历。正式的招聘流程只是辅助渠道,人脉网络才是真正的面试通道。内推在当前的AI招聘市场中起着决定性作用。行业OpenAI招聘内推AI research10 个信源在谈推荐理由:作者用真实数字告诉你,投OpenAI的简历堆成山,但一封内推信就能让你直接进面试。想进AI巨头?先建人脉。原文
03:49@koltregaskes@koltregaskesX用户koltregaskes分享的截图显示,ChatGPT在一段对话中回复需要更多时间进行检查,暗示GPT-5.6可能引入更严格的安全机制。目前OpenAI官方未对此消息确认。GPT-5.6是传闻中的下一代模型,但具体发布时间与功能细节仍未公布。AI模型GPT-5.6OpenAIAI安全10 个信源在谈推荐理由:OpenAI可能推出的GPT-5.6会增加安全检查,想提前了解变化可以看看这个讨论。原文
22:24Viking@vikingmute用户反馈OpenAI Codex中GPT-5.5模型token消耗速度突然增加10-20倍。Plus用户原本5小时额度仅用2-3个prompt就耗尽,Pro账户也比原来快很多。该问题在X平台引发大量点赞和讨论,目前尚未有官方回应。AI产品CodexGPT-5.5OpenAI编程助手token消耗10 个信源在谈推荐理由:Codex的GPT-5.5最近token消耗飞快,Plus额度几下就用完,Pro用户也受影响,快看看你的账户。原文
22:03Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue分析指出,2016-2024年美国在开源AI领域领先,2024-2027年将在通用AI领域领先并受益。2024-2026年中国在开源AI方面领先,2026-2030年未知。他认为开源AI是通用AI的基础,能加速国家技术生态进步,OpenAI/Google从开放科学和开源AI起步,主导了AI领域。Meta由于改变策略,失去了类似机遇。行业开源AI通用AIHugging FaceOpenAIGoogle10 个信源在谈推荐理由:Hugging Face老大用历史时间线论证为什么开源先于通用AI,中国和美国在这波AI竞赛里的角色有了新视角。原文
15:11@koltregaskes@koltregaskes据 X 平台用户 koltregaskes 发帖,OpenAI 可能正在测试 GPT-5.6,以便在下周推出。OpenAI 员工 Derya 对此表现兴奋。目前尚未有官方确认,属于市场猜测。行业GPT-5.6OpenAIDerya模型发布传闻10 个信源在谈推荐理由:有人在猜 GPT-5.6 下周就来,OpenAI 内部人也在嗨,看看是不是真的。原文
00:21orange.ai@oran_ge73°OpenAI 发布新论文《Beneficial RL》,研究对齐训练中好行为的泛化能力。实验发现,用RL在对话数据上训练模型诚实、认知谦逊、可纠正等特质后,在44个训练未见的评测上,模型欺骗、谄媚、有害建议等行为均下降。仅用健康领域数据训练,非健康领域也有效。对抗性提示和恶意微调更难使模型变坏,但正常指令仍可执行。论文OpenAIRL对齐AI安全有益强化学习9 个信源在谈推荐理由:OpenAI 这篇论文很有意思:用 RL 给模型‘教好’会泛化到所有领域,而且抗忽悠能力变强了,像给人打了一剂道德疫苗。原文
12:57歸藏(guizang.ai)@op7418精选71°Noam Shazeer(Transformer论文作者之一、MoE架构提出者)加入OpenAI,负责模型架构研究。谷歌此前以27亿美元收购Character.AI换取他加入谷歌。但Shazeer在谷歌停留短暂后即转投OpenAI。行业Noam ShazeerTransformerMoEOpenAICharacter.AI模型架构10 个信源在谈推荐理由:Transformer论文作者Noam Shazeer,MoE提出者,跑到OpenAI研究模型架构了,谷歌27亿美元白花了?原文
12:45宝玉@dotey精选74°Codex 推出 Handoff 功能,允许用户将编程任务在笔记本和远程服务器间迁移。操作通过聊天框自然语言指令完成,例如说“把我正在跑的线程迁移到远程主机上”。迁移内容包括完整的 Git 状态(未提交代码、当前分支),确保代码从离开位置继续。使用前提是配置 SSH 连接、远程安装 Codex 并登录同一 ChatGPT 账号,且双方有相同 Git 仓库克隆。AI产品CodexHandoffOpenAI编程助手远程开发10 个信源在谈推荐理由:Codex 这个 Handoff 功能用自然语言就能把写代码的任务搬到远程服务器,Git 状态完整迁移,适合经常移动办公的开发者。原文
03:06Matt Wolfe@mreflow83°Transformer共同发明人Noam Shazeer离开Google DeepMind,加入OpenAI。AlphaFold核心开发者John Jumper(因该成果获2024年诺贝尔化学奖)也选择离职,传闻去向是Anthropic。两人分别在不同领域做出里程碑式贡献,此次出走对Google DeepMind的研发实力造成显著冲击。事件凸显了当前顶尖AI人才争夺的白热化。行业Noam ShazeerJohn JumperGoogle DeepMindOpenAIAnthropicAI人才竞争10 个信源在谈推荐理由:OpenAI和Anthropic分别挖走Google DeepMind两位大佬,Transformer发明者和AlphaFold诺奖得主同时出走,人才战太激烈了。原文
03:05Together AI@togethercompute88°OpenAI 的 GPT Image 2 模型现已在 Together AI 的 Serverless Inference 服务中上线。开发者可通过该接口将图像生成与编辑功能集成到多模态应用中。模型支持精准布局控制、可读文本生成以及参考图像引导生成。Together AI 提供无服务器推理能力,无需管理基础设施即可调用。AI模型GPT Image 2OpenAITogether AI图像生成多模态10 个信源在谈推荐理由:OpenAI 的新图像模型 GPT Image 2 现在能用 Together AI 的无服务器接口调用了,做多模态应用时直接用它生成和编辑图片,支持布局和文字控制,挺方便。原文
01:48Greg Brockman@gdbOpenAI 与波士顿儿童医院合作,使用 o3 Deep Research 工具帮助诊断罕见遗传病。相关成果发表在《NEJM AI》期刊上。该工具通过分析全外显子组测序数据,协助医生识别致病基因变异。研究团队在视频中展示了具体诊断案例。论文OpenAIo3罕见遗传病AI诊断NEJM AI5 个信源在谈推荐理由:OpenAI 把 o3 模型用到罕见病诊断上,还发了 NEJM AI 论文,很实在的应用。原文
23:54elvis@omarsar0精选论文提出三阶段流水线,从GUI轨迹中分段、聚类候选技能并训练技能感知策略。八个聚类中五个纯度≥0.95。但GRPO仅将技能步准确率从18.5%提升至20.5%,低于频率先验。作者指出弱边界检测器、无序段表示和离线奖励模型是三大原因。论文SKILL.mdCodexOpenAI智能体GRPO10 个信源在谈推荐理由:这篇论文用OpenAI Codex的思路做智能体技能提取,八个聚类五个纯度超0.95,但GRPO只提了2个点,分析很实在。原文
17:12Greg Brockman@gdbCodex 桌面应用来自 OpenAI,用户展示了一个包含近 300 个子代理的会话,已持续运行超过一天。该用户表示体验流畅、无任何问题。该应用通过开源项目 lazycodex 增强,展现了强大的多代理协作稳定性。AI产品CodexOpenAI智能体编程助手10 个信源在谈推荐理由:看看 OpenAI 的 Codex 桌面端,跑 300 个代理连续一天都不卡,稳定性真的夸张。原文
13:39Greg Brockman@gdbOpenAI 为 ChatGPT Enterprise 管理员新增了信用使用分析和更新后的消费控制功能。管理员可在工作区、组和用户三级粒度管理 Codex 的消费限额。用户现在能查看自己的信用消耗情况,并可通过请求额外信用来扩展使用。该功能已在全球管理控制台中上线。AI产品ChatGPT EnterpriseOpenAICodex企业功能消费控制10 个信源在谈推荐理由:OpenAI 给企业版加了好用功能,管理员能按工作区、组、用户分级别管 Codex 的钱,用户也能看自己用了多少信用还能申请加量。原文
09:26Yangyi@Yangyixxxx精选OpenAI Codex 桌面端推出 Record & Replay 功能,用户可在 macOS 上演示重复性操作,Codex 自动生成可复用的 Skill 文件。生成的 Skill 包含触发条件、输入、步骤和验证方式,支持检查和编辑。重放时只需告诉 Codex 应用的 Skill 并传入新参数,Codex 结合 Computer Use、浏览器和已连 plugin 完成任务。目前仅限 macOS,欧盟暂不可用,使用前需开启 Computer Use。AI产品OpenAICodexmacOSComputer Use自动化10 个信源在谈推荐理由:OpenAI Codex 新功能让你在 Mac 上演示一遍操作,它就能自动记录并重复执行,以后填单、发视频这类固定流程再不用手写了。原文
08:29@koltregaskes@koltregaskesOpenAI推出新功能,但未支持Windows平台,也不向英国和欧盟用户开放。该功能似乎并非移动端特性。此前电脑端功能等待时间不长,用户期望此次也能尽快扩展覆盖。行业OpenAI地区限制Windows英国欧盟10 个信源在谈推荐理由:OpenAI又发新东西了,不过这次Windows用户、英国和欧盟的朋友先别激动,暂时用不了。看看吐槽。原文
07:44orange.ai@oran_ge86°OpenAI发现对齐大模型时存在涌现失调现象,即坏行为会泛化。他们反向实验用RL训练模型诚实、谦逊、可纠正等特质,仅混入小部分此类数据。结果在训练领域内模型变得更诚实透明;在44个独立评测(未见过)中,欺骗、谄媚、有害建议等行为全面下降,即使只用健康数据训练,非健康领域也受益。模型在对抗性提示和恶意微调下更坚韧,正常指令仍可听从。论文OpenAIRL涌现失调对齐AI安全10 个信源在谈推荐理由:OpenAI这篇论文反直觉:用RL教模型做好事,坏行为自己就减少了。实验覆盖44个新场景,效果还抗攻击。值得一看。原文
07:11OpenAI@OpenAIOpenAI通过少量训练数据使模型在53项独立评估中的44项上取得改进,涵盖欺骗、奖励黑客、安全、健康、心理健康等领域。该表现优于计算匹配的基线模型。评估涉及多种领域、任务格式和评分方案。论文OpenAI对齐AI安全模型训练10 个信源在谈推荐理由:OpenAI发现用一点额外数据就能让模型在超多对齐测试里变好,覆盖欺骗、安全、健康等方面,挺牛的。原文
07:10OpenAI@OpenAIOpenAI在真实对话中训练模型,通过强化学习强化诚实、谦逊、开放纠正、公平和关怀人类福祉等特质。该训练覆盖健康、科学、教育等12个领域,旨在提升模型的对齐与安全性。方法基于RLHF改进,专注对话场景中的具体行为。AI模型OpenAI强化学习AI安全对齐模型训练10 个信源在谈推荐理由:OpenAI训练模型时不止看能力,还用强化学习专门教它诚实、谦逊、愿意接受批评,覆盖12个领域,对AI安全性很有意义。原文
07:06Greg Brockman@gdbOpenAI o1推理模型公布后,其他实验室研究者认为这是战略失误,应保密以拉开差距。Noam Brown引用研究表示,公开o1有助于推动医学推理领域的进展。这验证了OpenAI开放模型的正确性,加速了推理范式的应用。AI模型OpenAIo1推理模型医学公开研究10 个信源在谈推荐理由:Noam Brown聊了OpenAI开放o1背后的争论,告诉你为什么公开反而能让医学推理进步更快。原文
06:39OpenAI@OpenAI精选OpenAI发布测试结果,评估模型对齐在压力下的表现。在对抗性提示下,模型更难被引导至有害行为,同时依然能响应有益指令。初步证据表明,模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性,未提及具体模型版本或基准分数。AI模型OpenAI对齐对抗性提示有害微调鲁棒性10 个信源在谈推荐理由:OpenAI发现他们的模型在对抗压力下挺得住,不容易被带坏,安全对齐效果不错。原文
06:38Greg Brockman@gdb精选72°OpenAI 与波士顿儿童医院及哈佛大学合作,在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例,她从 9 岁起持续肌肉无力,在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。AI模型OpenAIo3 Deep Research罕见病推理模型医疗AI10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例,找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁,终于有了答案。这 AI 真的能救命。原文
06:37OpenAI@OpenAIOpenAI 发布声明称,这是朝向更鲁棒有益和对齐模型的早期步骤。他们正在训练模型将有益特质带入新情境,使AI在能力增强的同时变得更可靠、透明和有用。该工作属于对齐研究的一部分,尚未披露具体模型或基准测试结果。AI模型OpenAIAI安全对齐10 个信源在谈推荐理由:OpenAI 开始教模型把好习惯带到新场景,让AI更靠谱。这个对齐实验挺关键,关注未来进展。原文
06:22OpenAI@OpenAI73°OpenAI发布新研究,旨在训练AI模型将有益和安全行为推广到训练范围之外的新领域,并在压力下维持。该方法聚焦于让模型具备广泛且持久的利他性,论文名为《Beneficial RL》。研究通过强化学习框架,让模型学会在更长、更高风险的任务中自主保持符合人类意图的行为,而不仅是拟合训练数据。相关论文和代码已发布在alignment.openai.com/beneficial-rl/。论文OpenAIAI安全智能体强化学习10 个信源在谈推荐理由:OpenAI发了篇新论文,研究怎么让AI在超出训练场景的长期任务里也乖乖做好事,关心AI安全的朋友可以看看。原文
04:40Greg Brockman@gdb精选OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流(如填写费用报告或提交休假申请),系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。AI产品CodexOpenAIRecord & Replay工作流自动化AI编程助手10 个信源在谈推荐理由:OpenAI 给 Codex 加了个新玩法:你演示一次操作,它就能学会并复用,比如填报销单。还能编辑保存的技能,挺实用。原文
04:32The Rundown AI@therundownaiOpenAI于3月取消了与迪士尼的10亿美元合作计划。迪士尼幻想工程随后与Adobe合作,利用自家IP(米奇、冰雪奇缘、汽车总动员)训练AI,旨在加速主题公园设计。迪士尼还宣布将在7月推出新的beta工具,该工具能为小广告主生成完整电视广告(包括脚本、视频和音乐)。该工具主要面向预算有限、无法负担创意代理的小型企业。行业DisneyOpenAIAdobe广告生成视频生成10 个信源在谈推荐理由:迪士尼不跟OpenAI玩了,自己联手Adobe用经典IP训练AI,还要出广告生成工具,挺实在的。原文
03:03Greg Brockman@gdb76°OpenAI 发布 GPT-5.5 Instant,其健康相关问题的回答水平已与前沿思考模型持平。该模型联合 60 个国家、49 种语言、26 个专科的数百名医生共同开发。每周有超过 2.3 亿用户向 ChatGPT 咨询健康问题。GPT-5.5 Instant 在识别紧急情况、询问上下文、解释不确定性及简化复杂信息方面表现更优。该模型已面向所有免费用户开放。AI模型GPT-5.5OpenAIChatGPT健康问答医疗AI10 个信源在谈推荐理由:OpenAI 出了 GPT-5.5 Instant,免费版就能用,健康问答能力大幅提升,和医生合作训练的,靠谱。原文
02:39OpenAI@OpenAIOpenAI 发布 GPT-5.5 Instant,该模型在健康相关问题上的表现与前端推理模型(如 o1)持平。每周超过 2.3 亿人通过 ChatGPT 咨询健康问题,新模型能更准确识别需要紧急护理的情况,主动询问相关背景,明确解释不确定性,并简化复杂医学术语。所有免费用户均可使用 GPT-5.5 Instant,无需订阅。此次改进基于医生主导的评估,确保了医疗场景下的可靠性。AI模型GPT-5.5 InstantOpenAI健康推理模型ChatGPT10 个信源在谈推荐理由:OpenAI 把 GPT-5.5 Instant 的医疗问答能力做到了和自家顶级推理模型一样好,而且免费用户都能用,生病问AI更放心了。原文
02:38OpenAI@OpenAIOpenAI在推文中称,改善人类健康将是AGI最具体、直接的影响之一。该公司表示,随着模型持续改进,目标是让ChatGPT在健康相关场景中更准确、更有用。OpenAI承诺将这一进展带给更多人,但未透露具体模型版本或时间线。行业OpenAIChatGPT医疗健康10 个信源在谈推荐理由:OpenAI画了个大饼,说AGI能帮人更健康,还打算让ChatGPT更准更有用。虽然没细节,但方向挺有意思。原文