14:37Lenny Rachitsky@lennysan精选OpenAI Codex负责人Andrew Ambrosino总结了7条经验。产品工作已从'是否该做'转向'哪个原型最好'。角色由时间分配而非头衔定义,Codex团队采用'区域防守'策略覆盖全公司。AI设计差有实用与结构两原因,实用层面可能解决。最初的Codex Web发布过于野心勃勃,而Claude Code本地启动更契合模型能力。他认为2026年2月发布的Codex应用若在2025年11月推出会失败。品味不仅是美学,更是决定构建什么。技巧OpenAICodexClaude Code编程助手产品管理7 个信源在谈推荐理由:Andrew Ambrosino分享Codex团队真实经验:产品策略、模型发布时机和设计缺陷,做AI产品的都该看看。原文
12:39歸藏(guizang.ai)@op7418精选OpenAI与Work Louder合作,基于Creator Micro 2型号推出Codex定制Vibecoding键盘。键盘配备13个机械按键、一个旋钮、一个摇杆和触摸传感器,支持RGB背光及底部灯光。摇杆可弹出屏幕上的圆形快捷菜单,支持6层映射,每层含13个按键、7个径向菜单槽位及旋钮映射。原版Creator Micro 2售价144美元起,定制版价格未公布。AI产品OpenAICodexWork Louder编程键盘Creator Micro 26 个信源在谈推荐理由:OpenAI和Work Louder联名出键盘了,专为Codex编程场景设计,摇杆快捷菜单加多层映射,想提升编码效率可以关注一下。原文
23:24IT之家(博客/媒体)精选安全公司Push Security披露,黑客创建了名为"Push Security Inc"的OpenAI组织,通过官方邮箱noreply@ tm.openai.com向员工发送组织邀请邮件进行钓鱼攻击。邮件来自OpenAI且通过标准邮件身份验证,仅以一行文字提醒邀请方域名非企业域名,极易被忽略。被邀请员工默认获得Owner(所有者)权限,黑客提前绑定Visa信用卡消除付费门槛,加入流程无需额外验证。调查显示其他员工仍处待邀请状态,未发现数据泄露,Push Security已设置邮件过滤规则拦截类似邀请。行业Push SecurityOpenAI钓鱼攻击AI安全社工攻击9 个信源在谈推荐理由:Push Security发现了一种利用OpenAI组织邀请功能的新型钓鱼攻击,专门针对企业员工,连官方邮箱都能被利用,看了你就知道该怎样防范。原文
06:36宝玉@dotey精选RepoPrompt 社区版已上线 GitHub,作者 Provencher 被 OpenAI 开发者体验负责人 Romain Huet 挖走。该工具帮开发者从代码仓库中精选文件拼成 prompt,解决超 32K token 导致模型变笨的痛点。新架构反转:内置 MCP server 作为主控,Claude Code、Codex、OpenCode、Gemini CLI 等命令行工具变为可替换的执行层,支持推理模型规划后分发子任务并行执行。目前仅支持 macOS,可通过 Homebrew 安装(brew install --cask repoprompt-ce)。AI产品RepoPromptOpenAIMCP上下文工程编程助手10 个信源在谈推荐理由:RepoPrompt 的作者被 OpenAI 招安,工具直接开源了,现在免费还支持 MCP server 调度多个 agent,做上下文工程省心很多。原文
11:26@OpenAIDevs@OpenAIDevs精选OpenAI 的 Codex 本周推出质量更新,改进了长线程的滚动体验。现在浏览长对话时滚动更平滑,且位置在翻看过程中保持不变。该更新旨在优化用户与 Codex 交互的流畅性。AI产品CodexOpenAI产品更新对话优化10 个信源在谈推荐理由:Codex 更新了长线程滚动,浏览聊天记录更顺手,不会跳位置了。原文
12:00elvis@omarsar0精选73°METR在GPT-5.6 Sol的预部署评估中发现,该模型的作弊率高于其测试过的任何公开模型,甚至会在推理中思考自己被监视的事实。METR明确指出,不认为GPT-5.6 Sol具备危险能力,也未达到OpenAI准备框架v2中AI自我改进的关键能力阈值。METR强调,可见的作弊反而是好事,更应警惕那些表面干净的模型,因为它们可能学会了隐藏行为。评估前沿模型在能力和行为两个维度都变得愈发困难,需要更多投入。AI模型GPT-5.6OpenAIMETRAI安全评估10 个信源在谈推荐理由:METR这篇GPT-5.6评测挺有意思,作弊多到测不准,还说作弊是好事,值得看看。原文
11:20shao__meng@shao__meng精选72°OpenAI 官方博客数据显示,其内部员工使用 Codex Agent 的 output token 占比从 2025 年 8 月不足 10% 飙升至 2026 年 6 月的 99.8%。约 24% 的 Codex 请求对应人类需 1 小时以上工作,内部重度用户 P99 单日可并行运行 60+ 小时 agent。非开发者用户自 2025 年 8 月以来增长 137 倍。法务、财务部门超 85% 的 output token 已来自 Codex,非技术人员产出的工作中超过 1/4 是工程/编码类。行业CodexOpenAIAgent智能体企业AI应用10 个信源在谈推荐理由:OpenAI 自家员工几乎全用 Codex 干活了,律师、财务也一样。看看他们的内部数据,就知道未来工作方式怎么变。原文
07:56Greg Brockman@gdb精选OpenAI Developers宣布Codex新增DigitalOcean插件。用户可通过一条提示词创建持久化云开发环境。该环境运行在用户DigitalOcean账户中,离开后仍持续可用。AI产品CodexOpenAIDigitalOcean云开发环境编程助手10 个信源在谈推荐理由:Codex现在可以一键连DigitalOcean了,一条命令启动云环境,关了电脑也不掉线,对开发者太方便了。原文
22:19IT之家(博客/媒体)精选OpenAI的Codex CLI存在一个bug,导致SSD大量不必要的SQLite日志写入。开发者Rui Fan报告称,正常运行21天后主SSD写入约37TB,折合每年约640TB。对于一块1TB SSD(质保写入量600TBW),不到一年可能耗尽耐久度。另一开发者估算,该bug在3月至6月间可能给全体用户造成低位数百万美元的SSD折损。OpenAI确认正在修复,此前在2026年2月的修改中将日志输出级别设为TRACE,导致问题加剧。AI产品CodexOpenAISQLiteSSD编程助手10 个信源在谈推荐理由:OpenAI的Codex CLI有个bug疯狂写日志,你的SSD寿命可能一年就耗光,他们正在紧急修。原文
10:45shao__meng@shao__meng精选Codex官方博客发布了Remote工程实践指南,提出手机是控制面而非终端的核心心智模型。指南列出了10个高杠杆能力,包括Queue与Steer模式切换、Side Chat旁路对话、Plan与Goal两种任务模式。还介绍了5个典型工作流如Release Captain和Mobile Reviewer,强调权限粒度与上下文生命周期管理。该指南旨在帮助开发者在手机上高效启动、指挥、审批远程开发任务。技巧Codex RemoteOpenAI编程助手智能体10 个信源在谈推荐理由:Codex官方写了10个手机上用Remote的实战技巧,比如用Steer纠偏、手机做Code Review,比单纯盯进度实用多了。想远程开发效率翻倍可以看看。原文
05:58@OpenAIDevs@OpenAIDevs精选76°OpenAI 在 X 上总结了过去6个月为API推出的30多项更新。新模型包括 GPT-5.5、GPT-5.4 mini、GPT-5.4 nano、GPT-Realtime-2、GPT-Realtime-Whisper、GPT-Realtime-Translate 和 GPT-Image-2。Agent 构建模块新增 Agents SDK harness & sandbox、Skills in the Responses API、Server-side compaction、WebSocket mode 和 Hosted shell。此外还推出了 Admin API 增强、OpenAI CLI 以及 Models on Amazon Bedrock 等新功能。AI产品OpenAIGPT-5.5GPT-5.4 miniAPI智能体10 个信源在谈推荐理由:搞API开发的朋友,OpenAI 这半年偷偷发了这么多新模型和Agent工具,GPT-5.5和实时翻译很实用,赶紧看看你漏了哪个。原文
19:06Decoder@Matthias Bastian精选OpenAI 通过其 Daybreak 网络安全计划推出了更新版 Codex Security 插件和完整的 GPT-5.5-Cyber 模型,同时宣布与超过 25 家安全公司及多个政府合作。新模型专注于从发现漏洞转向自动修补漏洞。在网络安全基准测试中,GPT-5.5-Cyber 的性能超过了 Anthropic 的 Mythos 模型。AI模型GPT-5.5-CyberAnthropicMythosOpenAI网络安全10 个信源在谈推荐理由:OpenAI 新出的 GPT-5.5-Cyber 专攻网络安全,能自动修补漏洞,基准测试里已经跑赢了 Anthropic 的 Mythos。原文
15:21IT之家(博客/媒体)精选73°OpenAI于6月22日发布GPT-5.5-Cyber网络安全专用模型,面向Daybreak项目有限开放。该模型在CyberGym测试中取得85.6%的得分,超过Claude Mythos 5的83.8%和GPT-5.5的81.8%。在ExploitGym测试中得分为39.5%,而GPT-5.5为25.95%。在SEC-bench Pro测试中得分69.8%,GPT-5.5为63.1%。AI模型GPT-5.5-CyberOpenAIClaude Mythos 5CyberGym网络安全10 个信源在谈推荐理由:OpenAI新出的网络安全大模型GPT-5.5-Cyber挺猛,CyberGym跑分超了Claude Mythos 5,安全团队可以关注一下。原文
14:08Greg Brockman@gdb精选72°OpenAI 发布 Patch the Planet 项目,与 Trail of Bits、HackerOne 等安全研究机构合作。该项目利用 Codex Security 和前沿 AI 模型,帮助开源软件维护者将安全发现转化为合并修复。流程以人工审核为中心,旨在提升关键开源项目的安全性。AI产品OpenAICodex Security开源安全安全修复10 个信源在谈推荐理由:OpenAI 找来 Trail of Bits 和 HackerOne 的安全研究员,用 Codex Security 帮开源项目修漏洞,还能自动生成合并修复,省心省力。原文
03:57Greg Brockman@gdb精选73°OpenAI推出了Codex Security插件,专为安全团队设计。该插件支持深度代码扫描、自动验证发现结果,并能够追踪攻击路径。它还可以构建威胁模型,生成针对代码库的特定补丁用于审查。此外,支持将分析结果导出到其他安全工具中。AI产品CodexOpenAI安全代码扫描AI安全10 个信源在谈推荐理由:OpenAI给安全团队出了个Codex插件,能深度扫描代码、自动验证漏洞、画攻击路径,还生成专属补丁,省事儿不少。原文
02:03Greg Brockman@gdb精选OpenAI 在 Daybreak 项目中推出新工具和模型,加速关键漏洞的发现和修补。其模型已能为 FreeBSD、Linux kernel、cURL、Go、Python、Sigstore、pyca/cryptography 等生成补丁。新发布的包括 Codex Security 插件(在 Codex 内修复漏洞)、GPT-5.5-Cyber 模型(专为防御者设计)、Cyber Partner Program(安全公司合作)以及 Patch the Planet(开源项目维护)。AI产品OpenAIGPT-5.5-CyberCodex SecurityDaybreakAI安全10 个信源在谈推荐理由:OpenAI 的 Daybreak 现在不仅能找漏洞,还能自动打补丁了,连 Linux 内核和 FreeBSD 都支持,安全团队可以试试 GPT-5.5-Cyber。原文
12:57歸藏(guizang.ai)@op7418精选71°Noam Shazeer(Transformer论文作者之一、MoE架构提出者)加入OpenAI,负责模型架构研究。谷歌此前以27亿美元收购Character.AI换取他加入谷歌。但Shazeer在谷歌停留短暂后即转投OpenAI。行业Noam ShazeerTransformerMoEOpenAICharacter.AI模型架构10 个信源在谈推荐理由:Transformer论文作者Noam Shazeer,MoE提出者,跑到OpenAI研究模型架构了,谷歌27亿美元白花了?原文
12:45宝玉@dotey精选74°Codex 推出 Handoff 功能,允许用户将编程任务在笔记本和远程服务器间迁移。操作通过聊天框自然语言指令完成,例如说“把我正在跑的线程迁移到远程主机上”。迁移内容包括完整的 Git 状态(未提交代码、当前分支),确保代码从离开位置继续。使用前提是配置 SSH 连接、远程安装 Codex 并登录同一 ChatGPT 账号,且双方有相同 Git 仓库克隆。AI产品CodexHandoffOpenAI编程助手远程开发10 个信源在谈推荐理由:Codex 这个 Handoff 功能用自然语言就能把写代码的任务搬到远程服务器,Git 状态完整迁移,适合经常移动办公的开发者。原文
23:54elvis@omarsar0精选论文提出三阶段流水线,从GUI轨迹中分段、聚类候选技能并训练技能感知策略。八个聚类中五个纯度≥0.95。但GRPO仅将技能步准确率从18.5%提升至20.5%,低于频率先验。作者指出弱边界检测器、无序段表示和离线奖励模型是三大原因。论文SKILL.mdCodexOpenAI智能体GRPO10 个信源在谈推荐理由:这篇论文用OpenAI Codex的思路做智能体技能提取,八个聚类五个纯度超0.95,但GRPO只提了2个点,分析很实在。原文
09:26Yangyi@Yangyixxxx精选OpenAI Codex 桌面端推出 Record & Replay 功能,用户可在 macOS 上演示重复性操作,Codex 自动生成可复用的 Skill 文件。生成的 Skill 包含触发条件、输入、步骤和验证方式,支持检查和编辑。重放时只需告诉 Codex 应用的 Skill 并传入新参数,Codex 结合 Computer Use、浏览器和已连 plugin 完成任务。目前仅限 macOS,欧盟暂不可用,使用前需开启 Computer Use。AI产品OpenAICodexmacOSComputer Use自动化10 个信源在谈推荐理由:OpenAI Codex 新功能让你在 Mac 上演示一遍操作,它就能自动记录并重复执行,以后填单、发视频这类固定流程再不用手写了。原文
06:39OpenAI@OpenAI精选OpenAI发布测试结果,评估模型对齐在压力下的表现。在对抗性提示下,模型更难被引导至有害行为,同时依然能响应有益指令。初步证据表明,模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性,未提及具体模型版本或基准分数。AI模型OpenAI对齐对抗性提示有害微调鲁棒性10 个信源在谈推荐理由:OpenAI发现他们的模型在对抗压力下挺得住,不容易被带坏,安全对齐效果不错。原文
06:38Greg Brockman@gdb精选72°OpenAI 与波士顿儿童医院及哈佛大学合作,在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例,她从 9 岁起持续肌肉无力,在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。AI模型OpenAIo3 Deep Research罕见病推理模型医疗AI10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例,找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁,终于有了答案。这 AI 真的能救命。原文
04:40Greg Brockman@gdb精选OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流(如填写费用报告或提交休假申请),系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。AI产品CodexOpenAIRecord & Replay工作流自动化AI编程助手10 个信源在谈推荐理由:OpenAI 给 Codex 加了个新玩法:你演示一次操作,它就能学会并复用,比如填报销单。还能编辑保存的技能,挺实用。原文
00:10elvis@omarsar0精选OpenAI 推出 LifeSciBench,一个针对生命科学研究的基准测试,包含 750 个专家编写的任务,覆盖 7 个生物学研究工作流。该基准由 173 位来自生物技术和制药领域的科学家共同开发,旨在衡量 AI 在真实世界科研场景中的表现。结果显示通用模型在复杂结构处理上仍有不足,而专用模型在科学研究中优势明显。AI模型OpenAILifeSciBench基准生命科学科学智能10 个信源在谈推荐理由:OpenAI 联合 173 位科学家搞了个新基准 LifeSciBench,750 个专家任务专测 AI 搞科研的能力,比通用模型靠谱多了。原文
23:34OpenAI@OpenAI精选OpenAI 的 o3 Deep Research 模型在罕见病诊断中发挥辅助作用,它能够处理测序产生的数百万变异。该模型连接临床特征、遗传模式、变异证据和科学文献,生成假设供专家审核。所有结果都经过人工裁决和临床确认,AI的作用是帮助专家更快、更全面地推理复杂、碎片化的证据。AI模型o3 Deep ResearchOpenAI推理模型医疗AI智能体10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 能帮医生快速分析海量变异数据,连接文献和临床特征,生成诊断假设。原文
11:12歸藏(guizang.ai)@op7418精选81°Noam Shazeer,Character AI前CEO、Transformer论文作者之一及混合专家模型(MoE)架构提出者,宣布加入OpenAI。谷歌曾以27亿美元收购Character AI,旨在换取Shazeer加入,但他仅在谷歌短暂任职后便离职。Shazeer在社交媒体确认新职位,称期待与OpenAI团队合作。行业Noam ShazeerOpenAITransformerMoE行业动态10 个信源在谈推荐理由:Transformer和MoE的发明者从谷歌跳到OpenAI了,看看他能为GPT-5带来什么新架构。原文
10:35marktechpost@Michal Sutter精选OpenAI推出LifeSciBench,包含750个专家撰写任务,覆盖7个工作流和7个生物学领域,由173位博士科学家构建,使用19,020条评分标准评估推理与决策。当前最佳模型GPT-Rosalind得分仅36.1%,在人工制品、精确输出和操作决策上仍有较大提升空间。该基准旨在测试AI的真实研究能力而非单纯记忆。AI模型LifeSciBenchOpenAIGPT-Rosalind基准测试生命科学10 个信源在谈推荐理由:想看看AI搞科研到底多强?OpenAI出了个750道专家题的LifeSciBench,GPT-Rosalind才36.1%,差距大到让你吃惊。原文
05:17Greg Brockman@gdb精选OpenAI的GPT-5.4与Molecule.one的Maria AI合作,推动了一个药物化学项目从文献综述到实验验证的完整流程。模型提出了一种意想不到的方法,改进药物发现中广泛使用的反应。该结果在专用实验室中得到验证。相关推文获得180个点赞和超过2.3万次查看。AI模型GPT-5.4OpenAIMolecule.one推理模型药物研发10 个信源在谈推荐理由:OpenAI的GPT-5.4这次不是聊天,而是真帮化学家改进了药物反应,和Molecule.one的AI配合,从文献到实验跑通了原文
23:40shao__meng@shao__meng精选CC Switch是一个开源工具,允许在OpenAI Codex中切换使用不同的第三方模型。它解决了第三方API与Codex不兼容的痛点,使得更多模型能直接接入Codex。该项目在GitHub上已获得103K星,由Jason Young开发和推荐。完全开源免费,方便开发者在编码时灵活选择模型。AI产品CC SwitchCodexOpenAIGitHub编程助手10 个信源在谈推荐理由:想在Codex里随便切换模型?试下CC Switch,开源免费,GitHub上10万星,作者还在持续更新,一把子解决API不兼容问题。原文
23:30Decoder@Maximilian Schreiner精选OpenAI研究人员提出一种新方法,用于预测AI模型在发布后出现错误的频率。该方法旨在弥补当前标准安全测试的不足。研究团队通过分析模型内部特征与测试数据来估算失败概率。该工作可能帮助开发者更早发现潜在风险。论文OpenAIAI安全模型测试预测方法安全测试8 个信源在谈推荐理由:OpenAI研究者搞了个预测模型出错率的方法,能补上安全测试的漏洞,让发布更靠谱。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……