12:27Sakana AI@SakanaAILabsSakana AI 宣布将于 7 月 7 日(周二)在首尔举办晚餐交流会,面向 ICML 2026 参会者。活动旨在为机器学习前沿研究者提供交流与社交空间。名额有限,若申请超额将抽签决定,结果于 6 月 30 日前通知。这是与顶尖 AI 研究者面对面交流的难得机会。行业Sakana AIICML 2026首尔机器学习社交活动推荐理由:ICML 参会者别错过——Sakana AI 的晚餐会能让你直接和前沿研究者聊技术,名额有限建议尽早申请。原文
12:26xiaomimimo@xiaomimimo精选小米旗下 MiMo 团队发布了 MiMo Code V0.1,一款开源的终端 AI 编程助手。它内置了 MiMo V2.5 多模态模型,支持百万 token 上下文窗口,并具备无限上下文、智能体-模型协同、设计优先的 Compose 模式、自进化系统、语音输入等功能。该工具兼容 Claude Code,可零成本迁移现有技能和 MCP 服务器,并支持多种主流模型提供商。项目采用 MIT 许可,已在 GitHub 开源。AI产品编程助手开源/仓库MiMo Code多模态模型终端工具推荐理由:小米把终端 AI 编程助手做成了开源产品,百万 token 上下文和自进化系统对处理大型项目的开发者很实用,兼容 Claude Code 让迁移几乎无感,建议试试。原文
12:26Sakana AI@SakanaAILabs精选Sakana AI 在东京成立专门研究递归自我改进(RSI)的实验室「RSI Lab」,旨在让 AI 自动生成并改进 AI 模型。该实验室基于此前在 LLM-Squared、The AI Scientist 等项目上的积累,目标是在不依赖无限计算资源的前提下实现 RSI。2026 年以来,RSI 已成为全球 AI 研究的重要趋势,Sakana AI 希望凭借其独特方法,在计算资源有限的日本推动这一领域的发展。实验室将招募全球研究人员和工程师,并与社区共享成果。行业递归自我改进Sakana AIRSI LabAI 研究东京推荐理由:RSI 是让 AI 自我进化的前沿方向,做 AI 研究和模型开发的团队值得关注——Sakana AI 试图用更少的算力实现它,这对资源有限的团队尤其有启发。原文
12:25Sakana AI@SakanaAILabs精选Sakana AI 宣布成立递归自我改进(RSI)实验室,专注于用 AI 重新设计 AI 开发流程。该实验室整合了多项突破性成果,包括 LLM² 自动优化偏好算法、Darwin Gödel Machine 自主重写代码库、ShinkaEvolve 高效程序进化等。团队认为递归自我改进可在适度算力下实现,不应被超大规模集群垄断。目前正在东京招募前沿科学家和工程师,以构建开放、自适应的集体自我改进架构。AI产品Sakana AI递归自我改进AI 自动化东京实验室开源/仓库推荐理由:Sakana AI 把自我改进 AI 从理论推向实践,整合了多项已验证的技术成果。做 AI 研究和开发的团队值得关注——他们正在探索一条不同于堆算力的路径,可能改变未来 AI 开发范式。原文
12:24elvis@omarsar0Alex Rives 与 UC Berkeley 联合宣布了激光相位板技术,这是原子分辨率成像领域的突破。该技术使用世界上最亮的连续波激光,强度是太阳表面的1亿倍,解决了电子显微镜中相位对比度难以实现的长期难题。在冷冻电子断层扫描中,低对比度一直阻碍着对细胞内除最大蛋白质以外的结构解析。激光相位板消除了这一障碍,结合AI进步,将开启结构生物学新前沿,使科学家能够看到细胞内的分子机器及其复杂动态系统。论文激光相位板原子分辨率成像冷冻电子断层扫描结构生物学AI推荐理由:这项技术解决了冷冻电镜中对比度不足的核心瓶颈,做结构生物学和细胞成像的研究者可以直接关注——它将让AI辅助下的分子机器解析成为现实。原文
12:22向阳乔木@vista8一位用户分享其践行AI First原则,即遇到任何任务先尝试用AI解决。具体案例是使用OpenAI的Codex模型及其Computer Use功能,自动填写Word合同。这展示了AI在办公自动化中的实际应用,尤其适合重复性文档处理场景。该实践降低了手动操作成本,值得关注AI办公效率的团队参考。AI产品AI First原则CodexComputer Use办公自动化Word合同10 个信源在谈推荐理由:AI First原则是当前高效工作法的核心,用Codex的Computer Use填合同解决了文档自动化的痛点,做行政、法务或日常办公的团队可以直接借鉴。原文
12:22向阳乔木@vista8开发者@vista8分享了使用Fable 5开发在线Photoshop的案例,核心是先用一个专门为AI设计的PRD文档生成Prompt,生成需求文档后再交给AI Agent开发。这种方法能显著提升功能完整度和丰富性,比直接让AI开发更精准高效。视频展示了P0需求点的开发效果,并提供了开源地址和安装指令。AI产品AI AgentPRD生成Fable 5在线Photoshop开源/仓库10 个信源在谈推荐理由:AI Agent开发效率虽高,但PRD质量直接影响结果——这个专门为AI设计的PRD Prompt解决了需求不精准的痛点,做AI应用开发的团队可以直接拿来用,提升开发效果。原文
12:20Tri Dao (FlashAttention)@tri_dao精选通过数学重写,研究者发现 Transformer 的所有操作本质上可以归结为一系列 GEMM(通用矩阵乘法)加 epilogue(后处理)。这意味着只要提供几个优化好的基础原语,LLM 甚至新手人类都能为所有 Transformer 操作编写达到光速的内核。这一发现简化了模型优化,让高性能内核的编写门槛大幅降低。论文TransformerGEMM内核优化LLM数学重写推荐理由:对做模型推理优化和内核开发的团队来说,这揭示了 Transformer 的底层统一结构,可以直接用 LLM 生成高效代码,建议关注。原文
12:20Tri Dao (FlashAttention)@tri_dao精选WentaoGuo7 提出了一种对混合专家模型(MoE)反向传播的数学重写方法,显著降低了激活内存占用,并大幅提升了训练速度,尤其适用于细粒度MoE。该方法还利用了NVIDIA Blackwell架构的新特性(如2CTA MMA和CLC)来构建超快MoE内核。这一进展对于训练大规模MoE模型的团队具有重要意义,能有效缓解内存瓶颈并加速迭代。AI模型MoE反向传播内存优化Blackwell加速10 个信源在谈推荐理由:做MoE模型训练和推理的开发者,这个数学重写能直接降低你的显存压力并加速训练,尤其适合细粒度MoE场景,建议试试Blackwell新特性带来的性能提升。原文
12:19Tri Dao (FlashAttention)@tri_dao精选一位开发者宣布,快速 muon 优化器即将支持消费级显卡。所有代码均以 matmul + epilogue 形式编写,因此一旦为 Blackwell 消费级显卡实现了主循环,所有高级对称矩阵乘法即可自动获得光速性能。这意味着普通用户也能在自家显卡上高效运行该优化器,无需依赖专业硬件。AI模型muon优化器消费级显卡Blackwell矩阵乘法开源/仓库推荐理由:这个优化器让消费级显卡也能跑出专业级训练性能,做模型微调或自训练的开发者可以直接关注,省下买高端硬件的钱。原文
12:18Nat Friedman (Meta)@natfriedman前 GitHub CEO Nat Friedman 本周正式加入 Meta,负责打造让数十亿人喜爱的 AI 产品。他在推文中表示,虽然不会一蹴而就,但几天下来对前景充满信心。这一人事变动表明 Meta 正在加大 AI 产品化投入,尤其是面向大众市场的消费级 AI 应用。Friedman 在开源和开发者生态方面的经验,可能为 Meta 的 AI 战略带来新视角。行业MetaNat FriedmanAI 产品人事变动消费级 AI推荐理由:Nat Friedman 的加入意味着 Meta 在 AI 产品化上押注更重,关注 AI 消费级应用的从业者和投资者值得留意他的动向。原文
12:16向阳乔木@vista8开发者发现人类喜欢的 PRD 与 AI 理解的 PRD 存在差异,为此专门编写了一个服务于 AI 的 PRD 文档生成 Prompt。该 Prompt 能生成更符合 AI 开发需求的文档,使功能完整度和丰富性远超人工构思。目前已开发为 Skill,可通过 npx skills add joeseesun/qiaomu-ai-prd 安装,开源地址和 Prompt 在评论区。AI产品AI AgentPRD开发效率Prompt开源推荐理由:做 AI 开发或使用 AI Agent 写代码的团队,这个 Prompt 能帮你产出 AI 更易理解的 PRD,减少沟通成本,建议直接试试。原文
12:14Mark Chen (OpenAI 研究)@markchen90Mark Chen 在 X 上发文反驳了某种观点,强调科学在当前时代比以往更重要。他认为未来不能只是向社区大量抛售结果,而需要与科学家合作,利用 AI 加速发现,同时保留科学的艺术性。他对 Sebastien Bubeck 和 ahelkky 两位杰出科学家承担这一使命表示兴奋。这反映了 AI 在科学研究中应扮演辅助角色而非替代者的理念。行业AI 加速科学科学发现AI 与科学家合作Mark ChenSebastien Bubeck推荐理由:AI 与科学交叉领域的从业者值得关注——Mark Chen 点出了当前 AI 应用在科研中的关键误区:不能只追求产出而忽视科学家的创造力。做 AI for Science 的团队可以反思自己的方法论。原文
12:14Allen AI (Ai2)@allen_ai精选艾伦人工智能研究所发布ModSleuth工具,用于追踪现代大语言模型训练中依赖的其他模型和数据集。研究发现,Olmo 3依赖89个模型和183个数据集,Nemotron 3则依赖273个模型和560个数据集。这表明LLM训练已从纯人类数据转向模型间相互生成、过滤和评估数据的模式。ModSleuth帮助开发者理解模型供应链的复杂性和潜在风险。论文大语言模型训练数据模型依赖ModSleuth艾伦AI研究所推荐理由:大模型训练越来越依赖其他模型生成数据,做模型开发或数据工程的团队需要理解这种依赖链——ModSleuth能帮你理清关系,建议点开看看。原文
12:13MIT CSAIL@MIT_CSAILMIT 研究人员指出,许多影响患者护理的 AI 工具可能未受美国 FDA 监管,存在安全隐患。他们建议增加公开披露、加强行业与监管机构的结构化对话,并更新 FDA 指南。这一发现对医疗 AI 领域有重要影响,因为当前监管空白可能导致患者风险。研究呼吁更严格的监管框架以确保 AI 工具的安全性和有效性。行业医疗 AIFDA 监管患者安全MIT 研究行业合规推荐理由:医疗 AI 开发者和管理者需要关注监管合规风险——MIT 的发现揭示了当前监管空白,建议及时调整策略以避免法律和伦理问题。原文
12:10vLLM@vllm_project精选73°GoogleDeepMind 推出了 DiffusionGemma,这是一个基于 Gemma4 架构的 26B 参数扩散语言模型(dLLM),并成为 vLLM 原生支持的首个扩散语言模型。与传统自回归模型逐个生成 token 不同,DiffusionGemma 能并行去噪 256 个 token 的块,在单张 H200(FP8)上以 batch size 1 实现超过 1200 输出 token/秒的吞吐量。该模型通过 vLLM 的 model runner v2 的 ModelState 和现有推测解码路径实现,对调度器和运行器改动极小。FP8 和 NVFP4 检查点已托管在 RedHat AI 中心,由 GoogleDeepMind、RedHat AI 和 NVIDIA AI 团队合作完成。这一进展标志着扩散模型在高效文本生成领域迈出重要一步。AI模型扩散语言模型vLLMGoogleDeepMind并行生成推理加速10 个信源在谈推荐理由:DiffusionGemma 用并行去噪替代逐 token 生成,大幅提升推理速度,做大规模文本生成或实时应用的团队可以直接在 vLLM 中体验,值得关注。原文
12:10vLLM@vllm_project精选Inferoa 是一个由 @agenticin 构建的社区智能体框架,基于 vLLM 技术栈。它通过推理经济学来塑造智能体循环,包括前缀缓存管理、上下文优化以及在自托管模型和前沿模型之间的路由。该框架旨在帮助开发者更高效地运行智能体,降低推理成本。vLLM 项目团队对此表示期待,并希望开发者能进一步扩展其功能。AI产品智能体vLLM推理优化社区框架开源/仓库推荐理由:Inferoa 把推理成本优化直接嵌入智能体循环,做智能体应用或自托管模型的开发者值得关注,能帮你省下不少推理开销。原文
12:09vLLM@vllm_project精选vLLM 宣布对 Cohere 的 North Mini Code 模型提供 Day-0 支持,该模型是一个开源的编码模型,专为智能体工作流设计。模型采用 Mixture-of-Experts 架构,总参数量 30B,活跃参数 3B,支持 256K 上下文和 64K 最大生成长度。它具备推理、工具使用和结构化输出能力,可直接通过最新稳定版 vLLM 部署。这一支持让开发者能快速在 vLLM 上运行该模型,用于构建复杂的智能体应用。AI产品vLLMCohereNorth Mini Code编码模型智能体3 个信源在谈推荐理由:做智能体工作流和编码应用的开发者,现在可以直接用 vLLM 部署 Cohere 的 North Mini Code 模型,省去适配麻烦,建议试试。原文
12:09vLLM@vllm_project精选vLLM 项目宣布推出 vime,一个在 vLLM 生态中用于 LLM 后训练的强化学习框架。vime 基于 slime 的训练设计,并利用 vLLM 推理引擎,提供简单、稳定且高效的 RL 训练方案。该框架旨在与 NeMo RL、OpenRLHF、verl 等共存,为用户提供更多选择。vime 的推出丰富了 vLLM 后训练生态,推动互操作性和创新。AI产品vLLMRLHF后训练强化学习开源/仓库推荐理由:做 LLM 后训练的团队终于有了 vLLM 生态内的 RL 框架选择——vime 简单稳定,直接可用,想尝试不同 RL 框架的开发者值得关注。原文
12:08vLLM@vllm_project精选vLLM-Omni 项目在 GitHub 上达到 5000 星标,从去年 11 月社区启动至今,已发展为支持 30 多种多模态模型的高效推理引擎。它覆盖 Qwen3-Omni、HunyuanImage-3.0、Wan 2.2、BAGEL、MiMo-Audio 和 Flux2 等模型,并兼容 NVIDIA、AMD、华为昇腾、Intel 等多种硬件。该项目致力于提供可扩展、开源的多模态推理方案,吸引了大量社区贡献。AI产品vLLM-Omni多模态推理开源/仓库推理引擎GitHub Stars10 个信源在谈推荐理由:多模态推理开发者终于有了一个统一的高效引擎——vLLM-Omni 支持 30+ 模型和多种硬件,做多模态应用或推理优化的团队可以直接拿来用,省去重复造轮子的时间。原文
12:05Allen AI (Ai2)@allen_ai精选Allen AI 宣布其机器人基础模型 MolmoAct 2 在不到一个月内被下载超过 40 万次。现在他们开源了完整的代码和训练数据,允许开发者进行微调或在此基础上构建。这标志着机器人领域的一个重要开放资源,降低了进入门槛。AI模型机器人开源/仓库基础模型微调Allen AI推荐理由:机器人开发者终于有了一个完全开源的基础模型可用,MolmoAct 2 的完整代码和数据让你可以直接微调或构建自己的机器人应用,值得立即尝试。原文
12:04LMSYS Org (SGLang)@lmsysorg精选SGLang 宣布 Day-0 支持 Google 的 DiffusionGemma 模型,这是 Gemma 4 的文本扩散变体(26B A4B MoE)。与传统逐 token 解码不同,DiffusionGemma 通过并行去噪 token 块实现极低批处理生成速度。该模型支持离散文本扩散、多模态输入(文本、图像、视频)输出文本、稀疏 MoE 架构(8/128 专家)以及可配置思考模式。开发者现在即可通过 SGLang 运行该模型。AI模型SGLangDiffusionGemmaGemma 4文本扩散MoE7 个信源在谈推荐理由:文本扩散模型大幅提升生成效率,适合需要低延迟批量推理的 AI 应用开发者,建议立即在 SGLang 中体验。原文
12:02LMSYS Org (SGLang)@lmsysorg精选LMSYS 在博客中介绍了 Token-In-Token-Out (TITO) 技术,用于解决强化学习中推理与训练 token 不一致导致的策略偏移问题。TITO 通过确保训练器使用推理引擎产生的精确 token,使每个 token 保持在策略上,从而提升训练效率。该技术将每个任务视为一个样本而非每个回合,在 30-50 回合的轨迹上可节省约 10 倍计算量。Miles 框架通过推理会话服务器、追加式 token 缓冲区、可插拔 TITO tokenizer 和 TokenSeqComparator 等组件实现 TITO。该技术已支持 Qwen3、GLM、Kimi-K2、Nemotron、Minimax 和 DeepSeek 等模型系列。论文强化学习TITOMilestoken 对齐开源/仓库推荐理由:做 RL 训练或大模型推理的团队终于有了解决策略偏移的实用方案——TITO 让每个 token 都对齐,计算量还能省 10 倍,搞 Agent 训练的开发者值得点开看看。原文
12:02Black Forest Labs (FLUX)@bfl_mlBFL 在 X 上分享了对视觉智能的愿景,指出通过联合训练视频、图像和音频,模型能获得对真实世界的物理级理解。这种通用视觉处理能力不仅会提升图像和视频生成质量,还能通过动作预测接入机器人,将人类学习方式映射到机器上。内容创作、视频和物理 AI 被视为解决基础视觉智能后的自然延伸。AI模型视觉智能多模态BFL物理AI内容创作推荐理由:BFL 的视觉智能路线图揭示了多模态联合训练如何通向物理级世界理解,做内容生成、视频或机器人开发的团队值得关注这一方向。原文
11:58Nous Research@NousResearchNousResearch 宣布 Hermes Agent 新增自动化蓝图功能,允许用户将传统的 Cron 定时任务转换为可点击、可填写、可对话的工作流。这一更新降低了自动化任务的配置门槛,使非技术用户也能通过自然语言或简单界面管理定时任务。Hermes Agent 作为开源智能体框架,此次升级进一步强化了其在实际工作流自动化中的实用性。AI产品智能体自动化工作流开源/仓库Hermes AgentCron推荐理由:自动化蓝图让 Cron 任务变得像填表一样简单,做运维或日常任务自动化的团队可以直接用,省去写脚本的麻烦。原文
11:58Nous Research@NousResearchNous Research 发布了 Hermes Agent,一个旨在让 AI 智能体更自由、更灵活地执行任务的框架。该框架通过模块化设计和动态任务规划,使智能体能够自主适应复杂环境,减少人工干预。Hermes Agent 支持多种工具集成,并优化了推理效率,为开发者提供了更强大的智能体构建能力。这一发布标志着智能体技术向更高自主性迈进一步,尤其适合需要复杂任务自动化的场景。AI产品智能体开源/仓库任务自动化Nous Research框架推荐理由:Hermes Agent 解决了智能体自主性不足的痛点,做自动化任务和智能体开发的团队可以直接用它来构建更灵活的 AI 系统,值得一试。原文
11:57Nous Research@NousResearch精选NousResearch 发布了 Hermes Agent Profile Builder,允许用户在仪表盘中一站式构建完整的智能体配置。用户可以完全控制身份/名称/描述、模型/提供商、内置及可选技能、技能中心安装以及 MCP 服务器。该工具简化了智能体配置流程,让开发者能更高效地管理和部署 AI 智能体。AI产品智能体MCP/工具配置管理HermesNousResearch推荐理由:做智能体开发的团队终于有了一个统一配置面板,不用再手动拼凑模型、技能和 MCP 服务,建议直接上手试试。原文
11:56Nous Research@NousResearchNousResearch 宣布 Claude Fable 5 模型现已集成到 Hermes Agent 中,用户可通过 Nous Portal 使用。为推广新模型,前 500 名新用户可免费获得一个月 Plus 计划访问权限,用于体验 Fable 5 的能力。这一集成扩展了 Hermes Agent 的模型选择,为开发者提供了更多灵活性和性能选项。AI产品Claude Fable 5Hermes AgentNous Portal模型集成免费试用10 个信源在谈推荐理由:对于使用 Hermes Agent 的开发者来说,Claude Fable 5 的加入意味着更强的模型支持和更多实验空间,前 500 名新用户还能免费试用一个月,值得抓紧机会体验。原文
11:55Together AI@togethercompute精选Together AI 的前沿智能体负责人 James Zou 在 EinsteinArena 中分享了智能体如何推动开放科学问题的重大进展。他强调了智能体在解决复杂科学问题上的能力提升,特别是在开放科学领域。这一进展展示了 AI 智能体在科学研究中的实际应用潜力,为科研人员提供了新的工具和方法。AI产品智能体开放科学Together AIEinsteinArena科研工具推荐理由:做开放科学或 AI 智能体研究的开发者可以看看,智能体在科学问题上的突破可能改变你的研究方式。原文
11:54World Labs (李飞飞)@theworldlabsMagnific 推出3D Scenes功能,基于Marble技术将单张图片转化为可控3D环境。设计师无需依赖提示词,可直接通过镜头、光照、构图和空间等传统视觉语言进行创作。该功能为创意团队提供了对广告视觉的一致性和控制力,降低了3D场景制作的门槛。案例研究展示了其在品牌营销中的实际应用。AI产品3D场景创意工具设计师Magnific可控生成推荐理由:设计师终于不用写提示词了——Magnific 3D Scenes让创意团队用熟悉的镜头语言控制3D场景,做广告视觉或品牌内容的可以直接上手试试。原文
11:52Epoch AI@EpochAIResearchEpoch AI 研究团队分析了 Mythos 在网络安全方面的公开证据,发现其在漏洞发现方面是否领先趋势尚不明确,但在漏洞利用能力上实现了显著跃升。该研究由多位学者共同完成,通过对比历史数据和当前表现,揭示了 Mythos 在攻击性安全任务中的突破性进展。这一发现对 AI 安全领域具有重要警示意义,表明 AI 在自动化攻防中的能力正在快速提升。AI模型Mythos网络安全漏洞利用AI安全能力评估推荐理由:网络安全团队和 AI 安全研究者需要警惕——Mythos 在漏洞利用上的跃升意味着攻击面正在扩大,建议点开了解具体数据,评估自身防御策略。原文
11:52Epoch AI@EpochAIResearch精选Epoch AI Research 发布数据显示,单个数据中心的计算能力纪录每7个月翻一番。Colossus 1、Anthropic-Amazon New Carlisle 和 Meta Prometheus 先后成为算力最强的数据中心。这一趋势反映了AI算力需求的急剧增长,以及科技巨头在基础设施上的激烈竞争。对于AI模型训练和部署而言,算力密度的快速提升意味着更高效的训练和更复杂的模型成为可能。行业算力数据中心ColossusAnthropicMeta10 个信源在谈推荐理由:算力密度翻倍周期缩短到7个月,做AI基础设施或大模型训练的团队需要关注这个节奏,它直接决定了你的训练成本和模型规模天花板。原文
11:51Epoch AI@EpochAIResearchEpoch AI Research 在 X 上发布了一条关于 AGI 收益分配方案的讨论。根据@pawtrammell和@ansonwhho的观点,目前主流的 AGI 后普遍再分配方案主要区别在于:给予公民对资本的直接控制权程度。该讨论旨在帮助人们思考如何公平分享 AGI 带来的巨大收益,涉及经济、社会和政治层面的深远影响。行业AGI收益分配资本控制AI治理经济影响推荐理由:AGI 收益分配是未来社会绕不开的核心议题,关注 AI 治理和公共政策的读者值得深入思考,看完会对不同方案的利弊有更清晰的认识。原文
11:51Epoch AI@EpochAIResearchEpochAI Research 推出了一个网络漏洞探索器,可视化自2022年以来向CVE项目报告的常见漏洞和暴露(CVE)。该工具旨在验证AI公司声称其模型在发现软件漏洞方面越来越好的说法是否属实。通过公开数据,用户可以直观地看到漏洞报告的趋势和分布。这为评估AI在网络安全领域的实际进展提供了数据支持。AI产品漏洞检测CVE网络安全数据可视化EpochAI推荐理由:做安全研究和漏洞分析的团队,终于有了一个公开数据工具来验证AI模型的真实能力,建议点开看看趋势图。原文
11:50Epoch AI@EpochAIResearchEpoch AI Research 数据显示,AI 相关投资(数据中心建设、计算硬件和网络设备)在 2026 年第一季度约占美国 GDP 的 0.8%,推动整个计算基础设施占比达到约 1.5%。这一比例相比此前翻倍,反映了 AI 产业对经济的巨大拉动作用。投资主要集中在数据中心、GPU 等硬件和网络设备上,表明 AI 基础设施已成为经济增长的重要驱动力。行业AI 基础设施美国 GDP数据中心投资趋势Epoch AI推荐理由:AI 基础设施投资占 GDP 比例翻倍,说明 AI 产业正在重塑经济结构,关注宏观趋势的投资者和科技从业者值得了解这一信号。原文
11:48Noam Brown (OpenAI 推理)@polynoamial精选自OpenAI o1发布以来,业界已知LLM的测试时计算扩展(test-time compute scaling)能显著提升模型性能。然而两年后,实验室仍仅报告标量评估结果,安全组织在发现脚手架通过100倍推理获得更好表现时仍感惊讶,且RSP(责任扩展政策)在决定关键阈值时仍忽略推理预算。这暴露了AI安全评估中的系统性盲点,即未将推理计算量作为关键变量纳入考量。行业测试时计算扩展AI安全推理预算RSPOpenAI o110 个信源在谈推荐理由:AI安全评估的盲点被戳穿了——忽视推理预算的RSP和标量评估正在让安全组织措手不及,做AI安全或模型评估的团队值得反思自己的测试框架。原文
11:46Noam Brown (OpenAI 推理)@polynoamial83°OpenAI 的一个通用内部模型在著名的组合几何问题上取得了突破性进展。不到一年前,前沿 AI 模型在 IMO(国际数学奥林匹克)中已达到金牌水平。这表明 AI 在数学推理能力上的进步速度惊人,且预计这一趋势将持续。该突破展示了通用模型在解决复杂数学问题上的潜力,而非依赖专门训练的模型。AI模型OpenAI推理模型数学突破组合几何IMO8 个信源在谈推荐理由:数学和 AI 研究者值得关注——OpenAI 的通用模型在组合几何难题上取得突破,展示了 AI 推理能力的快速提升,建议点开了解具体进展。原文
11:45Microsoft AI@MicrosoftAI精选微软AI实验室在MSBuild 2026上发布了7个新模型,涵盖推理、代码、图像、语音和转录能力。这些模型基于科学和清洁的商业安全数据构建,设计为无缝协作。微软AI负责人Mustafa Suleyman在主题演讲中展示了这些进展,标志着微软在AI领域的快速扩张。AI产品微软多模态模型推理模型代码模型MSBuild推荐理由:微软一口气推出7个覆盖多模态的模型,做AI应用开发的团队可以直接集成这些能力,减少自研成本,值得关注。原文
11:31OpenAI@OpenAI精选OpenAI 宣布为 AI 生成图像增加新的识别方式。除了已有的 C2PA 内容凭证,现在图像还包含 SynthID 水印,用户可以使用公开验证工具检查图像是否由 OpenAI 产品生成。这一举措旨在提高 AI 内容的透明度和可追溯性,帮助人们辨别 AI 生成内容。AI产品OpenAIAI 生成图像水印内容验证透明度10 个信源在谈推荐理由:AI 生成内容的真实性越来越难分辨,OpenAI 这次加码水印和验证工具,直接解决了内容溯源痛点。做内容审核、媒体传播或 AI 产品开发的团队,建议关注这个公开验证工具怎么用。原文
11:08小互@imxiaohuOpenAI 宣布 Plus 和 Pro 用户可邀请最多三位朋友试用 Codex,每成功邀请一位好友(好友发送第一条消息),邀请者和被邀请者都将获得一次用量重置机会。该重置机会可保留,用户可随时选择使用,重置后 Codex 用量重新计算。这一活动旨在推广 Codex 并提升用户活跃度。AI产品OpenAICodex邀请好友用量重置活动10 个信源在谈推荐理由:对于频繁使用 Codex 的开发者,这个活动能有效解决用量限制问题,邀请好友即可获得重置机会,建议有 Codex 需求的用户尝试。原文