全部 AI 动态 · AI 热点

6月19日

09:02

向阳乔木@vista8

开发者vista8开发了一个MCP连接器，让网页版ChatGPT能够读取本地文件。当Codex额度用光且无法重置时，可以通过此MCP继续使用ChatGPT进行开发，变相获得双倍Codex额度。安装命令为npm install -g @waishnav/devspace，需在ChatGPT设置中开启开发模式并添加MCP。此方法适用于GPT-5.5 Pro、xHigh等模型，也可用于审查其他本地编码代理写的代码。

推荐理由：vista8分享了一个小技巧，用MCP让ChatGPT网页版读取本地文件，Codex额度用完还能继续用，相当于白嫖双倍额度。

原文

08:58

Simon Willison@simonw

Simon Willison将Claude Artifacts的概念移植到Datasette中，使用户能创建HTML+JS应用并通过JSON API访问全功能关系数据库。该方式保留了Artifacts的交互能力，同时支持任意形状和大小的数据存储与查询。项目提供了一个可公开访问的示例，展示了与Datasette生态的深度整合。

技巧 Claude Artifacts Datasette JSON API 数据库工具

推荐理由：Simon把Claude Artifacts的交互思路搬到Datasette上，用JSON API操作数据库，做应用更方便了。

原文

08:29

@koltregaskes@koltregaskes

OpenAI推出新功能，但未支持Windows平台，也不向英国和欧盟用户开放。该功能似乎并非移动端特性。此前电脑端功能等待时间不长，用户期望此次也能尽快扩展覆盖。

行业 OpenAI 地区限制 Windows 英国欧盟

推荐理由：OpenAI又发新东西了，不过这次Windows用户、英国和欧盟的朋友先别激动，暂时用不了。看看吐槽。

原文

08:05

HeyGen@HeyGen_Official

HeyGen 的 Hyperframes 多模态 AI 产品将于 6 月 24 日（周三）在东京涩谷举办首次线下活动。活动内容包括 HyperFrames 的现场演示、Q&A 环节，以及与多模态 AI 前沿开发者的交流。现场提供 AI 翻译服务，参会者无需担心语言障碍。

AI产品 Hyperframes HeyGen 东京多模态AI AI翻译

推荐理由：HeyGen 把 Hyperframes 带到东京了，6月24日涩谷能现场体验、跟开发者聊天，还有 AI 翻译，别错过。

原文

07:58

@LumaLabsAI@LumaLabsAI

Luma Labs 推出 Luma Skills，可将你的创意资产（如图像、3D 模型）转化为一个系统，生成数百个符合产品要求的概念。用户需在 Luma Agents 中上传创意 DNA 并构建 Skill，即可将其变为可重复的工作流。该功能适用于快速概念迭代或客户交付场景，支持从灵感直接进入制作阶段。

AI产品 Luma Labs Luma Skills Luma Agents 工作流创意生成

推荐理由：Luma Labs 的新技能，让你把创意资产变成反复用的工作流，一键生成几百个精准产品概念，适合快速出图或改稿。

原文

07:44

orange.ai@oran_ge

86°

OpenAI发现对齐大模型时存在涌现失调现象，即坏行为会泛化。他们反向实验用RL训练模型诚实、谦逊、可纠正等特质，仅混入小部分此类数据。结果在训练领域内模型变得更诚实透明；在44个独立评测（未见过）中，欺骗、谄媚、有害建议等行为全面下降，即使只用健康数据训练，非健康领域也受益。模型在对抗性提示和恶意微调下更坚韧，正常指令仍可听从。

论文 OpenAI RL 涌现失调对齐 AI安全

推荐理由：OpenAI这篇论文反直觉：用RL教模型做好事，坏行为自己就减少了。实验覆盖44个新场景，效果还抗攻击。值得一看。

原文

07:43

Cognition@cognition_labs

Cognition 宣布将安全审查集成到 Devin Review 中。每次开发者提交 PR 时，Devin 自动运行安全扫描，识别那些传统漏洞扫描器遗漏的安全问题。Devin 还会为每个漏洞提供详细解释，并自动生成修复代码。该功能旨在帮助团队在不增加额外工作量的情况下提升代码安全性。

AI产品 Devin Cognition 安全审查漏洞修复编程助手

推荐理由：Devin 现在能自动帮你审计 PR 里的安全漏洞，发现那些扫描器漏掉的，还直接给修复方案，省心。

原文

07:31

elvis@omarsar0

/youtube-notetaker 是一个开源智能体技能，能从 YouTube 视频自动生成包含幻灯片、笔记和转录的 Artifacts。项目托管在 xgo.ing 平台，用户可自由定制。该技能通过单条命令 /youtube-notetaker 触发，捕获视频中的关键信息。目前已有 1405 次浏览和 24 次点赞，社区反响积极。

技巧 /youtube-notetaker YouTube Artifacts 智能体开源工具

推荐理由：想自动从 YouTube 视频提取重点？试试这个开源智能体 /youtube-notetaker，一键生成笔记、幻灯片和转录，还能自己改。

原文

07:11

OpenAI@OpenAI

OpenAI通过少量训练数据使模型在53项独立评估中的44项上取得改进，涵盖欺骗、奖励黑客、安全、健康、心理健康等领域。该表现优于计算匹配的基线模型。评估涉及多种领域、任务格式和评分方案。

论文 OpenAI 对齐 AI安全模型训练

推荐理由：OpenAI发现用一点额外数据就能让模型在超多对齐测试里变好，覆盖欺骗、安全、健康等方面，挺牛的。

原文

07:10

OpenAI@OpenAI

OpenAI在真实对话中训练模型，通过强化学习强化诚实、谦逊、开放纠正、公平和关怀人类福祉等特质。该训练覆盖健康、科学、教育等12个领域，旨在提升模型的对齐与安全性。方法基于RLHF改进，专注对话场景中的具体行为。

AI模型 OpenAI 强化学习 AI安全对齐模型训练

推荐理由：OpenAI训练模型时不止看能力，还用强化学习专门教它诚实、谦逊、愿意接受批评，覆盖12个领域，对AI安全性很有意义。

原文

07:06

Greg Brockman@gdb

OpenAI o1推理模型公布后，其他实验室研究者认为这是战略失误，应保密以拉开差距。Noam Brown引用研究表示，公开o1有助于推动医学推理领域的进展。这验证了OpenAI开放模型的正确性，加速了推理范式的应用。

AI模型 OpenAI o1 推理模型医学公开研究

推荐理由：Noam Brown聊了OpenAI开放o1背后的争论，告诉你为什么公开反而能让医学推理进步更快。

原文

06:40

Stanford AI Lab@StanfordAILab

精选

斯坦福AI实验室发布M*运行时，用于统一服务多模态模型。相比专业系统，M*在omni TTS任务上提速2.7倍，在world-model rollouts任务上提速12.5倍。它匹配或超越所有专门系统的性能。

AI产品 M*斯坦福多模态运行时

推荐理由：斯坦福新发的M*运行时，一个系统就能搞定各种多模态模型，速度比专业方案快2到12倍，值得做部署的看看。

原文

06:39

OpenAI@OpenAI

精选

OpenAI发布测试结果，评估模型对齐在压力下的表现。在对抗性提示下，模型更难被引导至有害行为，同时依然能响应有益指令。初步证据表明，模型对有害微调也表现出更强的抵抗力。这项测试关注模型的安全鲁棒性，未提及具体模型版本或基准分数。

AI模型 OpenAI 对齐对抗性提示有害微调鲁棒性

推荐理由：OpenAI发现他们的模型在对抗压力下挺得住，不容易被带坏，安全对齐效果不错。

原文

06:38

Greg Brockman@gdb

精选72°

OpenAI 与波士顿儿童医院及哈佛大学合作，在 NEJM AI 发表研究。研究使用 o3 Deep Research 模型重新分析 376 个先前未解决的罕见儿科病例。模型帮助临床医生找到了 18 个新诊断。其中包括 Kyra 的病例，她从 9 岁起持续肌肉无力，在 28 岁生日前夕被确诊为罕见的肌原纤维肌病。

AI模型 OpenAI o3 Deep Research 罕见病推理模型医疗AI

推荐理由：OpenAI 的 o3 Deep Research 模型帮医生翻出了 376 个陈年疑难病例，找出了 18 种之前漏诊的病。有个女孩从 9 岁查到 28 岁，终于有了答案。这 AI 真的能救命。

原文

06:37

OpenAI@OpenAI

OpenAI 发布声明称，这是朝向更鲁棒有益和对齐模型的早期步骤。他们正在训练模型将有益特质带入新情境，使AI在能力增强的同时变得更可靠、透明和有用。该工作属于对齐研究的一部分，尚未披露具体模型或基准测试结果。

AI模型 OpenAI AI安全对齐

推荐理由：OpenAI 开始教模型把好习惯带到新场景，让AI更靠谱。这个对齐实验挺关键，关注未来进展。

原文

06:25

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue认为，事后API护栏无法消除模型的危险能力，只能隐藏在脆弱的接口后面，容易被越狱（jailbroken）。他建议不要训练高风险能力，除非有强评估、理由和遏制措施；采用分阶段发布（staged release），从可信测试者到更广泛访问，并开放发布以透明和问责。他呼吁大力支持开源AI，缩小封闭实验室和政府之间的能力差距；推动独立评估，而非信任黑盒API；赋予执法、法院、监管者、审计员、记者和公民社会强大的AI工具来检测和追究非法使用。

行业 AI安全开源模型独立评估分阶段发布 API护栏

推荐理由：Hugging Face CEO提出一个务实的AI安全路线：别只靠事后护栏，要加强独立评估、分阶段发布和开源生态。

原文

06:22

OpenAI@OpenAI

73°

OpenAI发布新研究，旨在训练AI模型将有益和安全行为推广到训练范围之外的新领域，并在压力下维持。该方法聚焦于让模型具备广泛且持久的利他性，论文名为《Beneficial RL》。研究通过强化学习框架，让模型学会在更长、更高风险的任务中自主保持符合人类意图的行为，而不仅是拟合训练数据。相关论文和代码已发布在alignment.openai.com/beneficial-rl/。

论文 OpenAI AI安全智能体强化学习

推荐理由：OpenAI发了篇新论文，研究怎么让AI在超出训练场景的长期任务里也乖乖做好事，关心AI安全的朋友可以看看。

原文

06:13

cat@_catwu

72°

Claude Team 与 Claude Enterprise 用户现可通过 Claude Code 部署 HTML 网站并与团队成员分享。新功能 Artifacts 能从会话中生成交互式页面，例如 PR 审查或项目仪表板，并通过私有链接共享。该功能目前以公测形式提供给 Team 和 Enterprise 计划。Artifacts 改变了内部沟通方式，适用于架构变更、数据分析和原型展示。

AI产品 Claude Claude Code Artifacts 团队协作 HTML部署

推荐理由：Claude Code 出了 Artifacts，可以在团队里建交互页面并分享私有链接，做 PR 审查或项目仪表板特别方便。

原文

06:02

Dify@dify_ai

Dify指出企业AI项目常犯的错误是花数月时间重建模型编排、知识检索、监控、权限等底层平台。一个生产就绪的AI平台应直接提供模型灵活性（可切换供应商）、内置RAG（基于自有数据）、工作流编排（业务人员可读）以及监控与访问控制。这样IT团队就能专注交付业务价值，更快将更多应用推上线。

技巧 Dify 企业AI AI平台 RAG 工作流编排

推荐理由：Dify告诉你别重复造轮子，用现成平台更快把AI应用推上线，专注业务价值少踩坑。

原文

05:34

宝玉@dotey

精选76°

Anthropic 在 Claude Code CLI 和桌面应用中新增 Artifact 功能，可将终端会话内容（如 PR 走查、调试时间线、发布清单）生成实时更新的私有网页，团队成员通过链接可直接查看。Artifact 会利用当前会话的完整上下文（包括代码库、外部工具和对话内容）自动更新，历史版本可回溯。该功能以 beta 形式向 Claude Team 和 Enterprise 组织开放，个人用户暂时无法使用。

AI产品 Claude Code Artifact Anthropic 团队协作编程助手

推荐理由：Claude Code 能把终端里的调试记录、PR 走查一键变成网页发给队友，不用再口述解释 agent 做了什么，适合团队协作。

原文

05:16

Ate-a-Pi@svpino

一个AI代理产品允许用户直接标记目标并用自然语言下达指令，无需学习任何提示词技巧或理解工作原理。用户只需说出需求，代理即可自动执行并回答。这种零门槛交互方式大幅降低了AI使用门槛，使得更多非技术用户能够轻松上手。该产品因简单易用而逐渐流行起来。

技巧智能体自然语言交互零门槛

推荐理由：这个AI代理不用学提示词，直接说话就行，效率拉满。

原文

05:14

Ate-a-Pi@svpino

Checkmarx对2350名工程师的调查显示，依赖AI生成代码的公司漏洞部署率是较少使用AI公司的3.4倍。96%的开发者使用安全工具，但仅9%的公司能在三个月内修复90%以上已发现的漏洞。75%的团队承认曾发布明知有缺陷的代码，30%因认为无人发现而为之。报告指出AI生成代码的安全隐患已成为严重问题。

行业 Checkmarx AI生成代码漏洞安全工具 AI安全

推荐理由：Checkmarx报告用数据告诉你：AI写代码虽快，但漏洞风险飙升，别只图效率忽视安全。

原文

05:13

Ate-a-Pi@svpino

Viktor是一个专为Microsoft Teams设计的AI员工。用户可以直接在Teams频道中要求它拉取数据并生成摘要。Viktor能自动拉取结果、撰写分析报告，并将内容发布到频道中。它让团队协作中的信息汇总变得自动化。

AI产品 Microsoft Teams Viktor 智能体数据分析

推荐理由：Viktor这个AI员工能在Teams里自动拉数据、写分析、发报告，跟真实同事一样高效。

原文

05:12

Ate-a-Pi@svpino

用户在 Mac 使用 17 年后，尝试在 Framework 13 Pro 笔记本上全职使用 Omarchy Linux 发行版 90 天，已满 30 天。他喜欢 Hyprland 平铺窗口系统和完全可自定义的配置（所有设置保存在文本文件中），并提到 Claude Code 能有效辅助系统配置。但 Omarchy 仍有不少 bug，音频和蓝牙体验不佳，许多专业应用及外设驱动缺乏 Linux 版本，且缺少 AirDrop、Continuity 等苹果生态功能。他感觉操作速度远超鼠标，但日常小问题仍让他怀念 Mac。

技巧 Linux Omarchy Hyprland Framework 13 经验分享

推荐理由：想换 Linux 但担心体验？看看这位老 Mac 用户 30 天的真实吐槽和爽点，全是细节。

原文

05:07

GitHub@github

精选

MicrosoftAI 的 MAI-Code-1-Flash 模型现已扩展至 GitHub Copilot CLI 和 GitHub Copilot 应用。该模型专为 Copilot 设计调优，在其尺寸下提供最佳质量。早期测试中，它超越其他小模型。

AI模型 MAI-Code-1-Flash Microsoft GitHub Copilot 编程助手

推荐理由：微软把专为 Copilot 调的小模型放到命令行了，代码质量比别的小模型好，试试吧。

原文

05:01

a16z@a16z

a16z合伙人Anish Acharya在纽约证券交易所发表观点，认为AI能让消费者在医疗、养老等领域获得更多信息与自主权，减少次优决策。他指出这项技术不仅带来经济效益，更是亲社会的技术，能促进人类福祉。Acharya强调，从细节看AI已经在这样做了。

行业 a16z Anish Acharya AI赋能消费者社会影响

推荐理由：听听a16z大佬怎么说AI让普通人掌握主动权，尤其医疗养老这些老大难问题。

原文

04:40

Greg Brockman@gdb

精选

OpenAI Developers 为 Codex 推出 Record & Replay 功能。用户可对 Codex 演示一次重复性工作流（如填写费用报告或提交休假申请），系统自动将其转换为可检查和编辑的技能。用户可自主控制录制的开始和停止。这一功能让 Codex 无需代码即可学习新任务。

AI产品 Codex OpenAI Record & Replay 工作流自动化 AI编程助手

推荐理由：OpenAI 给 Codex 加了个新玩法：你演示一次操作，它就能学会并复用，比如填报销单。还能编辑保存的技能，挺实用。

原文

04:33

Marc Andreessen@pmarca

Pew Research Center最新数据显示，约50%的美国成年人报告使用AI聊天机器人，较2024年夏季（约30%）大幅上升。其中25%的用户每天使用这些工具，表明AI聊天机器人正快速普及。该报告基于2026年的调查，反映了AI技术从少数用户向主流社会的渗透速度之快。

行业 Pew Research Center AI聊天机器人采用率行业报告

推荐理由：Pew的调查数据告诉你，AI聊天机器人普及有多快：半年内用户翻倍，每天都有1/4美国人在用。

原文

04:32

The Rundown AI@therundownai

OpenAI于3月取消了与迪士尼的10亿美元合作计划。迪士尼幻想工程随后与Adobe合作，利用自家IP（米奇、冰雪奇缘、汽车总动员）训练AI，旨在加速主题公园设计。迪士尼还宣布将在7月推出新的beta工具，该工具能为小广告主生成完整电视广告（包括脚本、视频和音乐）。该工具主要面向预算有限、无法负担创意代理的小型企业。

行业 Disney OpenAI Adobe 广告生成视频生成

推荐理由：迪士尼不跟OpenAI玩了，自己联手Adobe用经典IP训练AI，还要出广告生成工具，挺实在的。

原文

04:32

宝玉@dotey

精选73°

OpenAI Codex 桌面端新增 Record & Replay 功能，允许用户在 Mac 上录制一系列操作，Codex 自动生成可编辑的 Skill 文件。目前仅支持 macOS，欧盟地区不可用，使用前需开启 Computer Use。该功能旨在简化日常重复性任务，如报销填单、发布视频、创建 issue 等。录制完成后，用户可在新对话中调用 Skill 并传入不同参数，由 Codex 结合 Computer Use、浏览器和插件自动执行。

AI产品 OpenAI Codex Record & Replay Computer Use 自动化智能体

推荐理由：OpenAI Codex 这次不用你写指令了，Mac 上演示一遍操作就能生成可复用的 Skill，下次改改参数自动跑，报销填单之类的好用了。

原文

04:31

Latent.Space@latentspacepod

73°

AMP 创始人 Anjney Midha 在播客中分享 Google 内部将 95% GPU 利用率视为“故障”的标准，指出单纯购买更多 GPU 已非 AI 竞争核心。他介绍 AMP 正推动将 FLOPs 像兆瓦级电力一样调度，并警告数据中心阻力可能成为 AI 最大瓶颈之一。同时分析 Anthropic 通过独特文化和准备在编码领域取得突破，DeepMind 的研究囤积导致市场失灵，强调下一个前沿属于能在计算、资本、文化和科学上“最大化输出”的团队。

行业 Anthropic DeepMind AMP GPU 数据中心计算效率

推荐理由：想知道为什么买更多 GPU 不灵了？Anthropic 是怎么靠文化和准备搞定编码的？AMP 创始人讲得特别透，全是内行视角的干货。

原文

04:25

Clement Delangue@ClementDelangue

精选

AI模型 Poolside Laguna M.1 Hugging Face 开源模型长上下文

推荐理由：Poolside 把最强的 Laguna M.1 模型完全开放了，256K 上下文，Apache 2.0 许可，直接去 Hugging Face 下载权重用。

原文

04:21

Cursor@cursor_ai

精选

/automate 是 Cursor 新推出的智能体技能，用户只需用自然语言描述任务即可完成自动化配置。Cursor 会自动设置触发器、指令和工具，无需手动编写代码。该功能旨在降低自动化流程的搭建门槛。

AI产品 Cursor /automate 智能体自动化自然语言

推荐理由：Cursor 新技能，说句话就能让智能体帮你配自动化流程，省掉写代码的麻烦。

原文

04:20

Cursor@cursor_ai

精选

Cursor 发布了新更新，新增针对 GitHub Issues、代码审查和 Workflow 运行的触发器。Cloud Agents 获得了计算机使用（computer use）能力，可执行更复杂的云端自动化操作。完整变更日志已发布在 cursor.com/changelog 上。

AI产品 Cursor GitHub Cloud Agents 编程助手自动化

推荐理由：Cursor 给云端智能体加了电脑操控能力，还能用 GitHub 事件自动触发，做自动化工作流很方便。

原文

04:09

a16z@a16z

a16z GP Anish Acharya 在纽约证券交易所的访谈中指出，非程序员过去只能通过 YouTube 成为创作者，现在 AI agents 让他们能凭借非技术背景开发软件。他认为这是被低估的新现象，将很快出现。该观点源于对青少年数字创业趋势的观察，强调 AI 降低了软件开发门槛。

行业 a16z AI agents 非程序员创业数字创业

推荐理由：a16z 投资人点出了 AI agents 的核心价值：让不会写代码的人也能做软件创业，不再只依赖 YouTube 当网红。

原文

04:08

Aravind Srinivas@AravSrinivas

AravSrinivas在X上发推指出Context graphs是企业部署智能体框架的最佳方案。推文获得34次转发、19条评论、354个点赞。他指出许多公司存在跨工具上下文碎片化问题。自改进、自组织的全局视图能够捕获隐性知识。推文还获得84次收藏和18123次查看。

行业上下文图智能体企业AI 隐性知识

推荐理由：Perplexity CEO说，用上下文图把公司散落的工具信息整合起来，还能自学习，组智能体更好用。

原文

04:07

Amjad Masad@amasad

Replit 宣布集成到 Slack，通过 Slackbot 的 MCP 客户端，用户可以在聊天中直接使用 Replit 构建应用。该客户端已支持超过 20 个合作伙伴应用，包括 Amplitude 实时图表、Linear 任务更新和 Canva 设计创建。所有操作无需离开对话界面，支持多人协作。

AI产品 Replit Slack MCP/工具编程助手

推荐理由：Replit 现在跟 Slack 打通了，不用来回切换，直接在聊天框里写代码、拉数据、改任务，太方便了！

原文

04:02

Browser Use@browser_use

Browser Use发布了B浏览器代理模板，基于Eve by Vercel构建。该模板使用Browser Use Cloud浏览器和browser-harness，支持实时浏览。用户只需简单配置即可快速部署一个可运行的浏览器代理。示例展示了从创建到运行的完整流程。

技巧 Browser Use B Eve 浏览器代理部署

推荐理由：Browser Use搞了个浏览器代理模板B，几分钟就能部署，还能实时看它上网干活，超简单。

原文

04:02

lmarena.ai@lmarena_ai

82°

Agent Arena推出了因果追踪方法论，通过分析人类与AI代理协作的追踪数据来量化协作的真实价值，并能观测到广泛的模型行为。基于该方法的新排行榜显示，GLM-5.2 (Max)进入前十，成为最强开源模型，确认成功率比基线高+9.4%，表扬-抱怨比高+14.9%。Claude Fable 5在几乎所有指标上曾排名第一，但因美国政府指令暂停访问。排行榜基于数百万个真实世界长期代理任务，使用因果追踪评估模型相对于平均模型的表现。

AI模型 Agent Arena GLM-5.2 Claude Fable 5 Anthropic 智能体

推荐理由：想看看人机协作到底有没有用？Agent Arena拿数据说话，GLM-5.2开源最强，Claude Fable 5刚登顶就被叫停，这瓜值得吃。

原文

03:46

Jeff Dean@JeffDean

73°

Jeff Dean宣布一篇将发表于IEEE Micro 2026年7/8月刊的论文，详细回顾Google从TPU v2到Ironwood共五代训练超算的架构演变。论文披露TPU每芯片每瓦TFLOPS提升了约30倍，每个pod的芯片数从TPU v2的256颗扩增至Ironwood的9216颗。冷却方式从风冷（TPU v2）转为水冷（TPU v3起），互连从2D torus升级为3D torus。论文还指出工作负载已大幅转向Transformer模型。

论文 TPU Google Ironwood AI芯片能效

推荐理由：想看TPU五代真实进化数据和能效提升细节？这篇论文从256芯片到9216芯片、从风冷到水冷、30倍每瓦算力提升，全是硬货。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。