全部 AI 动态 · AI 热点

6月17日

03:37

@koltregaskes@koltregaskes

Kolt Regaskes指出AI的真正价值不在于提笔速度，而在于缩小反馈循环。他提出了5条具体操作：从明确成果而非模糊提示出发；让AI通过检查表、例稿等方式自我校验；将任务拆分为研究者、起草者、审稿者、编辑者角色；用文档存储上下文而非依赖记忆；设定升级规则，AI卡壳2-3次后切换模型或简化步骤。这套方法能帮助知识工作者以“推理速度”产出决策、总结和计划，减少往返错误。

技巧工作流提示词工程反馈循环 AI效率

推荐理由：别只把AI当打字机。试试这5条实操，让AI帮你还原真实工作流，更快拿到靠谱结果。

原文

03:36

@koltregaskes@koltregaskes

用户Kolt Regaskes在X上爆料，他在通过Linear和Github连接器使用ChatGPT时，仅讨论了Anthropic的新闻，却发现ChatGPT的思考内容被审查。OpenAI未公开审查原因。该事件引发对AI内容监管和连接器权限的讨论。

AI产品 ChatGPT OpenAI 内容审查连接器 Anthropic

推荐理由：ChatGPT居然在你用第三方工具时偷偷审查内容，连聊Anthropic都要管，这太离谱了，赶紧看看怎么回事。

原文

03:36

@koltregaskes@koltregaskes

88°

美国政府以国家安全和越狱漏洞为由，强制Anthropic关闭Fable 5和Mythos 5模型。指令仅基于口头证据，未提供具体技术细节。Anthropic声称该漏洞很窄，且GPT-5.5也能实现相同功能。同时禁止所有外国人访问，包括Anthropic的外籍员工。此事发生在Anthropic拒绝与五角大楼签订军事监控合同四个月之后。

行业 Anthropic Fable 5 Mythos 5 GPT-5.5 出口管制

推荐理由：美国政府让Anthropic关了两个模型，理由含糊，还禁止外国人访问。有人猜是因为Anthropic之前没接五角大楼的军事合同。

原文

03:35

@koltregaskes@koltregaskes

AI模型 Fable 5 模型排行榜基准测试

推荐理由：Fable 5 在排行榜上把其他模型都压下去了，看看它到底强在哪

原文

03:28

AI Engineer@aiDotEngineer

OpenAI、Anthropic、Google DeepMind、Amazon AGI Labs、Zai和MiniMax共六家前沿AI实验室确认参加2025年World's Fair。活动将于6月29日至7月2日在旧金山举行，由ai.engineer主办。这是模型开发者与基于这些模型构建应用的开发者首次同场交流。

行业 OpenAI Anthropic Google DeepMind 行业活动 World's Fair

推荐理由：六家顶尖AI实验室要凑一块儿了，6月底旧金山，模型开发者直接和做应用的聊，机会难得。

原文

03:28

lmarena.ai@lmarena_ai

Agent Arena 是一个智能体性能排行榜，现已在 arena.ai/leaderboard/ag... 上线。用户可通过按开放模型或按实验室（lab）筛选来查看详细数据。该排行榜为不同智能体模型提供了直接的性能对比基准。

AI模型 Agent Arena 智能体排行榜基准测试开放模型

推荐理由：想比对比不同智能体模型？去Agent Arena排行榜，能按开放模型或实验室筛选，帮你找到合适的。

原文

03:05

vLLM@vllm_project

精选

vLLM 发布 0.23.0 版本，为 Zai.org 的 GLM-5.2 模型提供 Day-0 支持。GLM-5.2 拥有 1M token 上下文窗口，专为长周期编码智能体设计，可承载从需求到部署的完整开发流程。该模型针对大规模代码实现、自动化研究和性能优化进行了调优，支持客户端和移动端内调试。用户即日起可通过 vLLM 运行该模型。

AI模型 vLLM GLM-5.2 1M token 编程助手推理模型

推荐理由：vLLM 刚发的 0.23.0 直接支持了 GLM-5.2，这个模型有 100 万 token 上下文，适合一口气写完整个项目代码，还能跨平台部署，写代码的可以试试。

原文

03:05

OpenRouter@OpenRouterAI

精选

智谱AI的GLM-5.2模型已在OpenRouter平台上线。该模型拥有100万token的上下文窗口。它专为长周期、混乱的编码代理任务设计，能保持可靠性。

AI模型 GLM-5.2 Z.ai OpenRouter 超长上下文智能体

推荐理由：GLM-5.2在OpenRouter上架了，百万级上下文处理复杂编码任务，适合做长周期智能体。

原文

03:04

Satya Nadella@satyanadella

微软宣布 Copilot Cowork 在全球范围正式可用，新增多模型支持。该工具允许企业部署长期运行代理，处理复杂多步任务，并结合组织内部知识进行决策。目前已在 Microsoft 平台上开放。

AI产品 Copilot Cowork 微软多模型智能体企业应用

推荐理由：微软刚发布了 Copilot Cowork，支持多模型，能自动跑复杂任务，用你公司的数据干活。

原文

03:04

OpenRouter@OpenRouterAI

精选

Z.ai 发布 GLM-5.2 模型，采用 MIT 开源许可。该模型在编码和智能体任务上有显著提升，支持最长 1M 标记的上下文窗口。提供两种推理强度：GLM-5.2 (max) 追求极限性能，GLM-5.2 (high) 平衡性能与 token 效率。API 定价与 GLM-5.1 保持一致。

AI模型 GLM-5.2 Z.ai 开源模型编码助手智能体

推荐理由：Z.ai 新出的 GLM-5.2 模型，编码和智能体能力大幅增强，还有 1M 超大上下文，而且开源！API 价格没涨，值得试试。

原文

03:03

berryxia@berryxia

73°

NVIDIA开源了SOMA-X v0.2，一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性，采用Apache 2.0许可证。它专为机器人和物理AI设计，可用于机器人训练、物理仿真和动作迁移，解决了不同机器人体型不统一导致动作数据难以复用的问题。

AI模型 SOMA-X NVIDIA 3D人体模型机器人物理AI

推荐理由：NVIDIA开源了SOMA-X v0.2，单一骨架就能适配不同体型，机器人动作数据复用门槛降低，训练效率提升。

原文

03:02

LangChain@LangChainAI

LangChain 推出新功能，支持多步骤工作流中状态跨工具调用持久化。提供突发容量，可在秒内扩展到数千个并行环境，适用于强化学习训练或评估。还增强了对用户输入可能被执行的场景的处理能力。这些特性面向需要可靠状态管理和高速扩展的复杂 Agent 与批量评测场景。

AI产品 LangChain 工作流状态持久化并行扩展 RL训练

推荐理由：LangChain 终于解决了多步工作流状态丢失的痛点，还能秒级拉起数千个并行环境做 RL 训练，适合做复杂 Agent 和批量评测。

原文

03:01

LangChain@LangChainAI

LangSmith Sandboxes 允许 agent 在响应前验证生成的代码是否运行。适用于构建编码助手、CI agent 或数据管道等需要操作真实文件的场景。该功能解决了 agent 仅能描述而不能实际执行的问题。

AI产品 LangSmith 智能体代码生成 CI工具数据管道

推荐理由：LangSmith 推出了 Sandboxes，让 agent 真正跑代码并验证结果。适合做编程助手、CI 自动化或数据处理。

原文

03:01

LangChain@LangChainAI

LangChain 推出 LangSmith LLM Gateway，将智能体治理直接嵌入开发平台。该网关允许开发者在构建、观察和评估智能体的同一界面中执行安全规则，无需事后额外配置。它支持对 LangChain 智能体进行实时治理，确保合规与安全。

AI产品 LangChain LangSmith LLM Gateway 智能体治理智能体

推荐理由：想给智能体加治理规则？LangChain 新出的 LLM Gateway 直接在开发平台里搞定了，不用再另外折腾。

原文

03:01

lmarena.ai@lmarena_ai

精选72°

GLM-5.2 (Max) 在 Agent Arena 排行榜上排名第10，得分接近 Claude-Opus-4.8（非推理模式）。它成为排名最高的开源模型，较去年发布的 GLM-5.1 从第13位上升3位。该模型在数百万真实长程任务上评测，可调用网页搜索、文件系统和终端工具。GLM-5.2 (Max) 输入/输出定价保持为每百万 token 1.4/4.4 美元，支持1M上下文窗口，权重采用 MIT 许可开源。

AI模型 GLM-5.2 Zai_org Agent Arena 开源模型智能体

推荐理由：Zai_org 发了 GLM-5.2，在 Agent 任务榜单上排第10，碾压所有开源模型，而且价格没变。跑复杂工作流、调工具效果明显进步。

原文

02:58

Arthur Mensch@arthurmensch

Arthur Mensch宣布与全球公司和政府合作，使用Forge工具确保AI系统远离外部控制并提升效率。Forge基于记录的人机交互持续训练模型，每次模型发布都会迭代改进。该工具强调成本结构优化，通过高效训练实现可控性。

AI产品 Forge 微调智能体 AI安全

推荐理由：Forge让你用真实人机交互数据持续微调模型，成本低、可控性高，适合企业和政府部署AI。

原文

02:43

Google Gemini App@GeminiApp

Google Gemini App 推出 Daily Brief 功能，可在每天早晨自动为你整理日程。用户可以通过点按 👍或 👎 直接反馈，让 Gemini 更了解你的偏好。你也可以通过“与 Gemini 聊天”进一步调整简报内容。点击简报条目下的‘更多’可查看 Gemini 引用的具体邮件、聊天或 Google 日历事件。这些技巧能帮你更好地利用 Daily Brief 管理日常事务。

技巧 Gemini Daily Brief 智能体提示词工程

推荐理由：Google Gemini 的 Daily Brief 能自动汇总你的日程、邮件和聊天记录，早上看一眼就心里有数。三个小技巧教你调教它，让 AI 越来越懂你。

原文

02:37

LlamaIndex@llama_index

精选

LlamaIndex 团队为 Claude 构建了自定义 PDF 解析技能，利用真实使用痕迹发现 AI agent 反复读取同一文件、不必要截图等浪费步骤。修复后，每问题成本降低 37%，回答质量全面提升且浪费步骤减少。该案例展示了如何通过分析 agent 痕迹来定位并修复性能瓶颈。

技巧 Claude LlamaIndex 智能体 PDF 解析成本优化

推荐理由：LlamaIndex 手把手教你用 traces 优化 Claude 的 PDF 解析，成本直降 37%，答案还更准了，值得一试。

原文

02:17

kimmonismus@kimmonismus

77°

GLM-5.2 以 MIT 许可证开源，权重开放。该模型支持 1M token 上下文窗口。提供 max 和 high 两种推理模式。专门针对大规模部署、自动化研究、性能优化和复杂调试进行训练。API 定价与 GLM-5.1 保持一致。

AI模型 GLM-5.2 智谱开源模型长上下文推理模型

推荐理由：智谱开源了 GLM-5.2，1M 上下文还能选推理模式，做长代码任务更强了。

原文

02:09

kimmonismus@kimmonismus

Axios报道称微软正考虑在Copilot Cowork中提供DeepSeek V4作为更便宜的模型选项。微软高管Charles Lamanna表示用户每周执行数百个任务导致成本过高，因此Copilot Cowork将转向基于使用量的定价模式。如果采用DeepSeek，该模型将是可选的、经过微调和安全防护，并完全托管在Azure上。此举意味着中国AI模型将进入微软的企业Copilot产品。

行业 Microsoft Copilot Cowork DeepSeek V4 Azure 企业AI

推荐理由：微软为了省钱，打算在Copilot里用DeepSeek V4，还改成了按用量收费。这对企业用户来说是个大变化。

原文

02:00

a16z@a16z

Cursor CEO Michael Truell在Lenny's Podcast中表示，目标是要发明新型编程方式。他认为编程语言将向伪代码演进，代码会看起来更像英语。未来软件逻辑表达会更简洁易读，不再是难以理解的百万行代码。同时，SpaceX宣布行使期权收购Cursor，将合作训练AI模型。

行业 Cursor SpaceX AI编程伪代码编程助手

推荐理由：程序员朋友注意了！Cursor的CEO亲口说未来写代码就跟写英文一样，而且SpaceX刚宣布要收购他们，这波操作很震撼。

原文

01:59

lmarena.ai@lmarena_ai

Agent Arena 在其官方博客中介绍了用于智能体评估的因果追踪方法论。该方法可帮助研究人员分析智能体决策背后的因果链路。Agent Arena 平台本身支持多种智能体基准测试。

AI模型 Agent Arena 智能体评估基准因果追踪

推荐理由：Agent Arena 的因果追踪方法能帮你搞懂智能体为什么那么做，比单纯看分数更有用。

原文

01:58

Jim Fan@jimfan

精选72°

ENPIRE赋予8个Codex智能体机器人集群和GPU资源，自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。

AI产品 ENPIRE Codex NVIDIA 智能体机器人

推荐理由：NVIDIA让8个AI智能体自己控制机器人干活，还能绑扎带装显卡，而且要开源，你可以在家搭机器人实验室了！

原文

01:57

Jim Fan@jimfan

76°

NVIDIA联合CMU和伯克利推出ENPIRE系统，让AI智能体完全自主控制真实机器人循环，包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化，无需人类介入。

AI模型 ENPIRE NVIDIA 机器人智能体自主循环

推荐理由：NVIDIA搞了个ENPIRE，让AI自己操控机器人反复试错，真实任务成功率干到99%，连GPU都能自己插。

原文

01:37

GitHub@github

GitHub 官方账号发布，开发者 @leereilly 利用 Copilot CLI 创建了一个终端游戏。该游戏能根据代码库结构生成地牢，将文件和目录映射为房间与怪物。玩家可在终端中探索自己的项目。该推文获得了 3955 次浏览。

技巧 GitHub Copilot CLI leereilly 编程助手游戏开发

推荐理由：GitHub 官推分享了一个好玩的东西：用 Copilot CLI 把你的代码库变成 Roguelike 游戏，想试试看吗？

原文

01:31

lmarena.ai@lmarena_ai

精选

MiniMax M3 在全新 Agent Arena 排行榜上位列第18，是排名第5的开源模型。相比 M2.7，M3 从第22名升至第18名，主要改进是任务成功确认和 bash 错误恢复能力。工具幻觉保持低位，与最佳模型并列第一。排行榜基于30万+任务、200万+工具调用和4000万行代码的代理会话评估。

AI模型 MiniMax M3 Agent Arena 开源模型智能体

推荐理由：MiniMax M3 在 Agent Arena 上排名上升了4位，是最强开源模型之一，能写代码、做PPT、查资料，幻觉控制也顶级。

原文

01:31

Martin Fowler@martinfowler

Martin Fowler 与 Bayer 合作，使用 AI 帮助制药研究人员从大量 PDF 报告中查询数十年的信息。Sarang Sanjay Kulkarni 描述了从关键词搜索到能够起草监管报告的研究助手的演进过程。该文章详细介绍了如何构建可靠的 AI 查询系统，提升制药研发效率。

技巧 Bayer Martin Fowler RAG PDF查询监管报告

推荐理由：Martin Fowler 分享了和 Bayer 合作的 AI 应用，能从海量 PDF 里找到信息甚至帮你写报告，挺实用的

原文

01:28

宝玉@dotey

83°

SpaceX宣布以600亿美元全股票交易收购AI代码编辑器Cursor的母公司Anysphere，这是SpaceX上市数天后的首笔大型收购。Cursor成立于2022年，年化收入已达26亿美元，此前估值293亿美元，这次溢价一倍。SpaceX表示过去几个月已用xAI的超算Colossus与Cursor联合训练模型，预计近期上线Cursor和Grok Build。交易预计第三季度完成，若告吹SpaceX需支付15亿美元现金加85亿美元算力资源的分手费。

行业 SpaceX Cursor Anysphere AI代码编辑器收购

推荐理由：SpaceX刚上市就花600亿美元买下Cursor，直接杀入Claude Code和OpenAI Codex的战场，Grok开发者工具这下有牌了。

原文

01:28

a16z@a16z

SpaceX 宣布行使期权以全股票交易收购 AI 编程助手 Cursor，旨在构建最实用的 AI 模型。SpaceXAI 与 Cursor 已联合训练一个模型，将发布于 Cursor 和 Grok Build。Michael Truell（Cursor 创始人）认为软件自动化还处于早期，距离极限还有很长的“混乱中间地带”。他比喻市场已发生多次“iPod 时刻”，未来还将有更多“iPhone 时刻”。

行业 SpaceX Cursor 收购行业事件

推荐理由：SpaceX 突然出手收购 Cursor，这可能是 AI 编程助手赛道格局变化的关键信号。听听创始人亲口说为什么还远没到终点。

原文

01:23

kimmonismus@kimmonismus

英国首相Keir Starmer向特朗普政府请求豁免，允许英国国民和公司重新访问Anthropic的最先进AI模型。一位特朗普政府官员向《纽约邮报》表示，即使是G7盟友也不予例外，称给予豁免“完全不合逻辑”。美国正与Anthropic及其CEO Dario Amodei直接谈判解决禁令问题，但此举表明前沿AI模型已被视为战略国家安全资产，商业获取可能变为地缘政治特权。

行业 Anthropic 前沿AI 国家安全英国美国

推荐理由：美国把前沿AI当战略资产，连英国盟友都吃闭门羹，这事关全球AI权力格局，你应该看看。

原文

01:01

歸藏(guizang.ai)@op7418

SpaceX 宣布以全股票交易方式行使收购 AI 编程助手 Cursor 的选择权，交易估值约 600 亿美元。Cursor 团队仅几十人，但人效极高，除编码产品外还基于开源模型训练了自有编码模型。双方已在过去数月联合训练一个新模型，该模型将同时发布在 Cursor 和 Grok Build 中。此次收购旨在推进 SpaceX 构建最有用 AI 模型的目标。

行业 SpaceX Cursor Grok 收购编程助手

推荐理由：SpaceX 用 600 亿美元股票换下只有几十人的 Cursor，这人效太猛了。Cursor 自带编码模型，还和 Grok 一起训练新模型，未来有戏。

原文

00:59

李继刚@lijigang_com

作者认为C-c & C-v（复制粘贴）的场景切换是日常摩擦，消除它就有价值。他建议让大模型写插件或脚本自动化处理。例如，他用macOS自带的Notes，写了一个脚本：在任意地方复制内容，自动粘贴到指定笔记文件。每晚处理清空，第二天重新积累当天的复制内容。

技巧脚本自动化 macOS Notes 复制粘贴工作流大模型

推荐理由：别老觉得大模型只能聊天，让它帮你写个脚本，把复制粘贴自动化，省时省力。

原文

00:59

AK@_akhaliq

JoyAI发布了JoyAI-VL-Interaction模型，这是一个实时视觉语言交互智能系统。该模型支持实时视觉理解与语言生成，能够处理视频帧序列并生成自然语言响应。目前尚未公布具体基准测试成绩或版本号。

AI模型 JoyAI-VL-Interaction JoyAI 多模态实时交互

推荐理由：JoyAI出了个能实时看懂画面并跟你聊天的模型，适合做交互式AI应用。

原文

00:58

Jerry Liu@jerryjliu0

Jerry Liu 认为代码代理（如 Cursor）是计算机使用和知识工作的好代表，但 Cursor 在产品体验上仍有不足：长期不支持上传 PDF，需要更广的数据源接口（CRM、ERP 等），以及更好的非结构化文档编辑（如 Word、Excel）。Riley Brown 指出 Cursor 正成为 Codex 和 Claude Desktop 的竞争者，其内置浏览器和 Composer 模型性能优秀，但需完善文档渲染功能。

AI产品 Cursor Claude Code Codex 编程助手智能体

推荐理由：两位 AI 资深用户聊 Cursor 的现状和短板，说它离替代 Claude Desktop 就差文档支持了。非开发者可以看看它能不能当你的通用工作台。

原文

00:58

LangChain@LangChainAI

LangChain 发布 Deep Agents 深度解析第二部分，讲解上下文管理关键能力。Sydney Runkle 在不到2分钟视频中演示如何控制 Agent 长期记忆与状态。该方法可让 Deep Agents 在连续多轮对话中保持一致性，避免遗忘。

技巧 LangChain Deep Agents 智能体上下文管理提示词工程

推荐理由：如果你在用 LangChain 做智能体，这个2分钟视频教你怎么管理上下文，让 Agent 不跑偏。

原文

00:58

LangChain@LangChainAI

LangSmith Fleet 新增两种智能体类型：General Purpose Chat 和 Specialized Agents。LangChain 的 @BraceSproul 解释了为何提供两种选择以及各自适用场景。General Purpose Chat 适合日常对话，Specialized Agents 针对特定任务优化。这一设计让开发者根据需求灵活选用。

AI产品 LangSmith General Purpose Chat Specialized Agents 智能体

推荐理由：LangChain 的 Fleet 现在有两种智能体可选，通用聊天聊天专用，看需求挑就行，开发者福音。

原文

00:43

@OpenAIDevs@OpenAIDevs

73°

OpenAI宣布本周起向欧洲经济区、英国和瑞士的Codex用户推出多项新功能。新增功能包括Computer use（计算机操控）、Codex Chrome扩展、个性化记忆（personalized memory）以及Chronicle功能。这些功能此前已向部分地区开放，现在欧洲开发者可以使用。

AI产品 Codex OpenAI 欧洲编程助手 Chrome扩展

推荐理由：OpenAI把Codex的电脑操控、Chrome扩展和个性化记忆带到欧洲了，开发者快去试试。

原文

00:28

向阳乔木@vista8

Factory AI CEO在播客中表示，约80%到90%的任务可用开源模型完成，顶级模型更适合规划和决策。AI工具为高杠杆人员提供更高杠杆，而对低杠杆人员帮助有限。他认为未来最值钱的工程师是能端到端拥有业务结果的人，而非仅会写代码者。他还预测三年内Token支出中位数将与薪资处于同一数量级。

行业 Factory AI 开源模型 AI趋势 Token 工程师价值

推荐理由：Factory AI CEO聊了开源模型和顶级模型怎么分工，还有未来什么样的工程师最值钱，挺有启发。

原文

00:28

elvis@omarsar0

mattpocockuk 发布了新技能 /teach skill，功能类似于之前已有的 /learn skill。该技能在 Hermes Agent 的 academy 中免费开放使用，用户可通过 AI agent 进行互动学习。实验室当前保持免费，鼓励用户尝试。

技巧 Hermes Agent teach skill learn skill 智能体 AI学习

推荐理由：mattpocockuk 推了一个新教学技能，和 /learn skill 很像，在 Hermes Agent 里免费就能玩，试试用 AI 代理学习新东西。

原文

00:28

向阳乔木@vista8

papr 是一款新开源的工具，其 GitHub 仓库地址为 github.com/l0ng-ai/papr。Mac 用户可通过 brew install --cask l0ng-ai/papr/papr 命令安装。目前项目已公开，吸引 683 次查看和少量互动。

AI产品 papr GitHub Mac 开源工具

推荐理由：有人开源了papr，Mac上一条命令就能装，感兴趣可以试试看。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。