全部 AI 动态 · AI 热点

6月19日

03:03

Greg Brockman@gdb

76°

OpenAI 发布 GPT-5.5 Instant，其健康相关问题的回答水平已与前沿思考模型持平。该模型联合 60 个国家、49 种语言、26 个专科的数百名医生共同开发。每周有超过 2.3 亿用户向 ChatGPT 咨询健康问题。GPT-5.5 Instant 在识别紧急情况、询问上下文、解释不确定性及简化复杂信息方面表现更优。该模型已面向所有免费用户开放。

推荐理由：OpenAI 出了 GPT-5.5 Instant，免费版就能用，健康问答能力大幅提升，和医生合作训练的，靠谱。

原文

03:02

HeyGen@HeyGen_Official

HeyGen推出MCP服务器，可集成到Cursor AI中。只需在Cursor中指向项目的README文件，输入一条提示，AI就能自动提取产品功能和定价信息，生成完整的发布视频。整个过程无需拍摄或剪辑，直接从仓库数据生成。该功能降低了产品视频制作的门槛，适合快速发布演示。

技巧 HeyGen Cursor MCP 视频生成智能体

推荐理由：HeyGen出了MCP服务器，扔进Cursor里，读你的README就能自动生成产品视频，省去拍摄剪辑，超实用！

原文

02:39

OpenAI@OpenAI

OpenAI 发布 GPT-5.5 Instant，该模型在健康相关问题上的表现与前端推理模型（如 o1）持平。每周超过 2.3 亿人通过 ChatGPT 咨询健康问题，新模型能更准确识别需要紧急护理的情况，主动询问相关背景，明确解释不确定性，并简化复杂医学术语。所有免费用户均可使用 GPT-5.5 Instant，无需订阅。此次改进基于医生主导的评估，确保了医疗场景下的可靠性。

AI模型 GPT-5.5 Instant OpenAI 健康推理模型 ChatGPT

推荐理由：OpenAI 把 GPT-5.5 Instant 的医疗问答能力做到了和自家顶级推理模型一样好，而且免费用户都能用，生病问AI更放心了。

原文

02:38

OpenAI@OpenAI

OpenAI在推文中称，改善人类健康将是AGI最具体、直接的影响之一。该公司表示，随着模型持续改进，目标是让ChatGPT在健康相关场景中更准确、更有用。OpenAI承诺将这一进展带给更多人，但未透露具体模型版本或时间线。

行业 OpenAI ChatGPT 医疗健康

推荐理由：OpenAI画了个大饼，说AGI能帮人更健康，还打算让ChatGPT更准更有用。虽然没细节，但方向挺有意思。

原文

02:33

Notion@NotionHQ

Fast Company发布了首届"AI 20"榜单，表彰在AI扩散至经济中起关键作用的领袖。Notion的AI负责人Sarah Sachs入选，其团队将Notion AI从简单重写工具演变为检索式问答，再到具有权限和审计追踪的"治理型AI队友"。当推理模型能自主完成序列任务时，他们从头重建了整个Notion AI架构。

行业 Fast Company Notion Sarah Sachs AI治理推理模型

推荐理由：Fast Company选出了20位推动AI普及的领袖，Notion的Sarah Sachs榜上有名。她让Notion AI从改文章进化成带权限的‘AI队友’，还重写了整个架构，很酷。

原文

02:32

LlamaIndex@llama_index

约90%的企业数据是非结构化的，被锁定在文档中，构成知识工作的主体。LlamaIndex CEO Jerry Liu在Databricks DataAISummit上演讲，介绍了OCR和agent编排的核心进展。这些技术使AI智能体能够大规模理解、推理和编辑文档，从而自动完成整个工作流程。演讲于当地时间10:20 AM在Yerba Buena Salon 7举行。

行业 LlamaIndex Databricks 智能体非结构化数据文档自动化

推荐理由：LlamaIndex的CEO在Databricks峰会上聊了怎么用AI智能体搞定那90%的非结构化数据，不是画饼，有具体的OCR和编排思路，搞企业自动化的朋友可以看看。

原文

02:25

Replit@Replit

Replit 宣布与 Slack 集成，用户可以在 Slack 对话中直接通过 Slackbot 描述需求，Slackbot 会自动调用 Replit 生成对应的应用或代码。该功能无需离开 Slack 界面即可启动开发环境，降低从想法到原型的门槛。Replit 是一个在线 IDE 和协作平台，此前已支持 GitHub 等集成。

AI产品 Replit Slack Slackbot 编程助手集成

推荐理由：以后在 Slack 里聊着天就能让 Replit 帮你写代码了，不用切来切去，挺方便的。

原文

02:22

LangChain@LangChainAI

LangChain 推出 Deep Agents 深度解析第四部分，核心主题是 steering 功能。该功能通过第一类 HITL（人在回路）原语，允许用户在 Agent 执行过程中实时介入和调整行为。与传统的自动化流程相比，steering 提供了更细粒度的控制，无需重新启动整个 Agent。此特性使开发者能灵活纠正方向或注入上下文，提升复杂任务的可靠性。

AI产品 LangChain Deep Agents Steering 人在回路智能体

推荐理由：LangChain 教你用 HITL 原语引导 Deep Agents，比硬编码指令灵活多了，跑偏了也能随时拽回来。

原文

02:17

@koltregaskes@koltregaskes

79°

据消息，OpenAI GPT-5.6和GPT-5.6 Pro预计下周四（next Thursday）正式登陆。部分用户可能已在ChatGPT网页端体验GPT-5.6 Pro模型。同时，Anthropic的Claude Fable 5也可能在未来几天内回归。

AI模型 GPT-5.6 GPT-5.6 Pro OpenAI Claude Fable 5 模型发布

推荐理由：GPT-5.6和Pro版下周就来，Claude Fable 5也快回来了，想尝鲜的可以留意。

原文

02:07

LlamaIndex@llama_index

LiteParse v2.1 实现了最快的无LLM Markdown输出功能。该版本在三个独立基准数据集中击败了所有其他无模型竞争对手。完全不需要语言模型即可完成解析，速度显著提升。用户可无需额外推理成本直接获得结构化Markdown结果。

AI产品 LiteParse LlamaIndex Markdown 解析

推荐理由：LlamaIndex 的 LiteParse v2.1 搞出了最快无LLM的Markdown输出，三个基准都赢了，速度还快。

原文

02:03

MIT CSAIL@MIT_CSAIL

MIT CSAIL 研究员 Alexander Amini 主讲的深度学习免费课程已更新至 2026 版。该课程涵盖监督学习、无监督学习和强化学习三大范式。第 5 讲专门讲解三者的核心差异。课程完全免费开放，适合入门到进阶学习者。

技巧 MIT 深度学习免费课程监督学习强化学习

推荐理由：MIT 出了新版深度学习免费课，Alexander Amini 讲第 5 讲，把监督、无监督、强化学习的区别掰开揉碎，想入门可以看看。

原文

01:54

LMSYS Org (SGLang)@lmsysorg

poolside发布的Laguna M.1是一个225B参数的MoE模型，专为智能体编码和长期任务设计。该模型采用70层结构：3个密集SwiGLU层加67个稀疏MoE层，共有256个专家，top-k=16且使用无辅助损失负载均衡。它在所有层使用全局注意力：64个Q头、8个KV头，以及softplus输出门控。Laguna M.1支持原生交错推理：在工具调用之间进行思考，并可每个请求切换。在SWE-bench Verified、SWE-bench Multilingual、SWE-Bench Pro和Terminal-Bench 2.0上表现强劲。现在可通过SGLang运行。

AI模型 Laguna M.1 poolside SGLang 智能体编程助手

推荐理由：poolside刚发的225B MoE模型Laguna M.1，专为智能体编码设计，SGLang直接跑起来了，在SWE-bench上很强。

原文

01:44

Anthropic@AnthropicAI

Anthropic发布Project Fetch实验，让两个零机器人经验的团队编程机器狗。其中一个团队使用Claude辅助，另一个团队仅靠传统方法。实验对比了两组的表现，展示了Claude在机器人编程中的实际效果。结果视频已在Anthropic官方推文中公开。

AI模型 Anthropic Claude Project Fetch 机器人编程编程助手

推荐理由：Anthropic让没碰过机器人的团队用Claude写机器狗代码，看看AI到底能帮多少忙，结果挺有意思。

原文

01:43

Anthropic@AnthropicAI

精选

Anthropic 发布 Frontier Red Team 博客，介绍 Project Fetch 第二阶段：测试 Claude 编程机器人狗的能力。Opus 4.7 自主完成编程任务，速度比去年最佳人类团队（使用 Opus 4.1）快约 20 倍。尽管速度提升显著，机器人狗仍未成功取回沙滩球。该研究旨在评估前沿模型在物理世界中的自主能力与安全风险。

AI模型 Claude Opus 4.7 Anthropic 机器人编程安全测试

推荐理由：Anthropic 让 Claude 自己写代码控制机器狗，速度比人快20倍，虽然最后没抓到球，但过程特别有意思

原文

01:36

Milvus@milvusio

精选

Milvus指出，仅看平均Recall@5（如85%）会掩盖真实问题。例如，精确术语查询的Recall@5可能只有40%，其他类别拉高了平均值。文章建议将测试用例分为精确术语查询、多跳问题、长尾问题、不可回答问题、权限过滤问题五类，每类至少放5-10个案例分别检查召回率。这样能精准定位检索堆栈中的薄弱环节。

技巧 Milvus 召回率检索评估查询类型向量数据库

推荐理由：Milvus教你怎样真正看懂你的召回率——按5种查询类型拆解，别被一个平均数字骗了。

原文

01:35

Marc Andreessen@pmarca

a16z 创始人 Marc Andreessen 发推称“有趣”，并提及 Z.ai 创始人、GLM AI 模型的创造者。该推文获得 48 条回复、40 次转发和 617 个点赞，引发行业关注。Z.ai 和 GLM 模型的具体动向尚未明确。

行业 Z.ai GLM Marc Andreessen 行业动态

推荐理由：a16z 大佬 Marc Andreessen 点名 Z.ai 和 GLM 模型，看看谁被盯上了。

原文

01:33

SiliconFlowAI@siliconflowai

精选

Z.ai 的 GLM 5.2 在编码基准 CodeArena 上排名第一。每百万 token 输入缓存/输入/输出价格为 0.26/1.40/4.40 美元，支持 1M 上下文长度。其编码性能与 Opus 4.8 相当，并提供 max 和 high 两种推理模式。该模型已完全开源，可通过 SiliconFlow 的 T+0 合作获取。

AI模型 GLM 5.2 Z.ai CodeArena SiliconFlow 开源模型

推荐理由：Z.ai 的 GLM 5.2 在编码竞技场拿了第一，价格比 Opus 便宜，还有 1M 上下文，编程党可以白嫖开源版。

原文

01:32

SiliconFlowAI@siliconflowai

精选

MoonshotAI 基于 K2.6 推出了 Kimi K2.7 Code，参数量为 32B 激活/1T 总参数，支持交错思考与多步工具调用。相比 K2.6，推理 token 使用量降低 30%，在编码与指令遵循上表现提升，接近 GPT-5.5 和 Opus 4.8。定价为缓存输入/输入/输出每百万 token 0.19/0.94/4.00 美元。该模型可在 SiliconFlow 上使用。

AI模型 Kimi K2.7 Code MoonshotAI 编码模型推理效率 VLM

推荐理由：想少想多做？K2.7 Code 编码专用，推理开销比 K2.6 低三成，还能对标 GPT-5.5，适合写代码时不用纠结。

原文

01:32

DeepLearning.AI@DeepLearningAI

DeepLearning.AI与Vocal Bridge合作举办7天语音AI构建挑战赛，6月23日开始。挑战赛教你构建能自主判断何时给你打电话的智能体，而不是让你一直盯着终端。参与者可加入等待清单，还有实时排行榜和奖品。先修课程是Voice AI课程，可提前准备。

技巧 DeepLearning.AI Vocal Bridge Voice AI 智能体语音AI

推荐理由：DeepLearning.AI和Vocal Bridge搞了个7天挑战赛，教你让智能体主动给你打电话，不用一直盯着终端，6月23号开赛有奖品，想玩语音AI的赶紧加入等待清单。

原文

01:31

歸藏(guizang.ai)@op7418

81°

OpenAI 正在准备 GPT-5.6 模型家族的发布，GPT-5.6-Pro 版本已在测试中被发现。该消息来自 TestingCatalog 的监测数据，暗示发布可能临近。目前尚未公布具体参数、性能基准或发布日期。

AI模型 GPT-5.6 GPT-5.6-Pro OpenAI 模型发布

推荐理由：OpenAI 的 GPT-5.6 快来了，Pro 版本已经在测试，想尝鲜新模型的朋友可以关注起来。

原文

01:29

xAI@xai

精选

Vapi 的 Humanness Index 盲测显示，xAI 的 Grok TTS 模型以 96 分（满分 100）位居榜首，仅比人类真实语音低 4 分。该测试将同一段语音用不同模型克隆后，让听众盲评打分。Grok TTS 在多家主要语音模型中表现最接近真人。

AI模型 Grok TTS xAI 语音合成 Humanness Index 文本转语音

推荐理由：xAI 的 Grok TTS 在语音盲测中拿了 96 分，离真人只差 4 分，想听最像人说话的 AI 可以试试。

原文

01:28

xAI@xai

精选

xAI 宣布 Grok 模型集成到 Databricks Agent Bricks 平台。企业用户可在 Databricks 环境中直接使用 Grok 模型处理数据，构建 AI 智能体。该集成支持企业将自有数据与 Grok 模型结合，提升智能体能力。

AI模型 Grok Databricks xAI 智能体企业应用

推荐理由：xAI 把 Grok 搬上 Databricks，企业可以直接在自己的数据上跑 Grok 做智能体，不用再折腾部署了。

原文

00:38

Figma@figma

Figma 设计智能体现在支持网页搜索，用户可通过输入提示或粘贴 URL 来获取信息。搜索结果附带引用链接，可预览后直接插入 Figma 文件中。该功能使设计流程中无需离开 Figma 即可引用实时网络内容。

AI产品 Figma 设计智能体网页搜索 AI搜索产品更新

推荐理由：Figma 的设计助手直接内嵌了网页搜索，给提示或粘贴网址就能把带引用的内容放进设计文件，省了切来切去。

原文

00:37

Geek@geekbb

精选

一个名为 handoff 的开源工具让你在 Claude Code 或 Codex 会话中直接委托任务给 DeepSeek 等其他模型。典型用法是让 Claude 负责规划与审阅，DeepSeek 负责执行代码。这种方式能降低 API 成本，同时保持高开发效率。该方案已获得社区关注，相关仓库在 GitHub 上可见。

技巧 Claude DeepSeek Claude Code Codex 编程助手

推荐理由：想省钱又能干活？让 Claude 当项目经理、DeepSeek 当写代码的，这个工具帮你搞定。

原文

00:35

Microsoft Research@MSFTResearch

微软研究院的Subutai Ahmad和Nicolò Fusi与公司副总裁Doug Burger探讨人类记忆与机器智能的差异。他们发现Transformer架构能通过持续五小时的故事输入记住一个新密码。这项对比研究揭示了机器在长期信息保留上的独特优势。相关讨论视频已在Twitter上发布。

行业 Transformer 微软记忆机制机器智能

推荐理由：微软研究员拿Transformer和人类比记忆：听五小时故事，它能记住新密码，你行吗？看看具体差异在哪。

原文

00:34

腾讯混元 Tencent Hunyuan@TencentCloud

腾讯云赞助RAISE峰会预黑客马拉松大师班，于7月2日在Cyberport ABC Centre举行。腾讯云高级AI架构师Leon Zhang将参与授课，分享实战技能与策略。此次活动旨在帮助参与者备战7月4-5日RAISE主黑客马拉松。腾讯云与数码港共同推动香港AI人才培养与创新生态建设。

行业 TencentCloud RAISE Summit Hackathon AI人才培养数码港

推荐理由：腾讯云和数码港联手办黑客马拉松大师班，7月2日有架构师干货分享，参赛实战策略提前学。

原文

00:33

腾讯混元 Tencent Hunyuan@TencentCloud

精选

6月17日，AV-Comparatives发布2026 Mobile Security Review，腾讯云TCRS SDK实现99.8%的恶意软件检测率，获Approved Mobile Product认证。评测使用前四周内的新鲜去重样本，对高检测率与低误报提出挑战。TCRS通过动态沙箱+AI行为分析、安全图+图计算及LLM辅助分析三项创新应对。该能力已支撑腾讯手机管家，现可集成到任何移动应用中。

AI产品 Tencent Cloud TCRS SDK AV-Comparatives 移动安全恶意软件检测

推荐理由：腾讯云的安全方案在AV-C评测中拿下99.8%检测率，靠动态沙箱、图计算和LLM三招，现在开放给所有App了，想加强移动安全的可以看看。

原文

00:32

Replicate@replicate

P-Image-Try-On 是 PrunaAI 发布的虚拟试穿模型，现已上线 Replicate 平台。每次试穿第一件衣服仅 $0.015，每增加一件 $0.008，最多可同时试穿 11 件衣物。支持质量模式（每件 <2 秒）和 Turbo 模式（总计 <4 秒）。提供提示引导和姿态引导实现精确控制。适合电商和时装团队无需重拍即可生成试穿效果。

AI模型 P-Image-Try-On PrunaAI Replicate 虚拟试穿图像生成

推荐理由：PrunaAI 出了个超便宜的虚拟试穿模型，第一件才一分五，快至2秒一件，还能一次穿11件，电商团队看过来。

原文

00:22

AK@_akhaliq

GLM-5.2 模型在 Hugging Face 的推理提供商上提供免费使用，限时6小时。支持的提供商包括 Zai、Together AI、Novita、Fireworks 和 DeepInfra。用户可通过 Pi、opencode、Codex 或 Claude Code 等编码代理进行配置。该免费服务由 xgo.ing 支持。

AI模型 GLM-5.2 Hugging Face 免费模型推理提供商编码代理

推荐理由：GLM-5.2 现在能免费调用了，6小时内搭配 Pi、Codex 等编码工具就能用，赶紧去试试。

原文

00:19

LangChain@LangChainAI

LangSmith 推出 LLM Gateway，为 LLM 调用提供成本控制与安全防护。该网关可设定预算上限，防止智能体因循环或错误而消耗高达 1 万美元的 API 费用。它支持速率限制、密钥管理和实时监控，使开发者能安全部署智能体。

AI产品 LangSmith LLM Gateway LangChain 智能体成本控制

推荐理由：LangChain 出了个 LLM 网关，能设预算上限防止智能体烧钱，跑智能体再也不怕睡着后出事了。

原文

00:16

宝玉@dotey

一条推文表达对Mythos级别开源模型的期待，该推文获得1次转发和9次点赞。目前尚无具体发布信息或基准成绩。

行业 Mythos 开源模型

推荐理由：网友在推特上表达对Mythos开源模型的期待，已有1转发9点赞

原文

00:10

elvis@omarsar0

精选

OpenAI 推出 LifeSciBench，一个针对生命科学研究的基准测试，包含 750 个专家编写的任务，覆盖 7 个生物学研究工作流。该基准由 173 位来自生物技术和制药领域的科学家共同开发，旨在衡量 AI 在真实世界科研场景中的表现。结果显示通用模型在复杂结构处理上仍有不足，而专用模型在科学研究中优势明显。

AI模型 OpenAI LifeSciBench 基准生命科学科学智能

推荐理由：OpenAI 联合 173 位科学家搞了个新基准 LifeSciBench，750 个专家任务专测 AI 搞科研的能力，比通用模型靠谱多了。

原文

00:05

Jerry Liu@jerryjliu0

LlamaIndex CEO Jerry Liu 在 Databricks 的 DAIS 2026 上发表演讲，探讨通用知识代理。他指出约90%的企业数据是非结构化的，锁定在文档中。演讲聚焦OCR和代理编排的核心进展，使AI代理能够深入理解、推理并编辑这些文件，从而自动化整个工作流。

AI产品 LlamaIndex Jerry Liu Databricks DAIS 2026 智能体

推荐理由：LlamaIndex 的 CEO 讲了怎么用 OCR 和代理编排处理 90% 的非结构化企业数据，值得搞知识管理的朋友听听。

原文

00:02

Geek@geekbb

精选

Unsloth AI 将最强开源模型 GLM-5.2 从 1.51TB 压缩至 238GB（缩小 84%），2-bit 量化版本保留约 82% 准确率。该模型可在 256GB Mac 或同等 RAM/VRAM 配置上本地运行。官方指南和 GGUF 文件已在 Hugging Face 发布。

AI模型 GLM-5.2 Unsloth 本地运行模型压缩开源模型

推荐理由：Unsloth 把 1.5TB 的 GLM-5.2 压到 238GB，本地就能跑，准确率还能保住 82%。有 256GB 内存的 Mac 就能玩，开源模型天花板。

原文

00:02

Gary Marcus@GaryMarcus

精选

Gary Marcus引用Matei Zaharia的研究，神经符号系统在机器人领域击败当前最优方法。该方法采用AI驱动的搜索（类似GEPA的方法），让AI生成AI与代码的混合体。Zaharia认为这类系统效率很高，并在其他应用中也观察到类似效果。该成果展示了神经符号系统在控制与规划方面的优势。

AI模型 Neurosymbolic Systems GEPA Robotics AI Search 机器人

推荐理由：Gary Marcus分享了Matei Zaharia的神经符号系统研究，用AI搜索在机器人上打败了现有最优方案，值得搞机器人或符号推理的人关注。

原文

6月18日

23:40

LangChain@LangChainAI

LangChain发布一条教程，展示如何通过迭代循环将agent从首次运行优化到生产就绪。教程强调使用LangSmith进行观察和评估，以构建可靠的agent。内容包含具体步骤，帮助开发者逐步改进agent性能。LangSmith是LangChain推出的调试和评估平台，支持agent的追踪、测试和迭代。

技巧 LangSmith LangChain 智能体生产就绪

推荐理由：LangChain官方手把手教你用LangSmith一步步打磨agent，从跑起来到能上线，很实用。

原文

23:35

OpenAI@OpenAI

OpenAI发布一项研究，表明AI系统能帮助临床医生重新分析多年未解的病例。这些病例此前多年未被专家分析。AI使专家主导的周期性重分析更可扩展，医生可随着医学知识进步重新审视旧病例。AI还能识别值得调查的线索，可能为更多家庭带来答案。

论文 OpenAI 医疗AI 诊断辅助

推荐理由：OpenAI出了个研究，说AI能帮医生重新分析那些多年没解决的病例，以前专家都搞不定，现在用AI也许能找到新线索。

原文

23:34

OpenAI@OpenAI

精选

OpenAI 的 o3 Deep Research 模型在罕见病诊断中发挥辅助作用，它能够处理测序产生的数百万变异。该模型连接临床特征、遗传模式、变异证据和科学文献，生成假设供专家审核。所有结果都经过人工裁决和临床确认，AI的作用是帮助专家更快、更全面地推理复杂、碎片化的证据。

AI模型 o3 Deep Research OpenAI 推理模型医疗AI 智能体

推荐理由：OpenAI 的 o3 Deep Research 能帮医生快速分析海量变异数据，连接文献和临床特征，生成诊断假设。

原文

23:34

OpenAI@OpenAI

研究发表在 NEJM AI，使用 OpenAI 的 o3 Deep Research 模型。模型帮助临床医生回顾长期未解决的罕见儿科疾病病例。为等待多年的家庭找到了答案。

论文 OpenAI o3 Deep Research NEJM AI AI医疗罕见病

推荐理由：OpenAI 联合顶级医院用 o3 Deep Research 分析多年未解的罕见儿科病例，帮家庭找到答案，有温度也有技术含量。

原文

23:30

elvis@omarsar0

Viktor是一个原生集成在Microsoft Teams的AI agent，用户只需@提及即可自动接收任务、完成工作并提议下一步行动，无需学习或编写提示词。该产品在Slack上已实现2000万美元年收入运行率，现在正式扩展到拥有3.2亿用户的Teams平台。新用户可获得100美元免费额度，无需绑定信用卡。

AI产品 Viktor Microsoft Teams Slack 智能体 AI员工

推荐理由：Viktor像同事一样住在Teams频道里，你@它就能干活，不用学不用指令，它会主动提方案。和那些需要学习提示词的AI完全不同。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。