03:03Greg Brockman@gdb76°OpenAI 发布 GPT-5.5 Instant,其健康相关问题的回答水平已与前沿思考模型持平。该模型联合 60 个国家、49 种语言、26 个专科的数百名医生共同开发。每周有超过 2.3 亿用户向 ChatGPT 咨询健康问题。GPT-5.5 Instant 在识别紧急情况、询问上下文、解释不确定性及简化复杂信息方面表现更优。该模型已面向所有免费用户开放。AI模型GPT-5.5OpenAIChatGPT健康问答医疗AI10 个信源在谈推荐理由:OpenAI 出了 GPT-5.5 Instant,免费版就能用,健康问答能力大幅提升,和医生合作训练的,靠谱。原文
03:02HeyGen@HeyGen_OfficialHeyGen推出MCP服务器,可集成到Cursor AI中。只需在Cursor中指向项目的README文件,输入一条提示,AI就能自动提取产品功能和定价信息,生成完整的发布视频。整个过程无需拍摄或剪辑,直接从仓库数据生成。该功能降低了产品视频制作的门槛,适合快速发布演示。技巧HeyGenCursorMCP视频生成智能体3 个信源在谈推荐理由:HeyGen出了MCP服务器,扔进Cursor里,读你的README就能自动生成产品视频,省去拍摄剪辑,超实用!原文
02:39OpenAI@OpenAIOpenAI 发布 GPT-5.5 Instant,该模型在健康相关问题上的表现与前端推理模型(如 o1)持平。每周超过 2.3 亿人通过 ChatGPT 咨询健康问题,新模型能更准确识别需要紧急护理的情况,主动询问相关背景,明确解释不确定性,并简化复杂医学术语。所有免费用户均可使用 GPT-5.5 Instant,无需订阅。此次改进基于医生主导的评估,确保了医疗场景下的可靠性。AI模型GPT-5.5 InstantOpenAI健康推理模型ChatGPT10 个信源在谈推荐理由:OpenAI 把 GPT-5.5 Instant 的医疗问答能力做到了和自家顶级推理模型一样好,而且免费用户都能用,生病问AI更放心了。原文
02:38OpenAI@OpenAIOpenAI在推文中称,改善人类健康将是AGI最具体、直接的影响之一。该公司表示,随着模型持续改进,目标是让ChatGPT在健康相关场景中更准确、更有用。OpenAI承诺将这一进展带给更多人,但未透露具体模型版本或时间线。行业OpenAIChatGPT医疗健康10 个信源在谈推荐理由:OpenAI画了个大饼,说AGI能帮人更健康,还打算让ChatGPT更准更有用。虽然没细节,但方向挺有意思。原文
02:33Notion@NotionHQFast Company发布了首届"AI 20"榜单,表彰在AI扩散至经济中起关键作用的领袖。Notion的AI负责人Sarah Sachs入选,其团队将Notion AI从简单重写工具演变为检索式问答,再到具有权限和审计追踪的"治理型AI队友"。当推理模型能自主完成序列任务时,他们从头重建了整个Notion AI架构。行业Fast CompanyNotionSarah SachsAI治理推理模型1 个信源在谈推荐理由:Fast Company选出了20位推动AI普及的领袖,Notion的Sarah Sachs榜上有名。她让Notion AI从改文章进化成带权限的‘AI队友’,还重写了整个架构,很酷。原文
02:32LlamaIndex@llama_index约90%的企业数据是非结构化的,被锁定在文档中,构成知识工作的主体。LlamaIndex CEO Jerry Liu在Databricks DataAISummit上演讲,介绍了OCR和agent编排的核心进展。这些技术使AI智能体能够大规模理解、推理和编辑文档,从而自动完成整个工作流程。演讲于当地时间10:20 AM在Yerba Buena Salon 7举行。行业LlamaIndexDatabricks智能体非结构化数据文档自动化1 个信源在谈推荐理由:LlamaIndex的CEO在Databricks峰会上聊了怎么用AI智能体搞定那90%的非结构化数据,不是画饼,有具体的OCR和编排思路,搞企业自动化的朋友可以看看。原文
02:25Replit@ReplitReplit 宣布与 Slack 集成,用户可以在 Slack 对话中直接通过 Slackbot 描述需求,Slackbot 会自动调用 Replit 生成对应的应用或代码。该功能无需离开 Slack 界面即可启动开发环境,降低从想法到原型的门槛。Replit 是一个在线 IDE 和协作平台,此前已支持 GitHub 等集成。AI产品ReplitSlackSlackbot编程助手集成4 个信源在谈推荐理由:以后在 Slack 里聊着天就能让 Replit 帮你写代码了,不用切来切去,挺方便的。原文
02:22LangChain@LangChainAILangChain 推出 Deep Agents 深度解析第四部分,核心主题是 steering 功能。该功能通过第一类 HITL(人在回路)原语,允许用户在 Agent 执行过程中实时介入和调整行为。与传统的自动化流程相比,steering 提供了更细粒度的控制,无需重新启动整个 Agent。此特性使开发者能灵活纠正方向或注入上下文,提升复杂任务的可靠性。AI产品LangChainDeep AgentsSteering人在回路智能体推荐理由:LangChain 教你用 HITL 原语引导 Deep Agents,比硬编码指令灵活多了,跑偏了也能随时拽回来。原文
02:17@koltregaskes@koltregaskes79°据消息,OpenAI GPT-5.6和GPT-5.6 Pro预计下周四(next Thursday)正式登陆。部分用户可能已在ChatGPT网页端体验GPT-5.6 Pro模型。同时,Anthropic的Claude Fable 5也可能在未来几天内回归。AI模型GPT-5.6GPT-5.6 ProOpenAIClaude Fable 5模型发布10 个信源在谈推荐理由:GPT-5.6和Pro版下周就来,Claude Fable 5也快回来了,想尝鲜的可以留意。原文
02:07LlamaIndex@llama_indexLiteParse v2.1 实现了最快的无LLM Markdown输出功能。该版本在三个独立基准数据集中击败了所有其他无模型竞争对手。完全不需要语言模型即可完成解析,速度显著提升。用户可无需额外推理成本直接获得结构化Markdown结果。AI产品LiteParseLlamaIndexMarkdown解析推荐理由:LlamaIndex 的 LiteParse v2.1 搞出了最快无LLM的Markdown输出,三个基准都赢了,速度还快。原文
02:03MIT CSAIL@MIT_CSAILMIT CSAIL 研究员 Alexander Amini 主讲的深度学习免费课程已更新至 2026 版。该课程涵盖监督学习、无监督学习和强化学习三大范式。第 5 讲专门讲解三者的核心差异。课程完全免费开放,适合入门到进阶学习者。技巧MIT深度学习免费课程监督学习强化学习推荐理由:MIT 出了新版深度学习免费课,Alexander Amini 讲第 5 讲,把监督、无监督、强化学习的区别掰开揉碎,想入门可以看看。原文
01:54LMSYS Org (SGLang)@lmsysorgpoolside发布的Laguna M.1是一个225B参数的MoE模型,专为智能体编码和长期任务设计。该模型采用70层结构:3个密集SwiGLU层加67个稀疏MoE层,共有256个专家,top-k=16且使用无辅助损失负载均衡。它在所有层使用全局注意力:64个Q头、8个KV头,以及softplus输出门控。Laguna M.1支持原生交错推理:在工具调用之间进行思考,并可每个请求切换。在SWE-bench Verified、SWE-bench Multilingual、SWE-Bench Pro和Terminal-Bench 2.0上表现强劲。现在可通过SGLang运行。AI模型Laguna M.1poolsideSGLang智能体编程助手2 个信源在谈推荐理由:poolside刚发的225B MoE模型Laguna M.1,专为智能体编码设计,SGLang直接跑起来了,在SWE-bench上很强。原文
01:44Anthropic@AnthropicAIAnthropic发布Project Fetch实验,让两个零机器人经验的团队编程机器狗。其中一个团队使用Claude辅助,另一个团队仅靠传统方法。实验对比了两组的表现,展示了Claude在机器人编程中的实际效果。结果视频已在Anthropic官方推文中公开。AI模型AnthropicClaudeProject Fetch机器人编程编程助手10 个信源在谈推荐理由:Anthropic让没碰过机器人的团队用Claude写机器狗代码,看看AI到底能帮多少忙,结果挺有意思。原文
01:43Anthropic@AnthropicAI精选Anthropic 发布 Frontier Red Team 博客,介绍 Project Fetch 第二阶段:测试 Claude 编程机器人狗的能力。Opus 4.7 自主完成编程任务,速度比去年最佳人类团队(使用 Opus 4.1)快约 20 倍。尽管速度提升显著,机器人狗仍未成功取回沙滩球。该研究旨在评估前沿模型在物理世界中的自主能力与安全风险。AI模型ClaudeOpus 4.7Anthropic机器人编程安全测试10 个信源在谈推荐理由:Anthropic 让 Claude 自己写代码控制机器狗,速度比人快20倍,虽然最后没抓到球,但过程特别有意思原文
01:36Milvus@milvusio精选Milvus指出,仅看平均Recall@5(如85%)会掩盖真实问题。例如,精确术语查询的Recall@5可能只有40%,其他类别拉高了平均值。文章建议将测试用例分为精确术语查询、多跳问题、长尾问题、不可回答问题、权限过滤问题五类,每类至少放5-10个案例分别检查召回率。这样能精准定位检索堆栈中的薄弱环节。技巧Milvus召回率检索评估查询类型向量数据库推荐理由:Milvus教你怎样真正看懂你的召回率——按5种查询类型拆解,别被一个平均数字骗了。原文
01:35Marc Andreessen@pmarcaa16z 创始人 Marc Andreessen 发推称“有趣”,并提及 Z.ai 创始人、GLM AI 模型的创造者。该推文获得 48 条回复、40 次转发和 617 个点赞,引发行业关注。Z.ai 和 GLM 模型的具体动向尚未明确。行业Z.aiGLMMarc Andreessen行业动态推荐理由:a16z 大佬 Marc Andreessen 点名 Z.ai 和 GLM 模型,看看谁被盯上了。原文
01:33SiliconFlowAI@siliconflowai精选Z.ai 的 GLM 5.2 在编码基准 CodeArena 上排名第一。每百万 token 输入缓存/输入/输出价格为 0.26/1.40/4.40 美元,支持 1M 上下文长度。其编码性能与 Opus 4.8 相当,并提供 max 和 high 两种推理模式。该模型已完全开源,可通过 SiliconFlow 的 T+0 合作获取。AI模型GLM 5.2Z.aiCodeArenaSiliconFlow开源模型推荐理由:Z.ai 的 GLM 5.2 在编码竞技场拿了第一,价格比 Opus 便宜,还有 1M 上下文,编程党可以白嫖开源版。原文
01:32SiliconFlowAI@siliconflowai精选MoonshotAI 基于 K2.6 推出了 Kimi K2.7 Code,参数量为 32B 激活/1T 总参数,支持交错思考与多步工具调用。相比 K2.6,推理 token 使用量降低 30%,在编码与指令遵循上表现提升,接近 GPT-5.5 和 Opus 4.8。定价为缓存输入/输入/输出每百万 token 0.19/0.94/4.00 美元。该模型可在 SiliconFlow 上使用。AI模型Kimi K2.7 CodeMoonshotAI编码模型推理效率VLM5 个信源在谈推荐理由:想少想多做?K2.7 Code 编码专用,推理开销比 K2.6 低三成,还能对标 GPT-5.5,适合写代码时不用纠结。原文
01:32DeepLearning.AI@DeepLearningAIDeepLearning.AI与Vocal Bridge合作举办7天语音AI构建挑战赛,6月23日开始。挑战赛教你构建能自主判断何时给你打电话的智能体,而不是让你一直盯着终端。参与者可加入等待清单,还有实时排行榜和奖品。先修课程是Voice AI课程,可提前准备。技巧DeepLearning.AIVocal BridgeVoice AI智能体语音AI推荐理由:DeepLearning.AI和Vocal Bridge搞了个7天挑战赛,教你让智能体主动给你打电话,不用一直盯着终端,6月23号开赛有奖品,想玩语音AI的赶紧加入等待清单。原文
01:31歸藏(guizang.ai)@op741881°OpenAI 正在准备 GPT-5.6 模型家族的发布,GPT-5.6-Pro 版本已在测试中被发现。该消息来自 TestingCatalog 的监测数据,暗示发布可能临近。目前尚未公布具体参数、性能基准或发布日期。AI模型GPT-5.6GPT-5.6-ProOpenAI模型发布10 个信源在谈推荐理由:OpenAI 的 GPT-5.6 快来了,Pro 版本已经在测试,想尝鲜新模型的朋友可以关注起来。原文
01:29xAI@xai精选Vapi 的 Humanness Index 盲测显示,xAI 的 Grok TTS 模型以 96 分(满分 100)位居榜首,仅比人类真实语音低 4 分。该测试将同一段语音用不同模型克隆后,让听众盲评打分。Grok TTS 在多家主要语音模型中表现最接近真人。AI模型Grok TTSxAI语音合成Humanness Index文本转语音推荐理由:xAI 的 Grok TTS 在语音盲测中拿了 96 分,离真人只差 4 分,想听最像人说话的 AI 可以试试。原文
01:28xAI@xai精选xAI 宣布 Grok 模型集成到 Databricks Agent Bricks 平台。企业用户可在 Databricks 环境中直接使用 Grok 模型处理数据,构建 AI 智能体。该集成支持企业将自有数据与 Grok 模型结合,提升智能体能力。AI模型GrokDatabricksxAI智能体企业应用推荐理由:xAI 把 Grok 搬上 Databricks,企业可以直接在自己的数据上跑 Grok 做智能体,不用再折腾部署了。原文
00:38Figma@figmaFigma 设计智能体现在支持网页搜索,用户可通过输入提示或粘贴 URL 来获取信息。搜索结果附带引用链接,可预览后直接插入 Figma 文件中。该功能使设计流程中无需离开 Figma 即可引用实时网络内容。AI产品Figma设计智能体网页搜索AI搜索产品更新1 个信源在谈推荐理由:Figma 的设计助手直接内嵌了网页搜索,给提示或粘贴网址就能把带引用的内容放进设计文件,省了切来切去。原文
00:37Geek@geekbb精选一个名为 handoff 的开源工具让你在 Claude Code 或 Codex 会话中直接委托任务给 DeepSeek 等其他模型。典型用法是让 Claude 负责规划与审阅,DeepSeek 负责执行代码。这种方式能降低 API 成本,同时保持高开发效率。该方案已获得社区关注,相关仓库在 GitHub 上可见。技巧ClaudeDeepSeekClaude CodeCodex编程助手推荐理由:想省钱又能干活?让 Claude 当项目经理、DeepSeek 当写代码的,这个工具帮你搞定。原文
00:35Microsoft Research@MSFTResearch微软研究院的Subutai Ahmad和Nicolò Fusi与公司副总裁Doug Burger探讨人类记忆与机器智能的差异。他们发现Transformer架构能通过持续五小时的故事输入记住一个新密码。这项对比研究揭示了机器在长期信息保留上的独特优势。相关讨论视频已在Twitter上发布。行业Transformer微软记忆机制机器智能推荐理由:微软研究员拿Transformer和人类比记忆:听五小时故事,它能记住新密码,你行吗?看看具体差异在哪。原文
00:34腾讯混元 Tencent Hunyuan@TencentCloud腾讯云赞助RAISE峰会预黑客马拉松大师班,于7月2日在Cyberport ABC Centre举行。腾讯云高级AI架构师Leon Zhang将参与授课,分享实战技能与策略。此次活动旨在帮助参与者备战7月4-5日RAISE主黑客马拉松。腾讯云与数码港共同推动香港AI人才培养与创新生态建设。行业TencentCloudRAISE SummitHackathonAI人才培养数码港推荐理由:腾讯云和数码港联手办黑客马拉松大师班,7月2日有架构师干货分享,参赛实战策略提前学。原文
00:33腾讯混元 Tencent Hunyuan@TencentCloud精选6月17日,AV-Comparatives发布2026 Mobile Security Review,腾讯云TCRS SDK实现99.8%的恶意软件检测率,获Approved Mobile Product认证。评测使用前四周内的新鲜去重样本,对高检测率与低误报提出挑战。TCRS通过动态沙箱+AI行为分析、安全图+图计算及LLM辅助分析三项创新应对。该能力已支撑腾讯手机管家,现可集成到任何移动应用中。AI产品Tencent CloudTCRS SDKAV-Comparatives移动安全恶意软件检测推荐理由:腾讯云的安全方案在AV-C评测中拿下99.8%检测率,靠动态沙箱、图计算和LLM三招,现在开放给所有App了,想加强移动安全的可以看看。原文
00:32Replicate@replicateP-Image-Try-On 是 PrunaAI 发布的虚拟试穿模型,现已上线 Replicate 平台。每次试穿第一件衣服仅 $0.015,每增加一件 $0.008,最多可同时试穿 11 件衣物。支持质量模式(每件 <2 秒)和 Turbo 模式(总计 <4 秒)。提供提示引导和姿态引导实现精确控制。适合电商和时装团队无需重拍即可生成试穿效果。AI模型P-Image-Try-OnPrunaAIReplicate虚拟试穿图像生成推荐理由:PrunaAI 出了个超便宜的虚拟试穿模型,第一件才一分五,快至2秒一件,还能一次穿11件,电商团队看过来。原文
00:22AK@_akhaliqGLM-5.2 模型在 Hugging Face 的推理提供商上提供免费使用,限时6小时。支持的提供商包括 Zai、Together AI、Novita、Fireworks 和 DeepInfra。用户可通过 Pi、opencode、Codex 或 Claude Code 等编码代理进行配置。该免费服务由 xgo.ing 支持。AI模型GLM-5.2Hugging Face免费模型推理提供商编码代理推荐理由:GLM-5.2 现在能免费调用了,6小时内搭配 Pi、Codex 等编码工具就能用,赶紧去试试。原文
00:19LangChain@LangChainAILangSmith 推出 LLM Gateway,为 LLM 调用提供成本控制与安全防护。该网关可设定预算上限,防止智能体因循环或错误而消耗高达 1 万美元的 API 费用。它支持速率限制、密钥管理和实时监控,使开发者能安全部署智能体。AI产品LangSmithLLM GatewayLangChain智能体成本控制推荐理由:LangChain 出了个 LLM 网关,能设预算上限防止智能体烧钱,跑智能体再也不怕睡着后出事了。原文
00:16宝玉@dotey一条推文表达对Mythos级别开源模型的期待,该推文获得1次转发和9次点赞。目前尚无具体发布信息或基准成绩。行业Mythos开源模型推荐理由:网友在推特上表达对Mythos开源模型的期待,已有1转发9点赞原文
00:10elvis@omarsar0精选OpenAI 推出 LifeSciBench,一个针对生命科学研究的基准测试,包含 750 个专家编写的任务,覆盖 7 个生物学研究工作流。该基准由 173 位来自生物技术和制药领域的科学家共同开发,旨在衡量 AI 在真实世界科研场景中的表现。结果显示通用模型在复杂结构处理上仍有不足,而专用模型在科学研究中优势明显。AI模型OpenAILifeSciBench基准生命科学科学智能10 个信源在谈推荐理由:OpenAI 联合 173 位科学家搞了个新基准 LifeSciBench,750 个专家任务专测 AI 搞科研的能力,比通用模型靠谱多了。原文
00:05Jerry Liu@jerryjliu0LlamaIndex CEO Jerry Liu 在 Databricks 的 DAIS 2026 上发表演讲,探讨通用知识代理。他指出约90%的企业数据是非结构化的,锁定在文档中。演讲聚焦OCR和代理编排的核心进展,使AI代理能够深入理解、推理并编辑这些文件,从而自动化整个工作流。AI产品LlamaIndexJerry LiuDatabricksDAIS 2026智能体1 个信源在谈推荐理由:LlamaIndex 的 CEO 讲了怎么用 OCR 和代理编排处理 90% 的非结构化企业数据,值得搞知识管理的朋友听听。原文
00:02Geek@geekbb精选Unsloth AI 将最强开源模型 GLM-5.2 从 1.51TB 压缩至 238GB(缩小 84%),2-bit 量化版本保留约 82% 准确率。该模型可在 256GB Mac 或同等 RAM/VRAM 配置上本地运行。官方指南和 GGUF 文件已在 Hugging Face 发布。AI模型GLM-5.2Unsloth本地运行模型压缩开源模型推荐理由:Unsloth 把 1.5TB 的 GLM-5.2 压到 238GB,本地就能跑,准确率还能保住 82%。有 256GB 内存的 Mac 就能玩,开源模型天花板。原文
00:02Gary Marcus@GaryMarcus精选Gary Marcus引用Matei Zaharia的研究,神经符号系统在机器人领域击败当前最优方法。该方法采用AI驱动的搜索(类似GEPA的方法),让AI生成AI与代码的混合体。Zaharia认为这类系统效率很高,并在其他应用中也观察到类似效果。该成果展示了神经符号系统在控制与规划方面的优势。AI模型Neurosymbolic SystemsGEPARoboticsAI Search机器人推荐理由:Gary Marcus分享了Matei Zaharia的神经符号系统研究,用AI搜索在机器人上打败了现有最优方案,值得搞机器人或符号推理的人关注。原文
23:40LangChain@LangChainAILangChain发布一条教程,展示如何通过迭代循环将agent从首次运行优化到生产就绪。教程强调使用LangSmith进行观察和评估,以构建可靠的agent。内容包含具体步骤,帮助开发者逐步改进agent性能。LangSmith是LangChain推出的调试和评估平台,支持agent的追踪、测试和迭代。技巧LangSmithLangChain智能体生产就绪推荐理由:LangChain官方手把手教你用LangSmith一步步打磨agent,从跑起来到能上线,很实用。原文
23:35OpenAI@OpenAIOpenAI发布一项研究,表明AI系统能帮助临床医生重新分析多年未解的病例。这些病例此前多年未被专家分析。AI使专家主导的周期性重分析更可扩展,医生可随着医学知识进步重新审视旧病例。AI还能识别值得调查的线索,可能为更多家庭带来答案。论文OpenAI医疗AI诊断辅助5 个信源在谈推荐理由:OpenAI出了个研究,说AI能帮医生重新分析那些多年没解决的病例,以前专家都搞不定,现在用AI也许能找到新线索。原文
23:34OpenAI@OpenAI精选OpenAI 的 o3 Deep Research 模型在罕见病诊断中发挥辅助作用,它能够处理测序产生的数百万变异。该模型连接临床特征、遗传模式、变异证据和科学文献,生成假设供专家审核。所有结果都经过人工裁决和临床确认,AI的作用是帮助专家更快、更全面地推理复杂、碎片化的证据。AI模型o3 Deep ResearchOpenAI推理模型医疗AI智能体10 个信源在谈推荐理由:OpenAI 的 o3 Deep Research 能帮医生快速分析海量变异数据,连接文献和临床特征,生成诊断假设。原文
23:34OpenAI@OpenAI研究发表在 NEJM AI,使用 OpenAI 的 o3 Deep Research 模型。模型帮助临床医生回顾长期未解决的罕见儿科疾病病例。为等待多年的家庭找到了答案。论文OpenAIo3 Deep ResearchNEJM AIAI医疗罕见病5 个信源在谈推荐理由:OpenAI 联合顶级医院用 o3 Deep Research 分析多年未解的罕见儿科病例,帮家庭找到答案,有温度也有技术含量。原文
23:30elvis@omarsar0Viktor是一个原生集成在Microsoft Teams的AI agent,用户只需@提及即可自动接收任务、完成工作并提议下一步行动,无需学习或编写提示词。该产品在Slack上已实现2000万美元年收入运行率,现在正式扩展到拥有3.2亿用户的Teams平台。新用户可获得100美元免费额度,无需绑定信用卡。AI产品ViktorMicrosoft TeamsSlack智能体AI员工5 个信源在谈推荐理由:Viktor像同事一样住在Teams频道里,你@它就能干活,不用学不用指令,它会主动提方案。和那些需要学习提示词的AI完全不同。原文