全部 AI 动态 · AI 热点

6月3日

19:16

Decoder@Maximilian Schreiner

83°

在Build 2026大会上，微软发布了7款自研AI模型，包括其首个推理模型。微软还推出了一种新的调优方法和一个自主后台智能体。在图像生成方面，微软声称超越了谷歌，但在推理能力上仍在追赶。这些模型和工具旨在增强Azure AI平台，为开发者提供更强大的AI构建能力。微软的自主后台智能体可以自动执行后台任务，提高效率。

AI产品微软自研模型图像生成推理模型智能体

推荐理由：微软一口气推出7款自研模型，图像生成能力超越谷歌，但推理模型仍在追赶——做AI应用开发的团队值得关注这些新工具，尤其是新的调优方法和自主后台智能体，可以直接提升项目效率。

原文

19:15

Decoder@Maximilian Schreiner

78°

Nous Research 推出了 Hermes Desktop，一个基于 MIT 许可证的开源 AI 智能体应用。该应用旨在跨平台运行，为用户提供统一的 AI 助手体验。Hermes Desktop 支持多种操作系统，包括 Windows、macOS 和 Linux，并集成了本地 AI 模型，确保数据隐私。这一发布标志着开源 AI 智能体在桌面端的重大进展，让开发者可以自由定制和部署。

AI产品智能体开源/仓库跨平台桌面应用 Nous Research

推荐理由：开源 AI 智能体终于有了跨平台桌面版，做本地化 AI 应用的开发者可以直接用 MIT 许可证代码，省去从头搭建的麻烦。

原文

17:45

marktechpost@Michal Sutter

Nous Research 发布了 Hermes Desktop，这是 Hermes Agent v0.15.2 的原生跨平台桌面前端。它提供无终端 GUI，与 Hermes Agent CLI 共享同一智能体核心、技能和记忆，并支持流式工具输出。该工具旨在让用户更直观地操作智能体，无需依赖命令行。对于偏好图形界面的开发者和研究者来说，这是一个重要的易用性改进。

AI产品智能体桌面应用 GUI Hermes Agent 跨平台

推荐理由：Hermes Desktop 让不习惯命令行的用户也能轻松使用 Hermes Agent，做智能体开发或实验的团队可以直接下载体验，省去学习 CLI 的成本。

原文

14:41

14:41IT之家（博客/媒体）

Meta 公司收缩了其 MCI 员工追踪系统，新增最长 30 分钟的暂停功能和豁免申请机制。MCI 系统从 200 多个应用和网站收集员工鼠标移动、点击等操作，用于训练 AI 智能体。扎克伯格称员工智力水平高于承包商，但该系统因隐私和耗电问题遭到员工反对。Meta 副总裁表示团队仍相信隐私保护，但会进行多项优化。

行业 Meta AI训练员工监控隐私智能体

推荐理由：Meta 用员工操作数据训练 AI 的做法引发隐私争议，现在允许暂停和豁免，关注 AI 数据采集伦理的读者值得一看。

原文

13:21

13:21IT之家（博客/媒体）

精选

OpenAI 宣布将在全平台 ChatGPT 应用中集成 Codex 功能，并发布六款面向企业业务场景的智能体插件，覆盖销售、数据分析、创意制作、产品设计、公募股权投资和投行业务。同时，Codex 新增批注和站点生成功能，批注功能允许用户定向修改文档、表格等内容，站点生成功能可快速创建交互式网站。此举旨在降低企业用户使用 Codex 的门槛，直观展示两款工具的协同关系。此前，Codex 已支持远程操控电脑功能。

AI产品 OpenAI Codex ChatGPT 企业插件智能体

推荐理由：企业团队终于有了可直接落地的 AI 编码助手——Codex 插件覆盖销售、投行等真实场景，批注和站点功能让非开发者也能轻松上手，做业务分析和内容制作的团队建议点开看看。

原文

09:54

09:54IT之家（博客/媒体）

精选

微软在2026年Build大会上明确Windows 11新定位：从带AI功能的桌面系统转型为AI应用和智能体的开发平台。新方向包括智能体Runtime、本地模型Aion 1.0、Windows原生AI接口、Linux容器、企业治理和安全隔离等，旨在解决当前AI开发工具链分散的问题。微软将整合GitHub Copilot、Claude Code等工具，提供统一集成层，并推出Microsoft Execution Containers机制来限定智能体访问权限。此举让开发者能在Windows 11上完成开发、部署、监控和安全管理全流程，同时避免锁定单一AI供应商。

行业 Windows 11 AI开发平台智能体微软企业治理

推荐理由：微软把Windows 11从桌面系统升级为AI开发平台，解决了工具链割裂和治理难题，做AI应用和智能体的开发者可以直接在Win11上获得一致体验，值得关注。

原文

09:12

09:12IT之家（博客/媒体）

Perplexity 宣布将于 7 月升级其自主 AI 智能体系统 Perplexity Computer，引入混合 AI 调度能力。该功能可根据任务场景自动拆分：涉及金融记录、健康信息等敏感数据的部分由本地模型处理，复杂任务则调用云端前沿模型。设备上的小模型会先判断哪些内容应留在本地，避免用户手动选择。Perplexity 认为真实任务混合了隐私判断、内容理解和复杂生成，因此按环节协调本地与云端模型完成结果。

AI产品 Perplexity Computer 混合AI 隐私保护智能体任务调度

推荐理由：Perplexity Computer 的混合调度解决了 AI 任务中隐私与算力的两难，做自动化或智能体开发的团队可以关注这个架构思路，看看如何在不牺牲性能的前提下保护用户数据。

原文

08:48

GitHub Blog@Natalie Guevara

精选78°

GitHub 在 Microsoft Build 2026 上发布了全新的 Copilot 桌面应用，提供原生智能体体验。该应用将 AI 编程助手直接集成到桌面环境中，支持更自然的交互和自动化工作流。开发者可以通过桌面应用直接与 Copilot 对话、管理代码任务，并利用智能体功能自动执行复杂操作。这一更新标志着 GitHub 将 AI 编程从插件形式升级为独立桌面体验，旨在提升开发效率。

AI产品 GitHub Copilot 智能体桌面应用编程助手 Microsoft Build

推荐理由：GitHub Copilot 桌面应用让 AI 编程从插件升级为原生桌面体验，做开发的团队可以直接在桌面端享受更流畅的智能体交互，建议试试看。

原文

06:44

06:44IT之家（博客/媒体）

OpenAI 宣布拓展其 AI 智能体助手 Codex 的使用场景，新增 6 个岗位插件，覆盖数据分析、创意制作、销售、产品设计、公开股票投资和投资银行等领域。这些插件打包了 62 个常用应用和 110 项技能，旨在帮助非开发者用户（如分析师、营销人员、设计师等）更高效地完成工作。目前 Codex 周活跃用户超 500 万，非开发者用户占比约 20%，且增长速度是开发者的 3 倍以上。此外，Codex 还面向商业版和企业版用户预览互动网站与应用创建功能，并扩展了批注功能到文档、表格和幻灯片。

AI产品 OpenAI Codex 智能体插件数据分析

推荐理由：Codex 从编程助手扩展到 6 个非技术岗位，做数据分析、营销或产品设计的团队可以直接用插件提升效率，值得点开看看有没有适合你的角色。

原文

03:14

03:14IT之家（博客/媒体）

72°

微软推出开源框架 ASSERT，能将自然语言写成的行为规范自动转换为可执行的评估流程，包括生成测试场景、数据集、评估指标和计分卡。该框架通过四个阶段工作：细化行为规范、生成分层测试用例、运行测试并记录轨迹、对照行为分类评分。验证显示，ASSERT 生成的测试集覆盖更广，能暴露更多失败模式，与人工审核一致率达 80%-90%。该框架适用于行为定义明确的场景，旨在让评估更快速、明确和易于迭代。

AI产品开源/仓库 AI 评测智能体 ASSERT 微软

推荐理由：做 AI 智能体或应用评测的开发者，终于有了一个能把需求文档直接变成测试用例的工具，省去手动编写评估脚本的繁琐，建议试试 ASSERT 的 travel-planning 实例。

原文

02:50

02:50IT之家（博客/媒体）

76°

微软在Build 2026大会上推出Agent Control Specification（ACS）开源标准，旨在统一和细化AI智能体的行为控制。ACS允许开发、合规和安全团队共同制定策略规则，明确智能体允许或禁止的操作、需人工审批的行为及审计记录。该规范在智能体工作流的多个阶段（如输入接收前、工具调用前后、回复前）执行策略检查，支持允许、阻止、脱敏或人工审批等操作。ACS以单一文件定义策略，可随智能体跨框架迁移，并已支持LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel及MCP等主流框架。这解决了当前控制机制分散、难以审计和复用的问题，为AI智能体在企业级部署中的安全性和合规性提供了标准化方案。

行业智能体开源/仓库安全/合规微软 MCP/工具

推荐理由：ACS解决了AI智能体在企业落地中行为失控的痛点，做智能体应用开发或合规管理的团队可以直接用这套标准统一策略，省去重复配置的麻烦。

原文

01:53

01:53IT之家（博客/媒体）

78°

微软在 Build 2026 大会上发布了专为 AI 智能体打造的“Project Solara”操作系统，该系统基于 Android 而非 Windows，旨在为低功耗设备提供企业级安全和管理功能。同时，微软展示了两款概念设备：桌面终端（Desk Concept）和智能胸牌（Badge Concept），前者类似带屏智能音箱，支持人脸识别解锁和直接访问 AI 智能体；后者是可穿戴设备，配备摄像头、指纹识别和 5G 连接，用户可通过按钮启动 AI 智能体进行对话记录和环境感知。微软不计划亲自生产这些设备，而是将其作为参考设计提供给硬件厂商，目前已有百思买、AccuWeather 等厂商启动试点项目。此举标志着微软在 AI 智能体硬件生态上的布局，通过 Android 平台降低开发门槛，加速企业级 AI 应用落地。

AI产品智能体操作系统微软 Android 可穿戴设备

推荐理由：做 AI 硬件或企业级智能体应用的开发者值得关注——微软用 Android 做智能体 OS，降低了低功耗设备的开发门槛，参考设计直接给厂商用，可以提前了解生态方向。

原文

00:15

00:15IT之家（博客/媒体）

腾讯云智能体开发平台宣布自2026年6月3日起，对DeepSeek-V4系列模型进行价格下调。其中DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%，缓存命中价格降幅高达97.5%；DeepSeek-V4-Flash模型的缓存命中价格降幅达90%。该系列模型总参数达1.6万亿，采用混合专家架构，原生支持100万Token上下文长度。此次降价是腾讯云在平台接入层面的进一步调整，此前DeepSeek官方已于5月23日宣布V4-Pro API永久降价。

AI产品腾讯云 DeepSeek-V4 模型降价智能体 API

推荐理由：腾讯云大幅降低DeepSeek-V4系列模型调用成本，做AI应用开发或智能体集成的团队可以直接降低推理成本，缓存命中价格降幅高达97.5%，高频调用场景尤其划算，建议开发者抓紧调整预算。

原文

6月2日

22:33

22:33Hugging Face: Blog（博客/媒体）

Holo3.1 是一个专注于本地化计算机操作的 AI 智能体模型，能够在用户设备上快速执行任务，如文件管理、应用操作等。它强调低延迟和隐私保护，无需依赖云端服务。该模型在多项基准测试中表现出色，尤其适合需要即时响应的场景。Holo3.1 的发布为本地 AI 智能体领域提供了新的选择，降低了使用门槛。

AI模型智能体本地化隐私保护 Holo3.1 计算机操作

推荐理由：对于注重隐私和响应速度的开发者，Holo3.1 提供了本地化计算机操作的实用方案，可以直接在设备上运行，建议尝试集成到自动化工作流中。

原文

17:15

marktechpost@Michal Sutter

83°

阿里Qwen团队在百炼平台推出Qwen3.7-Plus，这是一个多模态智能体模型。它不仅能理解图像和视频，还新增了自主编程、工具调用和深度推理能力。该模型支持视觉理解、复杂推理和自动化迭代，可应用于更广泛的AI任务场景。这标志着阿里在构建全能型AI智能体方面迈出重要一步。

AI模型 Qwen3.7-Plus 多模态智能体工具调用百炼平台

推荐理由：Qwen3.7-Plus把视觉、推理和工具调用整合到一个模型里，做多模态应用的开发者可以直接在百炼平台体验，省去拼接多个模型的麻烦。

原文

13:44

13:44IT之家（博客/媒体）

精选72°

JetBrains 于 6 月 1 日开源了 Mellum2 模型，这是其面向软件工程系统的新一代机器学习模型。相比原版 Mellum，Mellum2 从代码补全模型升级为完整的编码助手，上下文窗口从 8192 Token 扩展到 131072 Token。该模型总参数为 12B，采用稀疏混合专家框架，激活时参数量为 2.5B，在标准硬件上仍能保持较快计算。Mellum2 支持代码生成与编辑、外部工具调用、多步骤智能体工作流和长对话维持，定位在 AI 工作负载路由、低延迟 RAG 管线、复杂工作流中的子智能体以及私有本地 AI 部署。JetBrains 已开源基础版、指令版和思考版，开发者可在 Apache 2.0 许可证下使用。

AI模型 JetBrains Mellum2 开源/仓库编程助手智能体

推荐理由：JetBrains 把自家 IDE 的 AI 能力下放给社区了——做 JetBrains 插件开发或自建 AI 编程管线的团队，可以直接用 Mellum2 跑本地智能体工作流，省去自己训练和调优的麻烦。

原文

11:41

11:41IT之家（博客/媒体）

72°

科技媒体曝光了微软即将推出的 Copilot 超级应用截图，该项目内部口号为“Delivering one Copilot”，旨在统一多个 Copilot 工具，避免用户频繁切换。应用将整合 GitHub Copilot、Copilot 聊天、Copilot Cowork 以及内部代号 Autopilot 的新智能体能力。其中，Autopilot 区域包含一个名为 Scout 的常驻智能体，类似龙虾 OpenClaw。代码页带有 GitHub Copilot 标识，支持工作树选择、远程环境连接、模型切换和代码定时任务。Cowork 标签页可汇总多源数据并生成提示词，如根据日历准备本周工作。该应用有望强化 GitHub 生态黏性，成为团队开发流的新入口。

AI产品微软 Copilot 智能体编程助手 GitHub Copilot

推荐理由：微软将多个 Copilot 工具整合为一个超级应用，解决了开发者频繁切换工具的痛点，做编程或团队协作的开发者可以直接关注，看看它能否成为你的 AI 工作台。

原文

10:55

10:55IT之家（博客/媒体）

微星推出基于 NVIDIA RTX Spark 超级芯片的迷你主机 EdgeMesa N AI+，具备 20 核 CPU、6144 CUDA 核心和 1 Petaflop FP4 稀疏 AI 算力，支持最高 128GB 统一内存。该主机外观工业风，后置 4 个 USB-C、1 个 HDMI 和 1 个 10GbE 网口，支持四屏输出。微星称其适用于医疗、零售、金融、机器人和智慧城市等场景，紧凑设计适合空间有限环境，高负载下仍能稳定安静运行。这是继 EdgeXpert 后微星在 AI 迷你主机领域的又一布局，专为智能体和 AI 应用打造。

AI产品 RTX Spark 迷你主机 AI 算力智能体边缘计算

推荐理由：RTX Spark 芯片将桌面级 AI 算力塞进迷你主机，做边缘 AI 部署或智能体开发的团队可以直接考虑这个紧凑方案，省空间又省电。

原文

06:41

06:41IT之家（博客/媒体）

精选

阿里千问大模型推出 Qwen3.7-Plus，定位为多模态交互混合智能体，在保留文本、编码、工具使用等能力基础上，强化了视觉理解、视觉推理和跨模态任务处理。该模型支持图像、视频、屏幕、网页和文本输入，可在 GUI、CLI 和工具环境中完成复杂软件与办公流程。在 Vision Arena 评测中，阿里凭借该模型进入全球前 5、中国第 1，多模态测试在 BabyVision、MathVision 等基准上提升明显。模型已通过阿里云百炼和 Qwen Studio 提供服务。

AI模型 Qwen3.7-Plus 多模态智能体阿里千问视觉理解

推荐理由：Qwen3.7-Plus 把视觉与语言统一到智能体基座，做多模态应用或办公自动化的团队可以直接在百炼上试，能省掉不少模型拼接的麻烦。

原文

00:56

marktechpost@Michal Sutter

精选

Memory OS 是一个基于 Hermes Agent 的开源项目，通过六层记忆架构、门控检索和 Wiki 功能，为智能体添加本地持久记忆。该项目解决了智能体缺乏长期记忆的痛点，使 AI 能跨会话保持上下文。六层结构包括工作记忆、情景记忆、语义记忆等，支持高效检索和更新。开发者可直接集成，提升智能体的连续性和个性化能力。

AI产品智能体开源/仓库记忆系统 Hermes Agent 本地持久化

推荐理由：做智能体开发的团队终于有了开箱即用的记忆方案——Memory OS 的六层架构解决了长期记忆缺失的痛点，建议做对话系统或个性化助手的开发者直接集成试试。

原文

6月1日

21:20

Decoder@Maximilian Schreiner

精选78°

Nvidia 推出 RTX Spark 芯片，结合 Blackwell GPU 与 Arm 架构 Grace CPU，支持最高 128 GB 共享内存，FP4 算力达 1000 TOPS。该芯片旨在让 Windows 设备本地运行 AI 智能体成为现实，对标 Apple Silicon 和高通。ASUS、Dell、HP、Lenovo、Microsoft Surface 和 MSI 等厂商计划从 2026 年秋季起推出首批搭载该芯片的设备。这标志着 Windows 平台在本地 AI 处理能力上的重大突破。

AI产品 Nvidia RTX Spark 本地AI 智能体 Windows

推荐理由：Windows 用户终于有望在本地流畅运行 AI 智能体，无需依赖云端。做本地 AI 应用开发或重度依赖 AI 助手的团队，建议关注 2026 年秋季的硬件发布。

原文

18:05

18:05IT之家（博客/媒体）

字节跳动发布 AI 智能体平台扣子 Coze 3.0 版本，主打多人多 Agent 协作、开箱即用。新版本支持灵活组合一人或多人与多个 Agent 协作，实现多项目独立管理和资产自动沉淀。扣子 3.0 可接入 Claude Code、Codex CLI、OpenClaw 等本地 Agent，并提供自媒体、法律、金融等垂直行业的专家技能模板。此外，平台支持手机电脑跨端同步，可授权 Agent 处理本地文件，App 端同步升级以推进编程和视频项目。

AI产品智能体协作平台扣子 Coze Claude Code 行业模板

推荐理由：扣子 3.0 打通了多 Agent 协作和行业模板，做团队协作或垂直场景 AI 应用的开发者可以直接接入 Claude Code 等工具，省去从零搭建的麻烦。

原文

15:16

pandaily@contact@pandaily.com (Pandaily)

精选83°

MiniMax 发布了其旗舰模型 M3，声称这是国内首个将前沿编码、智能体能力、100 万 token 上下文窗口和原生多模态处理整合在单一架构中的 AI 模型。M3 模型在多项基准测试中表现出色，尤其在长文本理解和复杂任务执行方面。该模型支持同时处理文本、图像、音频等多种输入，并具备强大的代码生成和工具调用能力。MiniMax 表示 M3 旨在为开发者和企业提供更高效、更全面的 AI 解决方案。

AI模型 MiniMax M3 多模态长上下文智能体

推荐理由：MiniMax M3 将 1M 上下文、多模态和智能体能力打包进一个模型，做长文本处理或多模态应用的开发者可以直接用它替代多个模型组合，省心又高效。

原文

13:02

13:02IT之家（博客/媒体）

88°

英伟达在 2026 台北电脑展上发布了 DGX Station for Windows，号称全球最强大的桌面 AI 超级计算机。它基于 GB300 Grace Blackwell Ultra 桌面超级芯片，配备 748GB 相干内存和 20 petaflops FP4 性能，支持高达 1 万亿参数的 AI 模型。该设备专为 Windows 生态设计，可运行数百个智能体，旨在弥合企业级 AI 工作负载（训练、微调、推理）与 Windows 日常使用之间的差距。DGX Station 由英伟达与微软合作开发，预计今年第四季度由华硕、戴尔等厂商推出。

AI产品英伟达 DGX Station 桌面 AI 超级计算机智能体 Windows

推荐理由：英伟达把数据中心级的 AI 算力搬到了 Windows 桌面，做智能体开发或企业 AI 落地的团队可以直接在熟悉的系统上跑大模型，不用再折腾 Linux 环境，值得关注。

原文

12:50

12:50IT之家（博客/媒体）

精选78°

英伟达发布 Nemotron 3 Ultra 开源模型，拥有 5500 亿参数，采用混合专家架构，专为全天候运行的自主智能体设计。该模型在推理速度上较同级别前沿模型最高提升 5 倍，使用成本降低 30%，并已适配 Hermes Agent、LangChain 等主流智能体平台。同时推出安全防护和语音识别模型，增强企业级智能体能力。CrowdStrike 和 Palantir 已将其用于网络安全和业务流程自动化。模型将于 6 月 4 日通过 Hugging Face 等平台以 NIM 微服务形式开放。

AI模型英伟达 Nemotron 3 Ultra 开源模型智能体混合专家模型

推荐理由：英伟达把大模型推理速度和成本同时优化了，做智能体开发或企业自动化的团队可以直接用上，比现有开源方案更高效省钱，值得关注。

原文

12:17

爱范儿@制糖工厂

制糖工厂推出全球首款智能体电源 AI 小电拼 Mirror，配备 0.5 寸琥珀屏、160W 高功率输出和 4×140W 盲插接口，支持小米 120W 澎湃秒充。其搭载 CanOS 2.0 如意系统和 OTW 云桥，能通过 AI Agent 实现充电头的智能进化，从桌面电站到差旅随行充，重新定义 AI 时代的万能充。这款产品将电源设备从被动工具升级为主动智能体，为充电场景带来全新交互体验。

AI产品智能体电源 AI Agent 充电设备制糖工厂

推荐理由：制糖工厂把充电头做成了智能体，解决了传统电源无法自适应场景的痛点，经常出差或桌面设备多的用户值得关注，可以直接体验 AI 驱动的充电管理。

原文

11:59

11:59IT之家（博客/媒体）

88°

英伟达CEO黄仁勋在2026台北国际电脑展上宣布，下一代AI超级芯片平台Vera Rubin已全面投产。该平台专为AI工厂设计，相比上一代Grace Blackwell，大规模智能体吞吐量提升10倍。Vera Rubin整合了Vera Rubin NVL72系统、Vera CPU、Groq 3 LPX等组件，构成五个专用机架的POD级超级计算机。供应链规模是前代的两倍，覆盖30多个国家/地区的350多家工厂。产品预计今年秋季开始发货。

AI产品英伟达 Vera Rubin AI超级芯片智能体 POD级平台

推荐理由：Vera Rubin将AI工厂的吞吐量提升10倍，做大规模智能体部署的团队值得关注——秋季发货后可直接用于生产环境。

原文

11:17

11:17IT之家（博客/媒体）

上海市人民政府办公厅印发《上海市服务业发展“十五五”规划》，明确提出支持多模态智能体开发与应用，推动智能客服、智能运营等工具规模化。规划还强调有序推进智能驾驶在共享出行、物流运输等多场景应用，并聚焦AI软件技术、具身智能、智算云服务等领域。该规划旨在到2030年服务业增加值达6万亿元，打造全球服务资源配置枢纽。对AI从业者和企业而言，这意味着上海将提供政策支持和场景落地机会。

行业智能体多模态智能驾驶上海政策服务业规划

推荐理由：上海明确将多模态智能体和智能驾驶列为重点方向，做AI应用和自动驾驶的团队可以提前布局政策红利场景。

原文

11:02

11:02IT之家（博客/媒体）

掌阅科技今日发布人格化 AI 潮玩 CreMoMo，售价 999 元，6 月 1 日起预售。该产品区别于常规 AI 玩具，具备自研记忆算法和拟人化成长体系，能通过长期交互形成专属记忆和人格，主动发起问候和关怀。CreMoMo 支持 WiFi、蓝牙和 4G 连接，内置 AI Agent 效率中心，可自主完成演唱会抢票等任务。产品还包含情感日记、数字试衣间、社交互动等功能，旨在打造可交互、可成长的跨次元数字化生命实体。

AI产品 AI 潮玩情感陪伴智能体掌阅 CreMoMo

推荐理由：掌阅把 AI 陪伴从冷冰冰的问答升级成能主动关怀、还能帮你抢票的实体潮玩，999 元的价格对想要情感陪伴又需要实用功能的年轻人来说值得一试。

原文

5月31日

15:56

Decoder@Jonathan Kemper

精选

哈尔滨工业大学的研究人员通过新基准测试LiveBrowseComp发现，主流AI搜索智能体（如GPT-5.4和Kimi K2.6）在标准测试中表现良好，但主要依赖训练记忆而非实时搜索。LiveBrowseComp仅询问过去90天内的事件，迫使模型无法依赖记忆。在此测试下，模型性能显著下降，现有排名被打乱。这表明AI搜索智能体存在“确认偏差”，即倾向于确认已知信息而非真正研究网络。该发现对依赖AI进行实时信息检索的用户和开发者具有重要警示意义。

论文 AI搜索智能体基准测试 GPT-5.4 Kimi K2.6

推荐理由：这项研究戳穿了AI搜索智能体的真实能力——它们更擅长背书而非真正搜索。做信息检索或依赖AI获取最新资讯的团队，看完会重新评估工具选择。

原文

10:18

marktechpost@Sana Hassan

精选

SkillNet 是一个实用框架，用于发现、安装、检查、评估和组织可复用的AI技能。本教程展示了如何利用 SkillNet 构建技能增强型AI智能体，涵盖搜索、评估、图分析和任务规划等核心功能。该框架旨在解决AI技能碎片化问题，让开发者能更高效地组合和复用技能模块。通过 SkillNet，开发者可以快速集成预构建技能，提升智能体的灵活性和可扩展性。

技巧智能体 SkillNet 技能复用框架任务规划

推荐理由：SkillNet 解决了AI技能复用和组合的痛点，做智能体开发的团队可以直接用它来快速集成搜索、图分析等能力，省去重复造轮子的时间。

原文

01:43

Decoder@Matthias Bastian

72°

据报道，微软和英伟达正在合作开发新一代AI PC，这些PC将不再依赖Copilot，而是运行真正的AI智能体。英伟达将提供自研芯片作为主要处理器，首批设备包括戴尔和微软Surface系列，预计在下周的Computex和Build大会上亮相。微软还计划基于OpenClaw框架开发新软件，让AI智能体在Windows PC上本地处理任务，这是对之前Copilot+ PC概念失败后的第二次尝试。此举旨在提升PC的本地AI能力，减少对云端的依赖。

AI产品 AI PC 微软英伟达智能体 OpenClaw

推荐理由：微软和英伟达联手打造本地AI智能体PC，解决了Copilot+ PC概念失败的问题，做AI硬件或Windows生态的开发者值得关注，这可能是PC AI化的新方向。

原文

5月30日

15:09

15:09IT之家（博客/媒体）

72°

微软正在开发一款 Copilot 超级应用，计划于今年夏末发布，旨在将分散的 AI 助手整合到统一入口。该应用将集成 GitHub Copilot、Copilot 聊天、Copilot Cowork 以及内部代号 Autopilot 的智能体工作流。项目由新任 Copilot 负责人 Jacob Andreou 主导，目标是实现消费端与企业端 Copilot 的统一。用户可在超级应用内切换个人版与企业版 Microsoft 365 Copilot，同时保留原有独立访问方式。微软可能在下周 Build 开发者大会上透露部分信息，但不会展示应用本体。

AI产品微软 Copilot 超级应用 GitHub Copilot 智能体

推荐理由：微软把编程、聊天、智能体全塞进一个 Copilot 超级应用，做开发或日常用 AI 的团队终于不用在多个工具间来回跳了，值得关注夏末的正式发布。

原文

14:12

14:12IT之家（博客/媒体）

精选72°

Nous Research 为开源 Hermes Agent 引入 Tool Search 功能，通过按需加载工具模式，解决 MCP 工具定义占用大量 tokens 的问题。Anthropic 报告显示，典型部署中工具模式可消耗约 50% 的 tokens，导致成本增加和准确率下降。启用 Tool Search 后，模型先搜索再加载参数，最后调用工具，Claude Opus 4 准确率从 49% 提升至 74%。该功能使用 BM25 算法匹配工具，并支持退回到字面子串匹配。

AI产品智能体 MCP/工具开源/仓库 Hermes Agent 工具搜索

推荐理由：做智能体开发的团队终于能省下大量 tokens 成本——Hermes Agent 的 Tool Search 直接解决了 MCP 工具税问题，建议用多工具服务的开发者试试。

原文

12:47

marktechpost@Asif Razzaq

精选72°

Nous Research 的 Hermes Agent 新增 Tool Search 功能，用于解决 MCP（模型上下文协议）中的上下文膨胀问题。该功能采用 BM25 渐进式模式披露机制，能有效筛选相关工具。Anthropic 的评估显示，在 Opus 4 模型上，该方案将准确率提升了 49% 到 74%。这一改进对依赖 MCP 的 AI 代理系统意义重大，能显著减少无效信息干扰，提升任务执行效率。

AI产品 MCP/工具智能体 Hermes Agent BM25 上下文优化

推荐理由：MCP 上下文膨胀是 AI 代理落地的常见痛点，Hermes Agent 的 Tool Search 用 BM25 精准筛选工具，做智能体开发的团队可以直接参考这个方案来优化自己的系统。

原文

08:48

marktechpost@Sana Hassan

精选72°

AgentTrove 是目前最大的开源智能体交互轨迹数据集，包含 170 万条 ShareGPT 格式的记录。本文提供了一份详细的 Python 教程，演示如何在不完全下载的情况下流式读取数据集、标准化智能体对话轮次、提取命令、分析轨迹，并最终将成功的交互轨迹导出为干净的 SFT 微调数据集。这对于需要高质量智能体训练数据的开发者来说非常实用。

技巧智能体数据集 SFT 微调 Python 教程开源/仓库

推荐理由：做智能体微调的团队终于有了大规模、可流式处理的开源轨迹数据，不用再自己爬取或合成。想快速上手构建 ShareGPT 格式 SFT 数据集的开发者，这篇教程可以直接照着跑。

原文

05:36

Claude Code: GitHub Releases@ashwin-ant

76°

Anthropic 发布了 Claude Code v2.1.157，主要新增了自动加载 .claude/skills 目录下的插件功能，无需 marketplace。新增了 `claude plugin init <name>` 命令用于快速创建插件骨架，并支持 `/plugin` 参数的自动补全。智能体方面，`settings.json` 中的 agent 字段现在对分发会话生效，并可通过 `--agent <name>` 覆盖。此外，修复了多个关键问题，包括粘贴损坏图片导致崩溃、沙箱网络权限弹窗在自动模式下的误触发、以及终端冻结等问题。性能优化方面，长对话和恢复会话的消息渲染效率得到提升。

AI产品 Claude Code 插件/技能智能体终端工具修复/优化

推荐理由：Claude Code 用户终于可以自动加载本地插件了，做自动化工作流的开发者可以直接用 `claude plugin init` 快速搭建自定义技能，省去手动配置的麻烦。智能体增强让多会话管理更灵活，值得更新。

原文

5月29日

11:17

pandaily@contact@pandaily.com (Pandaily)

78°

Stepfun 开源了 Step 3.7 Flash，这是一个 196B 参数的稀疏 MoE 大语言模型，专为智能体工作流优化。该模型推理速度达 400 tokens/s，并原生支持工具调用，能高效执行复杂任务。开源此举旨在推动智能体生态发展，降低开发者构建自主系统的门槛。Step 3.7 Flash 在多项基准测试中表现优异，尤其适合需要快速响应和工具集成的场景。

AI模型 Step 3.7 Flash MoE 智能体工具调用开源

推荐理由：做智能体开发的团队终于有了一个原生支持工具调用且速度极快的开源模型——400 tokens/s 的推理速度能显著提升任务执行效率，建议直接上手测试。

原文

11:17

pandaily@contact@pandaily.com (Pandaily)

海尔旗下雷神品牌发布了10款基于AMD处理器的AI工作站，涵盖塔式、迷你PC和移动端三种形态。这些产品针对智能体时代对本地AI计算的需求设计，旨在为开发者和企业用户提供高性能的本地AI推理和训练能力。雷神此次布局覆盖了从桌面到便携的全场景，标志着传统PC厂商加速进入AI硬件赛道。

AI产品 AI工作站 AMD 海尔/雷神本地AI计算智能体

推荐理由：本地AI计算需求爆发，雷神一口气推出10款覆盖全形态的AMD AI工作站，做AI应用开发或需要本地部署模型的团队可以直接关注，省去自己攒机的麻烦。

原文

07:54

07:54IT之家（博客/媒体）

美国电动车公司 Rivian 的软件负责人表示，随着 AI 技术发展，讨论是否整合苹果 CarPlay 已变得过时。他认为汽车正从“软件定义”转向“AI 定义”，智能体 AI 将彻底改变用户与车机的交互方式，不再局限于打开特定应用。Rivian 坚持自研车机系统，不希望将中控主导权交给 iPhone，而是打造涵盖导航、车辆控制、娱乐和 AI 助手的一体化服务。内部调查显示，要求支持 CarPlay 的用户比例已从超过 70% 降至不到 25%。

行业 AI 定义汽车车机交互 CarPlay Rivian 智能体

推荐理由：Rivian 的 AI 优先策略揭示了车机交互的未来方向——做 AI 定义汽车或车机系统的团队，值得关注这个从“软件定义”到“AI 定义”的转变信号。

原文