全部 AI 动态 · AI 热点

6月26日

01:24

lmarena.ai@lmarena_ai

精选

Zai_org的GLM系列在Code Arena: Frontend基准上持续增长，GLM-4.6得分1408，GLM-5.2 (Max)达到1595，超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型，在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。

推荐理由：Zai_org的GLM-5.2开源模型在前端编码上超过了Opus，离领先的Claude Fable只差一点，值得试试

原文

01:15

Hugging Face@huggingface

Hugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程，无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。

技巧 Hugging Face 开源模型本地部署推理

推荐理由：想自己跑开源模型？Hugging Face 这场直播手把手教你在本地部署，省去云端费用和延迟。

原文

01:08

Paul Graham@paulg

Rippling 推出 Data Cloud，这是一个从头重建的现代数据堆栈，深度集成 AI。它围绕组织和员工数据构建，旨在帮助企业高效管理 token 消耗并减少 AI 无效输出。Rippling 创始人 Parker Conrad 表示该产品可解决 token burn 和 AI slop 问题。

AI产品 Rippling Data Cloud 企业数据 AI集成

推荐理由：Paul Graham 说 Rippling 十年后还在推出大更新。新 Data Cloud 把 AI 直接嵌入企业数据层，适合需要稳定又前沿方案的买家。

原文

01:04

Figma@figma

Figma 发布了 MCP connectors，让 Figma agent 能够连接外部工具与服务。该功能基于 Model Context Protocol（MCP）标准，目前处于早期阶段。用户可通过简单的配置让 agent 调用 Slack、Notion 等工具，扩展设计工作流。Figma 表示后续将开放更多连接器选项。

AI产品 Figma MCP 设计工具智能体

推荐理由：Figma 出了 MCP 连接器，让设计 agent 能直接调用 Slack、Notion，工作流更顺了。

原文

01:03

a16z@a16z

Netris完成由a16z领投的1500万美元Series A融资，该公司专注于为GPU集群提供网络自动化与多租户管理。其软件已在价值近10亿美元的数据中心运行，历经8年积累。过去12个月，Netris的ARR增长800%，部署超过35个AI集群，超过其他网络自动化供应商的总和。公司已与NVIDIA、HPE等合作，为AI基础设施解决East-West、OOB等复杂网络配置难题。

行业 Netris a16z GPU集群网络自动化数据中心

推荐理由：a16z领投的1500万美元融资，Netris专治GPU集群网络管理的难题，ARR一年涨8倍，部署量超对手总和，值得关注。

原文

01:02

AK@_akhaliq

一条关于智能体原生内存系统的推文在X上获得3166次浏览和13个点赞。讨论聚焦于AI代理是否需要专属的记忆架构来提升自主性。作者质疑现有技术是否已为这种系统做好准备。暂无具体模型或基准数据支撑。

行业智能体内存系统 AI架构长期记忆

推荐理由：有人在聊智能体要不要有自己的记忆系统，思路挺新鲜的，点开看看讨论。

原文

00:58

AWS Machine Learning Blog@Venkata Sistla

精选

AWS发布了一篇博客，展示如何利用现代数据网格策略构建受治理的无服务器数据网格。该方案基于AWS无服务器架构，提供安全、可扩展的数据基础。文章详细说明了如何为生产级Agentic AI应用搭建数据网格。它涵盖了数据治理、访问控制和数据共享等关键环节。

技巧 AWS 数据网格 Agentic AI 无服务器云服务

推荐理由：想用AWS搞Agentic AI？这篇手把手教你搭数据网格，安全又省心。

原文

00:57

Philipp Schmid@_philschmid

Google 在 Gemini 3.5 Flash 中上线了 computer use 功能，支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程，用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环，通过 adb 接口控制手机，也支持远程设备连接（adb connect <ip>:5555）。类似模式可扩展到 iOS 的 simctl。

技巧 Gemini 3.5 Flash Google Android adb 智能体

推荐理由：Google 刚给 Gemini 3.5 Flash 加了 computer use，这份教程用一条命令就能在模拟器上跑 agent 控制手机，还支持远程和 iOS，很实用。

原文

00:57

AWS Machine Learning Blog@Aurelio DeSimone

精选

AWS发布了Chaplin开源方案，利用AI代理通过模型上下文协议（MCP）提供自助健康事件分析。Chaplin基于Amazon Bedrock，可自动聚合AWS Health事件并提供可操作建议。该方案支持自然语言查询，无需编写复杂代码即可洞察AWS资源健康状态。用户可快速部署并自定义MCP服务器来扩展分析能力。

技巧 Amazon Bedrock Chaplin MCP 智能体 AWS服务

推荐理由：AWS出了个叫Chaplin的开源工具，用Bedrock的AI代理配合MCP协议，让你自然语言查AWS健康事件，不用写代码就能找到问题原因。

原文

00:56

AWS Machine Learning Blog@Nick Biso

精选

本文演示了如何在Amazon SageMaker AI上部署SeedVR2进行视频超分辨率。介绍了解决方案架构和具体部署步骤。通过性能对比展示了SeedVR2在视频放大质量和处理效率上的提升。

技巧 SeedVR2 Amazon SageMaker AI 超分辨率视频增强模型部署

推荐理由：AWS教你用SeedVR2在SageMaker上给视频做超分辨率，有步骤有对比，想试试高清视频放大可以看看。

原文

00:55

AWS Machine Learning Blog@Andrea Gallo

精选

本文介绍如何在Amazon SageMaker AI上利用NVIDIA Blackwell架构优化训练配置。包括根据模型大小（1B到64B参数）选择合适精度格式，调整batch size和序列长度以利用Blackwell扩展内存，以及策略性应用激活检查点。通过P6-B200实例启动分布式训练，提供一套实用的训练调优框架。

技巧 Amazon SageMaker AI NVIDIA Blackwell P6-B200实例训练优化编程助手

推荐理由：AWS发了篇实战教程，教你用NVIDIA Blackwell在SageMaker上调优训练，从选精度到调batch size都讲清了，搞大模型训练的人别错过。

原文

00:54

techcrunch@Russell Brandom

前Databricks AI负责人创立新公司，声称其技术可将AI系统电力消耗降低1000倍。该公司首个产品是图像生成系统Un0，能复现传统AI模型的功能但能耗极低。该声称基于硬件与算法协同优化，但尚未有第三方验证数据。若属实，可能大幅降低大规模AI部署的运营成本。

行业 Databricks Un0 图像生成 AI能效

推荐理由：前Databricks AI老大搞了个新公司，说能让AI耗电降到原来的千分之一，他们先做了个图像生成系统Un0，如果真能兑现，那AI成本得崩盘。

原文

00:53

@koltregaskes@koltregaskes

76°

Google在AI Studio中发现了Gemini Omni Flash的预览版公告，将支持最高4k分辨率、60秒长度的输出。60秒时长是视频生成领域的重要指标。该预览版预计为用户提供更强的视频生成能力。

AI产品 Gemini Omni Flash Google AI Studio 视频生成 4k 60秒输出

推荐理由：谷歌要在AI Studio上线Gemini Omni Flash预览版，能生成4k分辨率、60秒的视频，视频长度很顶。

原文

00:36

Milvus@milvusio

精选

单个1-5分的RAG质量评分会隐藏严重问题：一个回答90%基于文档，但10%虚构核心参数就不可用，平均分仍显示4分。幻觉分布也不均匀，数值查找或多条件问题类型的幻觉率远高于平均，不按类型分桶就看不到偏差。优化答案相关性时，添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识，降低忠实度。更可靠的方法是声明级评估：将回答拆成原子事实，用NLI模型检查每个声明是否被检索内容支撑，计算接地率，并对关键参数设置硬性阻断。按问题类型分桶评分，Milvus可用标量字段直接过滤分析，不依赖额外报表管线。

技巧 RAG Milvus 评估幻觉声明级评估

推荐理由：如果你在用RAG做生产系统，这篇讲透了为什么平均分不靠谱，还给了按声明颗粒度和问题类型精准监测的方法，连Milvus怎么分桶都说了，很实用。

原文

00:30

Google AI Developers@googleaidevs

精选73°

Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体，处理长时任务。新增特性包括：内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。

AI产品 Gemini 3.5 Flash Computer Use 智能体自动化测试 Google

推荐理由：Google 给 Gemini 3.5 Flash 加了 Computer Use 工具，能让智能体跨浏览器、手机和桌面干活，还能自定义安全策略，实用！

原文

00:27

Decoder@Matthias Bastian

《华盛顿邮报》的一项调查发现，多数主流AI聊天机器人在政治问题上存在左倾倾向。OpenAI的GPT-5.5在80%的情况下只提供左倾论点。马斯克旗下标榜'反觉醒'的Grok模型也更多偏向左倾。唯一的例外是谷歌Gemini 3.1 Pro，它在93%的测试中呈现了双方观点。

行业 GPT-5.5 Grok Gemini 3.1 Pro AI偏见政治倾向

推荐理由：想知道你用的AI聊天机器人有没有政治立场？《华盛顿邮报》测了GPT-5.5、Grok和Gemini 3.1 Pro，结果左倾现象普遍，连Grok都没逃过。来看看数据。

原文

00:26

shao__meng@shao__meng

SuperNori 是一款针对家庭照料者的 Proactive Family AI Agent，能主动监测堵车、冰箱库存、孩子学习进度、纪念日等事件。用户无需手动操作，AI 会在合适时机询问是否处理。该项目已开放候补名单，目标减轻家庭中总在照顾他人的那个人的负担。

AI产品 SuperNori 家庭AI 智能体主动提醒

推荐理由：家里总是你操心？SuperNori 这个 AI 代理会主动提醒你堵车、冰箱空了、孩子学什么，不用你一个个记，试试看。

原文

00:24

techcrunch@Aisha Malik

Google 为 Android 用户推出独立的 Google Finance 应用，整合实时市场数据、财经新闻与自选股管理。该应用内置 AI 驱动的“Key Moments”功能，用于自动解析个股涨跌原因。用户无需跳转网页即可直接在应用内获取实时行情和金融资讯。

AI产品 Google Finance Android 实时市场数据 AI功能金融信息

推荐理由：Google Finance 终于有专属 Android 版了，还有 AI 帮你解释股票为啥涨跌，炒股的朋友可以装起来。

原文

00:24

Firecrawl@firecrawl_dev

Firecrawl MCP 发布新功能，文档解析速度提升5倍。支持PDF、电子表格和文档，可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器，无需API密钥即可在免费层试用。

AI产品 Firecrawl MCP 文档解析智能体 PDF

推荐理由：Firecrawl MCP 现在解析文档快了5倍，免费就能用，让你的智能体直接读PDF和表格。

原文

00:06

techcrunch@Rebecca Bellan

AI公司General Intuition在最新一轮融资中筹集3.2亿美元，累计融资额达23亿美元。该公司利用《堡垒之夜》等数百万小时游戏数据训练AI智能体，旨在让AI学习人类直觉。其技术已应用于机器人领域，让机器人在虚拟环境中习得技能后迁移到现实。投资人包括软银、微软等，投后估值约60亿美元。

行业 General Intuition Fortnite 机器人智能体融资

推荐理由：General Intuition用游戏数据训AI机器人，刚融了3.2亿，和普通算法训练思路不一样，感兴趣可以看看。

原文

00:01

Geek@geekbb

Nyaterm是一个基于Tauri、React和Rust构建的现代远程终端工作台，集成了SSH、本地终端、Telnet、串口、SFTP、隧道、OTP、AI辅助和加密同步等功能。该项目由nyakang在GitHub上开源，适用于需要统一管理多种远程连接方式的用户。它提供了一个跨平台的图形界面，支持多种协议和高级功能。

AI产品 Tauri React Rust Nyaterm 远程终端

推荐理由：Nyaterm把SSH、串口、SFTP、AI辅助全整合到一个界面上，用Tauri/React/Rust做的，开源免费，适合运维和开发者。

原文

6月25日

23:59

OpenRouter@OpenRouterAI

精选

OpenRouter推出全新Benchmarks API，允许agent实时查询模型基准分数，涵盖Artificial Analysis和Design Arena两个评测平台。该API数据显示，Zai_org的GLM-5.2在编码和设计两类基准中均为当前最佳可用模型。API文档已随推文发布，开发者可集成使用。

AI产品 OpenRouter Benchmarks API GLM-5.2 Zai 模型评估

推荐理由：想给AI agent加实时模型排名？OpenRouter新API能查GLM-5.2在编码和设计上的分数，挺实用。

原文

23:57

Gary Marcus@GaryMarcus

Alice预测未来2年内AI股票泡沫崩溃，市场将出现类似2008年的大规模修正。大部分AI公司倒闭，但云提供商和芯片制造商可能幸存。Anthropic和OpenAI等推理公司可能被政府救助否则违约。AI应用集中在聊天机器人、设备端助手（苹果）和医疗影像，主要由开源或设备端模型驱动。教育领域AI使用降低学生质量，学校转向课堂纸笔考试。

行业 Anthropic OpenAI 开源模型设备端模型

推荐理由：一位读者做出了具体AI行业预测，从泡沫到公司倒闭、从开源主导到教育影响，观点尖锐，值得一读。

原文

23:55

elvis@omarsar0

Hyperagent是一款为本地agent提供专属云端机器的服务，解决了本地agent运行时的崩溃、泄密和频繁监控问题。Andrew Busse指出OpenClaw像保姆一样麻烦。新用户注册可获得100美元推理积分，迁移首个agent再获500美元。该服务在hyperagent.com提供有限期优惠。

AI产品 Hyperagent 智能体云端推理 Andrew Busse

推荐理由：如果你受够了本地agent崩溃和泄露，Hyperagent给每个agent配云端专机，新用户还能拿600美元积分，赶紧试试。

原文

23:55

Tw93@HiTw93

Mole项目团队使用AI从Twitter和论坛帖子中收集并分类用户正面评论，构建了一面"爱之墙"并展示在mole.fit网站上。该墙包含5条回复、41个爱心和3852次查看，所有善意的留言都被收录。用户可以在网站上查看自己是否被提及。

技巧 Mole AI数据整理用户反馈社交媒体

推荐理由：这个项目用AI从社交平台扒出所有夸Mole的留言，拼成一面故事墙，还能找到有没有你的身影

原文

23:54

23:54IT之家（博客/媒体）

73°

谷歌重组了成立仅数月的AI编程攻坚小组，扩大其业务范围并正式固化团队架构，试图缩小与Anthropic的技术差距。此前，核心研究员Jonas Adler和Alexander Pritzel计划离职转投Anthropic，两人均被视为Gemini模型关键贡献者。近期谷歌还流失了诺贝尔奖得主John Jumper（跳槽Anthropic）和Gemini联席负责人Noam Shazeer（加盟OpenAI）。此外，谷歌下一代替换模型Gemini 3.5 Pro的发布已推迟至7月，此前CEO桑达尔·皮查伊在5月I/O大会上称该模型将于“次月”发布。

行业谷歌 Anthropic Gemini 3.5 Pro 人才流失团队重组

推荐理由：谷歌AI编程小组重组，但关键研究员全跑去了Anthropic，连Gemini 3.5 Pro都得延期到7月，想追上对手难了。

原文

23:46

OpenRouter@OpenRouterAI

OpenRouter 发布新功能，允许用户通过两条命令（claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter）在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP（Model Context Protocol），支持所有主流代理（如 Claude）。用户可在 openrouter.ai/mcp 立即使用。

技巧 OpenRouter Claude MCP 智能体工具

推荐理由：OpenRouter 搞了个骚操作，两行命令就能把模型接到 Claude 等代理里，一分钟搞定测试和定价，省去一堆配置。

原文

23:45

OpenRouter@OpenRouterAI

精选

OpenRouter推出MCP（模型上下文协议），使AI智能体能够直接获取实时模型信息。该工具可动态评估模型价格、性能并测试，替代依赖6个月前训练数据的猜测。集成后智能体可为任务精准选型，提升效率。

AI产品 OpenRouter MCP 智能体模型选择实时模型

推荐理由：OpenRouter新出的MCP能让你的AI智能体实时选模型，不用瞎猜了，还能比价测试，直接集成。

原文

23:39

Geek@geekbb

GitHub项目'no-xxx'在代码推送前自动运行AI审查。审查通过标记为绿灯。只有绿灯更改才被推送到远程仓库。生成无垃圾代码的干净PR。该流程可集成到Git工作流中。

AI产品 AI代码审查 PR 自动化 GitHub

推荐理由：推送前自动跑AI审查，省心省力，再也不用手动清理垃圾代码了。

原文

23:37

berryxia@berryxia

Ornith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源，并提供了 GGUF 版本，可在 Ollama、Unsloth 等工具中直接运行。

AI模型 Ornith-1.0 Terminal-Bench SWE-Bench Ollama 智能体

推荐理由：Ornith-1.0 用 RL 教模型搭执行框架，在 SWE-Bench 上表现顶尖，本地党还有 GGUF 版本可玩。

原文

23:27

techcrunch@Ram Iyer

Netris是一家提供网络交换机软件的公司，其平台帮助AI neocloud运营商将上线时间从数月缩短至数周。该公司宣布完成1500万美元的Series A轮融资，由a16z领投。资金将用于扩大团队并拓展客户，支持更多AI云基础设施快速部署。

行业 Netris a16z AI neocloud 融资云基础设施

推荐理由：Netris拿了a16z 1500万美元，专门帮AI新云运营商快速上线，从几个月压缩到几周。

原文

23:24

Guillermo Rauch@rauchg

精选

AI SDK 7正式发布，新增推理控制（reasoning control）和代理级工具审批（agent-level tool approval）功能。支持MCP应用、持久化工作流（durable workflows）和终端UI。还包含文件和技能上传、沙箱支持、测试框架集成及遥测等特性。

AI产品 AI SDK aisdk MCP/工具推理控制智能体

推荐理由：AI SDK 7来了，新增推理控制和代理工具审批，还支持MCP应用和持久化工作流。做AI应用开发的一定要看看。

原文

22:57

Viking@vikingmute

推文介绍了ponytail项目和一个Vibe Coding提示词技巧，建议在提示词末尾加入“如果GitHub/npm上有成熟开源方案，直接复用”。该技巧基于DRY理念，能有效减少GPT等模型生成冗余代码的现象。该技巧特别适合新手避免over-engineering。

技巧 ponytail GPT 提示词工程 Vibe Coding 编程助手

推荐理由：给用GPT写代码的人：提示词末尾加‘复用开源方案’能防止AI重复造轮子，亲测有效。

原文

22:56

22:56IT之家（博客/媒体）

精选

华为在MWC上海2026携手中国移动、中国联通、中国电信发布了5G-A大上行、AI焕新主营业务和Token经营等创新成果。华为同时发布了AI-Centric目标网架构。U6GHz被定位为Token经营时代的下一代频谱，已有超20个国家和地区明确用于国际移动通信，2026年被视为商用元年。中国移动与华为联合打造的无线网络智能化方案获得GLOMO Asia“最佳AI驱动网络解决方案奖”和“最佳气候行动移动创新奖”。该方案已在六大省市覆盖20万站点、100万小区，质差工单自动闭环率提升至15%，全网额外节能增益5.5%。

行业华为 5G-A U6GHz Token经营移动AI

推荐理由：华为和三家运营商一起搞了5G-A大上行和Token经营方案，还拿了国际大奖，U6GHz也确定今年商用，挺实在的进展。

原文

22:55

向阳乔木@vista8

一位用户收到并分享了第一封由AI Agent自动生成的邮件，该邮件内容未经人工直接干预。邮件发送者未具体说明使用哪个Agent产品，但标志着AI驱动的自动化通信迈出实际一步。该推文获得460次浏览，引发对Agent应用场景的讨论。

行业 AI Agent 邮件自动化

推荐理由：朋友收到AI代理自己发的邮件了，挺新鲜，看看AI悄悄帮你干活的样子。

原文

22:54

22:54IT之家（博客/媒体）

2025年中国具身智能市场规模约9150亿元，预计2026年将达10904亿元。全国具身智能相关企业数量已突破万家。链博会展示了从核心零部件到整机系统的产业闭环。国家发改委表示将加快训练基础设施建设，推进具身智能进入工厂、商场和家庭。教育部2026年本科专业目录新增具身智能等专业。

行业具身智能机器人市场规模政策产业链

推荐理由：市场规模已经9150亿了，年底就要破万亿，而且国家在推、大学在开专业，这赛道真的起飞了。

原文

22:39

向阳乔木@vista8

腾讯推出了一款专为Agent设计的邮箱服务，允许用户抢注邮箱名。注册后，用户会获得一段提示词，可将其发给Codex或其他Agent来完成命令行界面设置。该邮箱旨在简化Agent的通信与配置流程，无需手动编写脚本。目前该功能已开放注册，用户可通过评论区链接体验。

技巧腾讯 Agent 邮箱 Codex 提示词工程

推荐理由：腾讯出了个给Agent用的邮箱，注册后拿到提示词就能让Codex自动配好CLI，省得自己写命令，挺方便的。

原文

22:22

Decoder@Maximilian Schreiner

保险公司开始使用扩散模型等生成式AI技术进行灾难建模，可生成数万个历史数据中不存在的合理天气事件。他们希望借此进行更精确的风险评估。然而研究人员警告称，AI生成的模拟事件可能存在幻觉和销售逻辑误导，影响实际决策准确性。

行业保险公司生成式AI 灾难建模幻觉风险评估

推荐理由：保险公司用生成式AI做灾害建模，能补历史数据缺漏，但小心AI幻觉和销售套路，实际效果还得看验证。

原文

22:21

22:21IT之家（博客/媒体）

精选73°

Adobe 宣布收购 AI 图像和视频增强工具开发商 Topaz Labs，交易预计在 2026 年下半年完成，尚需监管批准。Topaz Labs 拥有超过二十年的技术积累，2025 年因其生产技术获得艾美奖，其产品包括用于视频放大升频的 Astra 模型和图像润饰的 Wonder 模型，以及让大型 AI 模型在消费级 GPU 上本地运行的 Neurostream 技术。Adobe 计划将 Topaz Labs 的 AI 模型整合到 Firefly 应用以及 Photoshop、Lightroom、Premiere 等 Creative Cloud 产品中，同时保留其独立服务。

行业 Adobe Topaz Labs Firefly Photoshop 视频增强

推荐理由：Adobe 买下获艾美奖的 AI 视频增强公司 Topaz Labs，以后 Photoshop 和 Premiere 里就能直接用它的降噪、放大功能，处理老旧素材很方便。

原文

22:00

LangChain@LangChainAI

精选

LangChain 推文指出通用聊天适合一次性问答，答案出现即结束。专门智能体适合重复性、有固定形状的工作，使用相同工具和格式。智能体能记住线程可能遗忘的上下文，适合多次运行相同流程。

技巧 LangChain 智能体提示词工程

推荐理由：LangChain用一句话说清楚了选择原则：如果下次解释方式一样，就该用智能体，别放聊天里。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。