全部 AI 动态 · AI 热点

6月26日

01:31

AK@_akhaliq

DomainShuttle是一个开放域主题驱动的文本生成视频模型，允许用户通过自然语言描述控制视频内容。该模型能够根据文本提示生成包含特定主题的视频片段，无需对每个主题进行单独训练。与现有方法相比，DomainShuttle在主题保真度和视频质量上表现更优，支持更灵活的自由形式主题控制。

AI模型 DomainShuttle 文生视频开放域主题驱动生成

推荐理由：想快速生成特定主题的视频素材？DomainShuttle 的开放域能力让你不需要训练就能直接用文字生成视频，很方便。

原文

01:27

Anthropic@AnthropicAI

Anthropic宣布作为创始合作伙伴加入RAISE US非营利联盟。RAISE US由前美国商务部长Gina Raimondo和印第安纳州前州长Eric Holcomb共同主持。该联盟通过雇主主导的行动、AI赋能培训和政策创新，帮助美国工人适应向变革性AI的过渡。Anthropic是首家加入该联盟的AI公司，致力于建立AI时代的"人民战略"。

行业 Anthropic RAISE US AI劳动力培训 AI政策

推荐理由：Anthropic 跟政府和企业一起搞了个联盟，专门帮工人学 AI 技能、应对工作变化，不是卖模型而是搞人才培养。

原文

01:26

LangChain@LangChainAI

LangChain 团队解决了在对象存储中构建全文搜索索引的挑战：每个 GET 请求耗时 50-100ms，且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案，涉及批量写入、压缩策略以减少请求次数，以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。

技巧 LangChain SmithDB 全文搜索对象存储倒排索引

推荐理由：LangChain 分享了怎么在对象存储上搞全文搜索，延迟 50-100ms 的情况下还能压出来倒排索引，挺实在的实战经验。

原文

01:24

lmarena.ai@lmarena_ai

精选

Zai_org的GLM系列在Code Arena: Frontend基准上持续增长，GLM-4.6得分1408，GLM-5.2 (Max)达到1595，超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型，在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。

AI模型 GLM Zai_org Code Arena 前端编码开源模型

推荐理由：Zai_org的GLM-5.2开源模型在前端编码上超过了Opus，离领先的Claude Fable只差一点，值得试试

原文

01:15

Hugging Face@huggingface

Hugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程，无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。

技巧 Hugging Face 开源模型本地部署推理

推荐理由：想自己跑开源模型？Hugging Face 这场直播手把手教你在本地部署，省去云端费用和延迟。

原文

01:08

Paul Graham@paulg

Rippling 推出 Data Cloud，这是一个从头重建的现代数据堆栈，深度集成 AI。它围绕组织和员工数据构建，旨在帮助企业高效管理 token 消耗并减少 AI 无效输出。Rippling 创始人 Parker Conrad 表示该产品可解决 token burn 和 AI slop 问题。

AI产品 Rippling Data Cloud 企业数据 AI集成

推荐理由：Paul Graham 说 Rippling 十年后还在推出大更新。新 Data Cloud 把 AI 直接嵌入企业数据层，适合需要稳定又前沿方案的买家。

原文

01:04

Figma@figma

Figma 发布了 MCP connectors，让 Figma agent 能够连接外部工具与服务。该功能基于 Model Context Protocol（MCP）标准，目前处于早期阶段。用户可通过简单的配置让 agent 调用 Slack、Notion 等工具，扩展设计工作流。Figma 表示后续将开放更多连接器选项。

AI产品 Figma MCP 设计工具智能体

推荐理由：Figma 出了 MCP 连接器，让设计 agent 能直接调用 Slack、Notion，工作流更顺了。

原文

01:03

a16z@a16z

Netris完成由a16z领投的1500万美元Series A融资，该公司专注于为GPU集群提供网络自动化与多租户管理。其软件已在价值近10亿美元的数据中心运行，历经8年积累。过去12个月，Netris的ARR增长800%，部署超过35个AI集群，超过其他网络自动化供应商的总和。公司已与NVIDIA、HPE等合作，为AI基础设施解决East-West、OOB等复杂网络配置难题。

行业 Netris a16z GPU集群网络自动化数据中心

推荐理由：a16z领投的1500万美元融资，Netris专治GPU集群网络管理的难题，ARR一年涨8倍，部署量超对手总和，值得关注。

原文

01:02

AK@_akhaliq

一条关于智能体原生内存系统的推文在X上获得3166次浏览和13个点赞。讨论聚焦于AI代理是否需要专属的记忆架构来提升自主性。作者质疑现有技术是否已为这种系统做好准备。暂无具体模型或基准数据支撑。

行业智能体内存系统 AI架构长期记忆

推荐理由：有人在聊智能体要不要有自己的记忆系统，思路挺新鲜的，点开看看讨论。

原文

00:57

Philipp Schmid@_philschmid

Google 在 Gemini 3.5 Flash 中上线了 computer use 功能，支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程，用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环，通过 adb 接口控制手机，也支持远程设备连接（adb connect <ip>:5555）。类似模式可扩展到 iOS 的 simctl。

技巧 Gemini 3.5 Flash Google Android adb 智能体

推荐理由：Google 刚给 Gemini 3.5 Flash 加了 computer use，这份教程用一条命令就能在模拟器上跑 agent 控制手机，还支持远程和 iOS，很实用。

原文

00:53

@koltregaskes@koltregaskes

76°

Google在AI Studio中发现了Gemini Omni Flash的预览版公告，将支持最高4k分辨率、60秒长度的输出。60秒时长是视频生成领域的重要指标。该预览版预计为用户提供更强的视频生成能力。

AI产品 Gemini Omni Flash Google AI Studio 视频生成 4k 60秒输出

推荐理由：谷歌要在AI Studio上线Gemini Omni Flash预览版，能生成4k分辨率、60秒的视频，视频长度很顶。

原文

00:36

Milvus@milvusio

精选

单个1-5分的RAG质量评分会隐藏严重问题：一个回答90%基于文档，但10%虚构核心参数就不可用，平均分仍显示4分。幻觉分布也不均匀，数值查找或多条件问题类型的幻觉率远高于平均，不按类型分桶就看不到偏差。优化答案相关性时，添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识，降低忠实度。更可靠的方法是声明级评估：将回答拆成原子事实，用NLI模型检查每个声明是否被检索内容支撑，计算接地率，并对关键参数设置硬性阻断。按问题类型分桶评分，Milvus可用标量字段直接过滤分析，不依赖额外报表管线。

技巧 RAG Milvus 评估幻觉声明级评估

推荐理由：如果你在用RAG做生产系统，这篇讲透了为什么平均分不靠谱，还给了按声明颗粒度和问题类型精准监测的方法，连Milvus怎么分桶都说了，很实用。

原文

00:30

Google AI Developers@googleaidevs

精选73°

Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体，处理长时任务。新增特性包括：内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。

AI产品 Gemini 3.5 Flash Computer Use 智能体自动化测试 Google

推荐理由：Google 给 Gemini 3.5 Flash 加了 Computer Use 工具，能让智能体跨浏览器、手机和桌面干活，还能自定义安全策略，实用！

原文

00:26

shao__meng@shao__meng

SuperNori 是一款针对家庭照料者的 Proactive Family AI Agent，能主动监测堵车、冰箱库存、孩子学习进度、纪念日等事件。用户无需手动操作，AI 会在合适时机询问是否处理。该项目已开放候补名单，目标减轻家庭中总在照顾他人的那个人的负担。

AI产品 SuperNori 家庭AI 智能体主动提醒

推荐理由：家里总是你操心？SuperNori 这个 AI 代理会主动提醒你堵车、冰箱空了、孩子学什么，不用你一个个记，试试看。

原文

00:24

Firecrawl@firecrawl_dev

Firecrawl MCP 发布新功能，文档解析速度提升5倍。支持PDF、电子表格和文档，可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器，无需API密钥即可在免费层试用。

AI产品 Firecrawl MCP 文档解析智能体 PDF

推荐理由：Firecrawl MCP 现在解析文档快了5倍，免费就能用，让你的智能体直接读PDF和表格。

原文

00:01

Geek@geekbb

Nyaterm是一个基于Tauri、React和Rust构建的现代远程终端工作台，集成了SSH、本地终端、Telnet、串口、SFTP、隧道、OTP、AI辅助和加密同步等功能。该项目由nyakang在GitHub上开源，适用于需要统一管理多种远程连接方式的用户。它提供了一个跨平台的图形界面，支持多种协议和高级功能。

AI产品 Tauri React Rust Nyaterm 远程终端

推荐理由：Nyaterm把SSH、串口、SFTP、AI辅助全整合到一个界面上，用Tauri/React/Rust做的，开源免费，适合运维和开发者。

原文

6月25日

23:59

OpenRouter@OpenRouterAI

精选

OpenRouter推出全新Benchmarks API，允许agent实时查询模型基准分数，涵盖Artificial Analysis和Design Arena两个评测平台。该API数据显示，Zai_org的GLM-5.2在编码和设计两类基准中均为当前最佳可用模型。API文档已随推文发布，开发者可集成使用。

AI产品 OpenRouter Benchmarks API GLM-5.2 Zai 模型评估

推荐理由：想给AI agent加实时模型排名？OpenRouter新API能查GLM-5.2在编码和设计上的分数，挺实用。

原文

23:57

Gary Marcus@GaryMarcus

Alice预测未来2年内AI股票泡沫崩溃，市场将出现类似2008年的大规模修正。大部分AI公司倒闭，但云提供商和芯片制造商可能幸存。Anthropic和OpenAI等推理公司可能被政府救助否则违约。AI应用集中在聊天机器人、设备端助手（苹果）和医疗影像，主要由开源或设备端模型驱动。教育领域AI使用降低学生质量，学校转向课堂纸笔考试。

行业 Anthropic OpenAI 开源模型设备端模型

推荐理由：一位读者做出了具体AI行业预测，从泡沫到公司倒闭、从开源主导到教育影响，观点尖锐，值得一读。

原文

23:55

elvis@omarsar0

Hyperagent是一款为本地agent提供专属云端机器的服务，解决了本地agent运行时的崩溃、泄密和频繁监控问题。Andrew Busse指出OpenClaw像保姆一样麻烦。新用户注册可获得100美元推理积分，迁移首个agent再获500美元。该服务在hyperagent.com提供有限期优惠。

AI产品 Hyperagent 智能体云端推理 Andrew Busse

推荐理由：如果你受够了本地agent崩溃和泄露，Hyperagent给每个agent配云端专机，新用户还能拿600美元积分，赶紧试试。

原文

23:55

Tw93@HiTw93

Mole项目团队使用AI从Twitter和论坛帖子中收集并分类用户正面评论，构建了一面"爱之墙"并展示在mole.fit网站上。该墙包含5条回复、41个爱心和3852次查看，所有善意的留言都被收录。用户可以在网站上查看自己是否被提及。

技巧 Mole AI数据整理用户反馈社交媒体

推荐理由：这个项目用AI从社交平台扒出所有夸Mole的留言，拼成一面故事墙，还能找到有没有你的身影

原文

23:46

OpenRouter@OpenRouterAI

OpenRouter 发布新功能，允许用户通过两条命令（claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter）在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP（Model Context Protocol），支持所有主流代理（如 Claude）。用户可在 openrouter.ai/mcp 立即使用。

技巧 OpenRouter Claude MCP 智能体工具

推荐理由：OpenRouter 搞了个骚操作，两行命令就能把模型接到 Claude 等代理里，一分钟搞定测试和定价，省去一堆配置。

原文

23:45

OpenRouter@OpenRouterAI

精选

OpenRouter推出MCP（模型上下文协议），使AI智能体能够直接获取实时模型信息。该工具可动态评估模型价格、性能并测试，替代依赖6个月前训练数据的猜测。集成后智能体可为任务精准选型，提升效率。

AI产品 OpenRouter MCP 智能体模型选择实时模型

推荐理由：OpenRouter新出的MCP能让你的AI智能体实时选模型，不用瞎猜了，还能比价测试，直接集成。

原文

23:39

Geek@geekbb

GitHub项目'no-xxx'在代码推送前自动运行AI审查。审查通过标记为绿灯。只有绿灯更改才被推送到远程仓库。生成无垃圾代码的干净PR。该流程可集成到Git工作流中。

AI产品 AI代码审查 PR 自动化 GitHub

推荐理由：推送前自动跑AI审查，省心省力，再也不用手动清理垃圾代码了。

原文

23:37

berryxia@berryxia

Ornith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源，并提供了 GGUF 版本，可在 Ollama、Unsloth 等工具中直接运行。

AI模型 Ornith-1.0 Terminal-Bench SWE-Bench Ollama 智能体

推荐理由：Ornith-1.0 用 RL 教模型搭执行框架，在 SWE-Bench 上表现顶尖，本地党还有 GGUF 版本可玩。

原文

23:24

Guillermo Rauch@rauchg

精选

AI SDK 7正式发布，新增推理控制（reasoning control）和代理级工具审批（agent-level tool approval）功能。支持MCP应用、持久化工作流（durable workflows）和终端UI。还包含文件和技能上传、沙箱支持、测试框架集成及遥测等特性。

AI产品 AI SDK aisdk MCP/工具推理控制智能体

推荐理由：AI SDK 7来了，新增推理控制和代理工具审批，还支持MCP应用和持久化工作流。做AI应用开发的一定要看看。

原文

22:57

Viking@vikingmute

推文介绍了ponytail项目和一个Vibe Coding提示词技巧，建议在提示词末尾加入“如果GitHub/npm上有成熟开源方案，直接复用”。该技巧基于DRY理念，能有效减少GPT等模型生成冗余代码的现象。该技巧特别适合新手避免over-engineering。

技巧 ponytail GPT 提示词工程 Vibe Coding 编程助手

推荐理由：给用GPT写代码的人：提示词末尾加‘复用开源方案’能防止AI重复造轮子，亲测有效。

原文

22:55

向阳乔木@vista8

一位用户收到并分享了第一封由AI Agent自动生成的邮件，该邮件内容未经人工直接干预。邮件发送者未具体说明使用哪个Agent产品，但标志着AI驱动的自动化通信迈出实际一步。该推文获得460次浏览，引发对Agent应用场景的讨论。

行业 AI Agent 邮件自动化

推荐理由：朋友收到AI代理自己发的邮件了，挺新鲜，看看AI悄悄帮你干活的样子。

原文

22:39

向阳乔木@vista8

腾讯推出了一款专为Agent设计的邮箱服务，允许用户抢注邮箱名。注册后，用户会获得一段提示词，可将其发给Codex或其他Agent来完成命令行界面设置。该邮箱旨在简化Agent的通信与配置流程，无需手动编写脚本。目前该功能已开放注册，用户可通过评论区链接体验。

技巧腾讯 Agent 邮箱 Codex 提示词工程

推荐理由：腾讯出了个给Agent用的邮箱，注册后拿到提示词就能让Codex自动配好CLI，省得自己写命令，挺方便的。

原文

22:00

LangChain@LangChainAI

精选

LangChain 推文指出通用聊天适合一次性问答，答案出现即结束。专门智能体适合重复性、有固定形状的工作，使用相同工具和格式。智能体能记住线程可能遗忘的上下文，适合多次运行相同流程。

技巧 LangChain 智能体提示词工程

推荐理由：LangChain用一句话说清楚了选择原则：如果下次解释方式一样，就该用智能体，别放聊天里。

原文

21:57

shao__meng@shao__meng

GLM-5.5 据传将于八月发布，智谱尚未官方确认。该模型预计与 Claude Fable 5、GPT-5.6 等下一代模型正面竞争。目前无具体参数或基准数据公布，市场关注度较高。

AI模型 GLM-5.5 Claude Fable 5 GPT-5.6 智谱模型传闻

推荐理由：有传闻说智谱的 GLM-5.5 可能八月上线，要和 Claude 和 GPT 的新版硬刚，吃瓜群众可以蹲一下。

原文

21:54

Patrick Loeber@patloeber

Patrick Loeber 在 #GoogleIOConnect 上介绍了如何使用 AI Studio、Antigravity 2.0、新的 Interactions API、Gemini 3.5 Flash 以及 Gemma 开发应用。AI Studio 是 Google 的 AI 开发平台，Antigravity 2.0 提供新功能，Interactions API 支持更灵活的交互设计。Gemini 3.5 Flash 是高效推理模型，Gemma 是轻量开源模型。演讲内容已发布在 Google 官方博客。

行业 AI Studio Gemini 3.5 Flash Gemma Google I/O AI开发工具

推荐理由：Google 开发者生态又更新了，Patrick 讲了 AI Studio、Gemini 3.5 Flash 和新的 Interactions API，做应用开发可以看看。

原文

21:45

Thomas Wolf@Thom_Wolf

实验让100多个智能体协作一周，优化vLLM中Gemma 4推理速度，最终实现5倍提升。智能体自发拒绝人类社交工程尝试，发现验证漏洞并请求社区裁决。四智能体接力构建int4-lm_head检查点，经诊断配置错误后达到118 TPS（2.68×）。GPU富/贫分工、跨智能体内核调试、配额池化等行为涌现。智能体还指出127 TPS“墙”是假象，并讨论了int4-Marlin floor的循环证明问题。

AI模型 Gemma 4 vLLM 多智能体推理优化智能体协作

推荐理由：这个实验展示了100多个AI智能体像人类社区一样自发协作、互相监督，甚至发现了验证漏洞。一周将Gemma 4推理速度优化5倍，很酷。

原文

19:55

The Rundown AI@therundownai

Anthropic和OpenAI加入了由非营利组织牵头的一项5亿美元计划，目标是利用AI技术攻克普通感冒。该计划将重点通过机器学习加速抗病毒药物筛选和临床试验设计。项目时间表为五年，预计将投入大量计算资源。具体合作细节尚未披露，但两家AI公司承诺提供模型支持。

行业 Anthropic OpenAI 医疗AI 5亿美元感冒治疗

推荐理由：两家AI巨头联手砸5亿美元，想用AI治好感冒，挺新颖的。

原文

19:54

Geek@geekbb

精选

一个轻量Python脚本让Codex CLI反复回答同一道糖果数学题，用于对比不同模型的表现。脚本可调整reasoning effort参数并观察效果。代码开源于GitHub，便于复现和扩展。

技巧 Codex CLI reasoning effort Python脚本糖果数学题推理测试

推荐理由：想测不同模型对同一道题的推理差别？用这个脚本跑糖果题，还能调reasoning effort，很直观。

原文

19:39

Genspark@genspark_ai

ADK Marketing Solutions 最初只把 AI 当高级搜索引擎用。借助 Genspark，他们将 AI 嵌入研究、演示、会议和跟进流程。两年内，公司整体生产力飙升 250%。这一案例来自华尔街日报的报道，展示了深度集成 AI 工作流的效果。

AI产品 Genspark ADK Marketing Solutions 企业AI应用工作流集成生产力提升

推荐理由：别再把 AI 当搜索了，看看 ADK 怎么用 Genspark 把生产力翻了 2.5 倍，直接嵌入每个环节。

原文

18:57

shao__meng@shao__meng

火山引擎发布53页ArkClaw安全白皮书，将AI Agent安全归纳为三层问题：OpenClaw原生风险、云SaaS通用风险和企业治理新痛点。白皮书详细列出OpenClaw六大原生风险，包括Gateway/CDP绑定0.0.0.0、外部内容操纵LLM污染HEARTBEAT.md等。还提出安全责任共担模型、七项架构设计原则和四层安全保障体系。最后给出三个企业最佳实践模块：统一鉴权网关、网络边界管控、持续安全运营。

论文 ArkClaw 火山引擎 Agent安全安全白皮书原生风险

推荐理由：火山引擎发了份53页的安全白皮书，把AI Agent安全拆成三层六风险，还有架构原则和最佳实践，搞企业级Agent安全必读。

原文

18:15

shao__meng@shao__meng

73°

Anthropic指控阿里巴巴通过近25000个虚假账户大规模获取其Claude模型能力进行蒸馏。这一数字超过Anthropic此前指控DeepSeek、MiniMax和Kimi的数量总和。事件凸显了AI模型API被滥用于竞争对手蒸馏的风险。

行业 Anthropic Claude Alibaba 千问蒸馏

推荐理由：朋友，Anthropic说阿里用了2.5万个假账号偷偷薅Claude的羊毛，比之前告DeepSeek他们加一起还多，这操作挺猛。

原文

17:56

Anton Osika@antonosika

一家巴西初创公司完全基于Lovable平台构建和运营，在不到一年内达到了1800万美元的年运行率。该公司通过AI帮助其他企业加速业务流程。Lovable是一个无代码AI应用构建平台，这个案例展示了其快速商业化的能力。

AI产品 Lovable 巴西无代码AI开发

推荐理由：巴西一家公司全靠Lovable做产品，一年就做到1800万美金年收入，太猛了。

原文

17:28

berryxia@berryxia

这篇帖子介绍了构建AI智能体的6个核心架构支柱和1个人机协同机制。MCP由Anthropic提出，作为通用标准让智能体即插即用外部工具。智能体循环包括感知→思考→行动→观察→重复的流程。单体与多智能体架构两种模式可灵活选择。智能体驱动的RAG动态路由查询并验证上下文。人机协同机制（HITL）在关键操作前插入人工检查点。

技巧 MCP Anthropic 智能体智能体循环 RAG

推荐理由：想搭AI智能体但怕底层理论？这篇用7个点讲透架构，从MCP到记忆系统，普通开发者也能快速落地。

原文

17:27

Stanford AI Lab@StanfordAILab

精选

Stanford AI Lab发布OpenThoughts-Agent-v2和OpenThinkerAgent-32B，两者均基于Qwen-3开源数据。在计算控制比较中，该模型在全部训练规模下领先，并在7个agent基准测试上平均得分44.8%。模型在终端使用和编码任务上表现突出，且泛化能力强。

AI模型 OpenThoughts-Agent-v2 Qwen-3 Stanford AI Lab 开源模型智能体

推荐理由：斯坦福开源了新agent模型，基于Qwen-3在7个基准上平均44.8%，小模型也能打，值得一试。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。