全部 AI 动态 · AI 热点

AITOP

6月26日

03:05

Ate-a-Pi@svpino

新服务号称是 OpenClaw 的直接竞品，为用户提供一台 24/7 运行的专用云机器。该云代理内置浏览器访问和代码执行能力，可在本地电脑关闭时仍持续工作。它让远程用户无需配置即可完成本地同样的一切操作。

AI产品 OpenClaw 云端代理智能体远程执行

推荐理由：有人做了个 24 小时不关机的云代理，能跑浏览器和代码，出差也不用担心工作站关机了。

原文

03:04

Ate-a-Pi@svpino

作者认为，打造最强基础模型的公司未必也能做出最好的上层产品。他以AWS、Azure和GCP为例，指出最成功的云服务产品来自那些只专注核心产品的公司。在AI领域，真正的竞争优势来自不锁定单一模型并注重细节的企业。客户最终会选择那些'即开即用'的应用。

行业基础模型 AI产品行业观点云计算企业战略

推荐理由：基础模型强不等于产品强，别只盯着模型，多想想怎么让用户用得爽。

原文

03:03

Weaviate@weaviate_io

精选76°

Weaviate 1.38 正式发布，带来 HFresh（GA）磁盘向量索引，支持十亿级动态数据、低内存与可预测延迟，无需定期重建。MCP Server（GA）可让 LLM、IDE 和 AI 代理直接连接 Weaviate，并支持运行时开关写入权限。异步复制重构为单调度器集群执行，默认开启。Boost API（预览）允许查询时轻量调整结果排序，嵌套对象过滤（预览）支持 "cars.make" 路径过滤。此外新增 replica 迁移、服务端用量护栏、text2vec-digitalocean 模块等功能。

AI产品 Weaviate 向量数据库 MCP/工具开源产品版本更新

推荐理由：Weaviate 发新版本啦，HFresh 索引和大模型连接插件 MCP Server 都转正了，十亿级数据不用重建，还能运行时开关 MCP 写入，运维省心很多。

原文

03:02

腾讯混元 Tencent Hunyuan@TencentCloud

腾讯云 EdgeOne Makers 在 Product Hunt 上获得当日热门第一名。该平台允许用户像构建网页一样快速构建和部署 AI Agent，提供 3200+ 个全球边缘节点和 19 个模板，支持零厂商锁定。主打全球化部署、安全性和开发效率。

AI产品 Tencent EdgeOne Product Hunt EdgeOne Makers 腾讯云智能体

推荐理由：腾讯云新出 EdgeOne Makers，一键把 AI Agent 部署到全球 3200+ 节点，有 19 个模板起步，还零锁定，搞 Agent 的值得去看看。

原文

03:00

Allen AI (Ai2)@allen_ai

精选

Allen AI 发布了 Olmo 3（纯 Transformer）与 Olmo Hybrid（Transformer-RNN 混合）的对比研究。Hybrid 模型在长序列任务中展示了更高效的 token 处理，性能提升约15%。该研究揭示了混合架构在减少计算复杂度的同时保持了与 Transformer 相当的准确率。具体基准上，Hybrid 模型在 Long Range Arena 任务中得分高于 Olmo 3 约 8%。

AI模型 Olmo Allen AI 混合模型 Transformer-RNN 长序列

推荐理由：Allen AI 拿自家 Olmo 3 和 Hybrid 版做了实测对比，看混合模型到底比纯 Transformer 好在哪，结果挺有意思。

原文

02:58

Gary Marcus@GaryMarcus

Anthropic工程师在一场40分钟工作坊中展示了如何利用循环（loops）构建可运行数天的AI智能体。他们透露，Anthropic内部30%以上的代码已由循环编写，这极大加快了交付速度。工作坊拆解了智能体循环、工具调用、记忆管理和子智能体等核心组件。该方法被视为神经符号AI的典型应用，在持久任务执行上明显优于传统无循环生成式方法。

技巧 Anthropic 智能体 Agent循环工作流代码生成

推荐理由：Anthropic工程师手把手教你用循环搭建能跑好几天的智能体，内部30%代码都这么写，比大部分500美元的vibe编程课实在。

原文

02:57

Gary Marcus@GaryMarcus

神经符号代理（以Codex为例）的任务表现显著优于纯聊天机器人。Ethan Mollick引用的数据以OpenAI为风向标，展示了技术发展方向。聊天机器人时代已经结束，基于代理的系统正向工程以外的任务扩展。技能有望成为企业标准化AI使用的工具。

AI模型 Codex OpenAI 智能体神经符号

推荐理由：Codex这类神经符号代理比纯聊天机器人强得多，Ethan Mollick用OpenAI数据说明代理系统即将全面铺开，搞AI的不妨看看。

原文

02:56

AK@_akhaliq

开发者使用GLM 5.2模型在hf-claude环境下，为9B参数的Ornith-1.0-9B模型搭建了一个Gradio服务器应用。该推文获得3条回复和3197次浏览。应用通过Gradio界面提供交互式推理，可直接测试模型的文本生成能力。代码可能开源，用户可自行部署。

技巧 GLM 5.2 hf-claude Ornith-1.0-9B Gradio 模型部署

推荐理由：有人用GLM 5.2和hf-claude给Ornith-1.0-9B做了个Gradio界面，直接就能上手试，省了写前端代码的功夫。

原文

02:55

Replit@Replit

Replit 宣布其 Agent 现在支持超过 450 种集成，覆盖支付、消息、数据、CRM、设计工具和分析等类别。用户只需描述需求，Agent 即可自动配置连接，无需手动设置。该更新大幅扩展了 Replit 作为 AI 编程平台的应用场景。

AI产品 Replit Agent 集成编程助手

推荐理由：Replit Agent 能帮你自动连上支付、发消息、查数据等 450 多个工具，说句话就行，省去手动配置的麻烦。

原文

02:46

OpenRouter@OpenRouterAI

精选

OpenRouter 正式推出官方 MCP 服务，让 AI 代理能实时查询模型定价、基准成绩和流行度数据。该服务可避免代理在代码中硬编码错误的模型 slug。视频演示显示代理能够动态选择模型、获取价格并测试性能。这使代理不再依赖六个月前的训练数据猜测模型选择。

AI产品 OpenRouter MCP 模型定价基准测试代理工具

推荐理由：OpenRouter 出了个 MCP，你的代理能实时查模型价格和排名，再也不怕写错模型名了。

原文

02:45

a16z@a16z

11x的AI销售代理（revenue agents）已为其客户产生了数亿美元的销售管道（pipeline）。a16z与CEO Prabhav Jain访谈，详细披露了11x内部使用的全套AI代理栈，这些内部代理帮助公司高效运作，从而将更多时间用于为客户构建代理。内部AI栈包括多个专门化代理，覆盖销售、运营等环节，实现了自动化流程。

行业 11x AI代理销售管道企业AI a16z

推荐理由：11x用AI代理帮客户赚了数亿美元，还把自己内部的AI运营栈公开了。想看看企业怎么用AI跑销售管道的，这篇访谈别错过。

原文

02:36

Epoch AI@EpochAIResearch

EpochAIResearch团队爬取了六家中国主要AI公司的1600多份招聘信息，分析其战略方向。研究涉及百度、阿里巴巴、腾讯、华为、字节跳动和DeepSeek等企业。数据显示这些公司正加大在AI基础设施、基础模型和行业应用方面的投入。招聘职位集中在算法、工程和产品领域，反映出对全栈AI人才的争夺。

行业 EpochAIResearch 中国AI公司招聘信息行业分析人才竞争

推荐理由：EpochAIResearch用1600+招聘信息扒出中国六大AI公司的真实布局，不看报告不知道他们在抢什么人。

原文

02:25

Paul Graham@paulg

Paul Graham 在 X 平台发帖，将不使用LLM写作类比为有汽车和起重机却选择跑步和举重。该推文获得214次点赞、21次转发和36次引用。他认为逃避LLM写作是个人选择而非落后，这一类比引发关于AI写作工具的讨论。

行业 Paul Graham LLM AI写作观点

推荐理由：Paul Graham 用一个跑步举重的比喻，解释了为什么有人不用AI写作不是傻，而是个人选择。挺有意思的观点。

原文

02:24

Paul Graham@paulg

Paul Graham在推文中表示，未来不依赖LLM（如GPT-4o）写作将是不常见的选择，但不会是古怪的异类，而是所有关注思维质量的人会做的事。Joe Weisenthal回复称，这种做法将类似于在新城市拒绝用Google Maps导航——对绝大多数人而言完全不可理解。这条讨论聚焦LLM对写作和思考习惯的长期影响。

行业 Paul Graham LLM 写作 AI写作思考习惯

推荐理由：Paul Graham聊LLM写作潮流，说不用反而可能才是聪明人，和Google Maps类比很有意思。

原文

02:18

Fireworks AI@FireworksAI_HQ

Fireworks与Faros_AI联合对211个真实软件工程任务进行了评估。Claude Code搭配GLM-5.2的Judge得分0.568，每任务耗时321秒，成本0.92美元。对比组Claude Code + Opus 4.8得分为0.521、耗时775秒、成本1.76美元；Codex + GPT-5.5得分为0.466、耗时392秒、成本2.06美元。评测基于Faros自有代码库而非公开基准，更贴近实际开发场景。

AI模型 GLM-5.2 Claude Code Opus 4.8 GPT-5.5 编程助手

推荐理由：Fireworks和Faros拿真实工程任务实测GLM-5.2，结果比Opus 4.8和GPT-5.5都更便宜更快，得分还高。想为代码任务选模型可以看看这个。

原文

02:16

vLLM@vllm_project

精选

vLLM 宣布 Day-0 支持 Liquid AI 的 LFM2.5-230M 小模型。该模型仅 230M 参数，预训练于 19T tokens 且支持 32K 上下文。专为手机、机器人、家庭自动化和网络设备上的 agent 任务设计。可运行于 CPU、NPU 和 GPU 等硬件。

AI模型 LFM2.5-230M vLLM Liquid AI 智能体轻量模型

推荐理由：vLLM 第一时间给 Liquid AI 的 LFM2.5 小模型做了适配，230M 参数跑 agent 任务，手机、机器人上都能用。

原文

01:57

Google DeepMind@GoogleDeepMind

74°

Google DeepMind 宣布 Gemini 3.5 Flash 新增原生计算机使用能力。开发者可利用该内置工具构建能跨浏览器、移动端和桌面界面观察并执行操作的定制智能体。该功能无需额外适配即可直接操控 GUI 元素。

AI模型 Gemini 3.5 Flash Google DeepMind 智能体计算机使用

推荐理由：DeepMind 给 Gemini 3.5 Flash 加了个内置计算机操作工具，开发者能直接让模型看屏幕、点按钮，跨浏览器和桌面都行。

原文

01:51

Harrison Chase@hwchase17

精选73°

LangChain团队发布技术博客，详细介绍SmithDB的构建与运行。SmithDB是一个专门为agent traces设计的数据库，其所有持久数据存储在对象存储中。博客阐述了如何在这种存储上构建、压缩和查询全文搜索索引，并处理每个GET请求50–100ms的延迟。团队分享了在生产环境中运行SmithDB倒排索引（inverted index）的经验。

技巧 SmithDB LangChain 智能体追踪全文搜索数据库

推荐理由：LangChain团队手把手教你如何为agent traces造一个数据库，对象存储上做全文搜索还能压到50-100ms延迟，干货满满。

原文

01:48

Microsoft Research@MSFTResearch

微软研究人员提出一种名为generative causal testing的方法，将黑盒语言模型转化为清晰假设，并通过fMRI脑部扫描进行验证。实验揭示了特定脑区对语言特征（如词义、句法）的响应模式，例如左侧颞叶对语义角色的敏感度。该方法在多个基准测试中优于传统解释性技术，为理解神经语言处理提供了新途径。

论文 generative causal testing 微软研究可解释性语言理解

推荐理由：微软研究搞了个新招，把黑盒模型怎么处理语言变成可以验证的假设，还真的用脑扫描去测，看哪些脑区在干活，挺有意思。

原文

01:46

GitHub@github

GitHub 为 Copilot CLI 推出 LSP Setup 技能，支持在终端中查询跨14种编程语言的语义上下文。该技能可获取定义、引用、类型等代码信息，无需离开命令行。用户可通过安装最新版 GitHub CLI 并运行 copilot-lsp-setup 命令启用。目前在 8591 次浏览的推文中获得 24 个点赞。

AI产品 GitHub Copilot CLI 编程助手代码智能语义理解

推荐理由：终端党福音，GitHub Copilot CLI现在能像IDE一样查定义和引用，14种语言全支持，快试试。

原文

01:46

ElevenLabs@elevenlabsio

76°

ElevenLabs与Google DeepMind合作，将SynthID数字水印嵌入其生成的音频中。该水印人耳不可听，但可通过ElevenLabs Audio Detector检测。该检测器免费开放，用于识别AI生成的音频内容。此举针对日益逼真的AI语音，提升内容可追溯性。

AI产品 ElevenLabs Google DeepMind SynthID AI检测数字水印

推荐理由：ElevenLabs和DeepMind联手给AI音频打水印，还出了免费检测器，防伪利器，值得试试。

原文

01:39

elvis@omarsar0

OpenRouter 发布了 MCP（模型上下文协议）功能，允许智能体在运行时基于实时智能动态选择、定价和测试模型。该功能解决了智能体依赖6个月前的训练数据猜测模型的问题。开发者可以用它运行长时间运行的智能体，并自动选择最合适的模型。

AI产品 OpenRouter MCP 智能体模型选择开发者工具

推荐理由：OpenRouter 出了个新工具，让你的智能体自己挑模型、比价格、做测试，不用再拿半年前的旧数据瞎猜了。

原文

01:37

Greg Brockman@gdb

OpenAI内部数据显示，公司各部门正在广泛使用Codex代理工具。这些代理工具使员工能够处理更复杂、运行时间更长且跨职能的工作任务。OpenAI认为，随着这些工具能力提升，它们可能重塑未来工作方式。

AI产品 OpenAI Codex 智能体编程助手

推荐理由：OpenAI自己爆料，他们内部用Codex搞定了更复杂的跨部门工作，数据真实，值得看看。

原文

01:33

OpenAI@OpenAI

76°

OpenAI官方透露，公司内部所有部门正在使用Codex Agent完成更复杂、更长周期、跨职能的工作。Codex Agent能够处理多步骤任务，提升自动化程度。这展示了代理工具在组织内实际落地的早期案例。

行业 OpenAI Codex Agent 智能体自动化工作流

推荐理由：看看OpenAI自家怎么用Agent的，Codex在财务、工程、运营各部门跑起来了，不是空谈。

原文

01:31

AK@_akhaliq

DomainShuttle是一个开放域主题驱动的文本生成视频模型，允许用户通过自然语言描述控制视频内容。该模型能够根据文本提示生成包含特定主题的视频片段，无需对每个主题进行单独训练。与现有方法相比，DomainShuttle在主题保真度和视频质量上表现更优，支持更灵活的自由形式主题控制。

AI模型 DomainShuttle 文生视频开放域主题驱动生成

推荐理由：想快速生成特定主题的视频素材？DomainShuttle 的开放域能力让你不需要训练就能直接用文字生成视频，很方便。

原文

01:27

Anthropic@AnthropicAI

Anthropic宣布作为创始合作伙伴加入RAISE US非营利联盟。RAISE US由前美国商务部长Gina Raimondo和印第安纳州前州长Eric Holcomb共同主持。该联盟通过雇主主导的行动、AI赋能培训和政策创新，帮助美国工人适应向变革性AI的过渡。Anthropic是首家加入该联盟的AI公司，致力于建立AI时代的"人民战略"。

行业 Anthropic RAISE US AI劳动力培训 AI政策

推荐理由：Anthropic 跟政府和企业一起搞了个联盟，专门帮工人学 AI 技能、应对工作变化，不是卖模型而是搞人才培养。

原文

01:26

LangChain@LangChainAI

LangChain 团队解决了在对象存储中构建全文搜索索引的挑战：每个 GET 请求耗时 50-100ms，且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案，涉及批量写入、压缩策略以减少请求次数，以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。

技巧 LangChain SmithDB 全文搜索对象存储倒排索引

推荐理由：LangChain 分享了怎么在对象存储上搞全文搜索，延迟 50-100ms 的情况下还能压出来倒排索引，挺实在的实战经验。

原文

01:24

lmarena.ai@lmarena_ai

精选

Zai_org的GLM系列在Code Arena: Frontend基准上持续增长，GLM-4.6得分1408，GLM-5.2 (Max)达到1595，超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型，在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。

AI模型 GLM Zai_org Code Arena 前端编码开源模型

推荐理由：Zai_org的GLM-5.2开源模型在前端编码上超过了Opus，离领先的Claude Fable只差一点，值得试试

原文

01:15

Hugging Face@huggingface

Hugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程，无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。

技巧 Hugging Face 开源模型本地部署推理

推荐理由：想自己跑开源模型？Hugging Face 这场直播手把手教你在本地部署，省去云端费用和延迟。

原文

01:08

Paul Graham@paulg

Rippling 推出 Data Cloud，这是一个从头重建的现代数据堆栈，深度集成 AI。它围绕组织和员工数据构建，旨在帮助企业高效管理 token 消耗并减少 AI 无效输出。Rippling 创始人 Parker Conrad 表示该产品可解决 token burn 和 AI slop 问题。

AI产品 Rippling Data Cloud 企业数据 AI集成

推荐理由：Paul Graham 说 Rippling 十年后还在推出大更新。新 Data Cloud 把 AI 直接嵌入企业数据层，适合需要稳定又前沿方案的买家。

原文

01:04

Figma@figma

Figma 发布了 MCP connectors，让 Figma agent 能够连接外部工具与服务。该功能基于 Model Context Protocol（MCP）标准，目前处于早期阶段。用户可通过简单的配置让 agent 调用 Slack、Notion 等工具，扩展设计工作流。Figma 表示后续将开放更多连接器选项。

AI产品 Figma MCP 设计工具智能体

推荐理由：Figma 出了 MCP 连接器，让设计 agent 能直接调用 Slack、Notion，工作流更顺了。

原文

01:03

a16z@a16z

Netris完成由a16z领投的1500万美元Series A融资，该公司专注于为GPU集群提供网络自动化与多租户管理。其软件已在价值近10亿美元的数据中心运行，历经8年积累。过去12个月，Netris的ARR增长800%，部署超过35个AI集群，超过其他网络自动化供应商的总和。公司已与NVIDIA、HPE等合作，为AI基础设施解决East-West、OOB等复杂网络配置难题。

行业 Netris a16z GPU集群网络自动化数据中心

推荐理由：a16z领投的1500万美元融资，Netris专治GPU集群网络管理的难题，ARR一年涨8倍，部署量超对手总和，值得关注。

原文

01:02

AK@_akhaliq

一条关于智能体原生内存系统的推文在X上获得3166次浏览和13个点赞。讨论聚焦于AI代理是否需要专属的记忆架构来提升自主性。作者质疑现有技术是否已为这种系统做好准备。暂无具体模型或基准数据支撑。

行业智能体内存系统 AI架构长期记忆

推荐理由：有人在聊智能体要不要有自己的记忆系统，思路挺新鲜的，点开看看讨论。

原文

00:57

Philipp Schmid@_philschmid

Google 在 Gemini 3.5 Flash 中上线了 computer use 功能，支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程，用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环，通过 adb 接口控制手机，也支持远程设备连接（adb connect <ip>:5555）。类似模式可扩展到 iOS 的 simctl。

技巧 Gemini 3.5 Flash Google Android adb 智能体

推荐理由：Google 刚给 Gemini 3.5 Flash 加了 computer use，这份教程用一条命令就能在模拟器上跑 agent 控制手机，还支持远程和 iOS，很实用。

原文

00:53

@koltregaskes@koltregaskes

76°

Google在AI Studio中发现了Gemini Omni Flash的预览版公告，将支持最高4k分辨率、60秒长度的输出。60秒时长是视频生成领域的重要指标。该预览版预计为用户提供更强的视频生成能力。

AI产品 Gemini Omni Flash Google AI Studio 视频生成 4k 60秒输出

推荐理由：谷歌要在AI Studio上线Gemini Omni Flash预览版，能生成4k分辨率、60秒的视频，视频长度很顶。

原文

00:36

Milvus@milvusio

精选

单个1-5分的RAG质量评分会隐藏严重问题：一个回答90%基于文档，但10%虚构核心参数就不可用，平均分仍显示4分。幻觉分布也不均匀，数值查找或多条件问题类型的幻觉率远高于平均，不按类型分桶就看不到偏差。优化答案相关性时，添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识，降低忠实度。更可靠的方法是声明级评估：将回答拆成原子事实，用NLI模型检查每个声明是否被检索内容支撑，计算接地率，并对关键参数设置硬性阻断。按问题类型分桶评分，Milvus可用标量字段直接过滤分析，不依赖额外报表管线。

技巧 RAG Milvus 评估幻觉声明级评估

推荐理由：如果你在用RAG做生产系统，这篇讲透了为什么平均分不靠谱，还给了按声明颗粒度和问题类型精准监测的方法，连Milvus怎么分桶都说了，很实用。

原文

00:30

Google AI Developers@googleaidevs

精选73°

Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体，处理长时任务。新增特性包括：内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。

AI产品 Gemini 3.5 Flash Computer Use 智能体自动化测试 Google

推荐理由：Google 给 Gemini 3.5 Flash 加了 Computer Use 工具，能让智能体跨浏览器、手机和桌面干活，还能自定义安全策略，实用！

原文

00:26

shao__meng@shao__meng

SuperNori 是一款针对家庭照料者的 Proactive Family AI Agent，能主动监测堵车、冰箱库存、孩子学习进度、纪念日等事件。用户无需手动操作，AI 会在合适时机询问是否处理。该项目已开放候补名单，目标减轻家庭中总在照顾他人的那个人的负担。

AI产品 SuperNori 家庭AI 智能体主动提醒

推荐理由：家里总是你操心？SuperNori 这个 AI 代理会主动提醒你堵车、冰箱空了、孩子学什么，不用你一个个记，试试看。

原文

00:24

Firecrawl@firecrawl_dev

Firecrawl MCP 发布新功能，文档解析速度提升5倍。支持PDF、电子表格和文档，可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器，无需API密钥即可在免费层试用。

AI产品 Firecrawl MCP 文档解析智能体 PDF

推荐理由：Firecrawl MCP 现在解析文档快了5倍，免费就能用，让你的智能体直接读PDF和表格。

原文

00:01

Geek@geekbb

Nyaterm是一个基于Tauri、React和Rust构建的现代远程终端工作台，集成了SSH、本地终端、Telnet、串口、SFTP、隧道、OTP、AI辅助和加密同步等功能。该项目由nyakang在GitHub上开源，适用于需要统一管理多种远程连接方式的用户。它提供了一个跨平台的图形界面，支持多种协议和高级功能。

AI产品 Tauri React Rust Nyaterm 远程终端

推荐理由：Nyaterm把SSH、串口、SFTP、AI辅助全整合到一个界面上，用Tauri/React/Rust做的，开源免费，适合运维和开发者。

原文

仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档（侧边栏 → AI 日报 → 顶部「往期日报」）。