03:05Ate-a-Pi@svpino新服务号称是 OpenClaw 的直接竞品,为用户提供一台 24/7 运行的专用云机器。该云代理内置浏览器访问和代码执行能力,可在本地电脑关闭时仍持续工作。它让远程用户无需配置即可完成本地同样的一切操作。AI产品OpenClaw云端代理智能体远程执行2 个信源在谈推荐理由:有人做了个 24 小时不关机的云代理,能跑浏览器和代码,出差也不用担心工作站关机了。原文
03:04Ate-a-Pi@svpino作者认为,打造最强基础模型的公司未必也能做出最好的上层产品。他以AWS、Azure和GCP为例,指出最成功的云服务产品来自那些只专注核心产品的公司。在AI领域,真正的竞争优势来自不锁定单一模型并注重细节的企业。客户最终会选择那些'即开即用'的应用。行业基础模型AI产品行业观点云计算企业战略推荐理由:基础模型强不等于产品强,别只盯着模型,多想想怎么让用户用得爽。原文
03:03Weaviate@weaviate_io精选76°Weaviate 1.38 正式发布,带来 HFresh(GA)磁盘向量索引,支持十亿级动态数据、低内存与可预测延迟,无需定期重建。MCP Server(GA)可让 LLM、IDE 和 AI 代理直接连接 Weaviate,并支持运行时开关写入权限。异步复制重构为单调度器集群执行,默认开启。Boost API(预览)允许查询时轻量调整结果排序,嵌套对象过滤(预览)支持 "cars.make" 路径过滤。此外新增 replica 迁移、服务端用量护栏、text2vec-digitalocean 模块等功能。AI产品Weaviate向量数据库MCP/工具开源产品版本更新推荐理由:Weaviate 发新版本啦,HFresh 索引和大模型连接插件 MCP Server 都转正了,十亿级数据不用重建,还能运行时开关 MCP 写入,运维省心很多。原文
03:02腾讯混元 Tencent Hunyuan@TencentCloud腾讯云 EdgeOne Makers 在 Product Hunt 上获得当日热门第一名。该平台允许用户像构建网页一样快速构建和部署 AI Agent,提供 3200+ 个全球边缘节点和 19 个模板,支持零厂商锁定。主打全球化部署、安全性和开发效率。AI产品Tencent EdgeOneProduct HuntEdgeOne Makers腾讯云智能体推荐理由:腾讯云新出 EdgeOne Makers,一键把 AI Agent 部署到全球 3200+ 节点,有 19 个模板起步,还零锁定,搞 Agent 的值得去看看。原文
03:00Allen AI (Ai2)@allen_ai精选Allen AI 发布了 Olmo 3(纯 Transformer)与 Olmo Hybrid(Transformer-RNN 混合)的对比研究。Hybrid 模型在长序列任务中展示了更高效的 token 处理,性能提升约15%。该研究揭示了混合架构在减少计算复杂度的同时保持了与 Transformer 相当的准确率。具体基准上,Hybrid 模型在 Long Range Arena 任务中得分高于 Olmo 3 约 8%。AI模型OlmoAllen AI混合模型Transformer-RNN长序列推荐理由:Allen AI 拿自家 Olmo 3 和 Hybrid 版做了实测对比,看混合模型到底比纯 Transformer 好在哪,结果挺有意思。原文
02:58Gary Marcus@GaryMarcusAnthropic工程师在一场40分钟工作坊中展示了如何利用循环(loops)构建可运行数天的AI智能体。他们透露,Anthropic内部30%以上的代码已由循环编写,这极大加快了交付速度。工作坊拆解了智能体循环、工具调用、记忆管理和子智能体等核心组件。该方法被视为神经符号AI的典型应用,在持久任务执行上明显优于传统无循环生成式方法。技巧Anthropic智能体Agent循环工作流代码生成10 个信源在谈推荐理由:Anthropic工程师手把手教你用循环搭建能跑好几天的智能体,内部30%代码都这么写,比大部分500美元的vibe编程课实在。原文
02:57Gary Marcus@GaryMarcus神经符号代理(以Codex为例)的任务表现显著优于纯聊天机器人。Ethan Mollick引用的数据以OpenAI为风向标,展示了技术发展方向。聊天机器人时代已经结束,基于代理的系统正向工程以外的任务扩展。技能有望成为企业标准化AI使用的工具。AI模型CodexOpenAI智能体神经符号10 个信源在谈推荐理由:Codex这类神经符号代理比纯聊天机器人强得多,Ethan Mollick用OpenAI数据说明代理系统即将全面铺开,搞AI的不妨看看。原文
02:56AK@_akhaliq开发者使用GLM 5.2模型在hf-claude环境下,为9B参数的Ornith-1.0-9B模型搭建了一个Gradio服务器应用。该推文获得3条回复和3197次浏览。应用通过Gradio界面提供交互式推理,可直接测试模型的文本生成能力。代码可能开源,用户可自行部署。技巧GLM 5.2hf-claudeOrnith-1.0-9BGradio模型部署推荐理由:有人用GLM 5.2和hf-claude给Ornith-1.0-9B做了个Gradio界面,直接就能上手试,省了写前端代码的功夫。原文
02:55Replit@ReplitReplit 宣布其 Agent 现在支持超过 450 种集成,覆盖支付、消息、数据、CRM、设计工具和分析等类别。用户只需描述需求,Agent 即可自动配置连接,无需手动设置。该更新大幅扩展了 Replit 作为 AI 编程平台的应用场景。AI产品ReplitAgent集成编程助手推荐理由:Replit Agent 能帮你自动连上支付、发消息、查数据等 450 多个工具,说句话就行,省去手动配置的麻烦。原文
02:46OpenRouter@OpenRouterAI精选OpenRouter 正式推出官方 MCP 服务,让 AI 代理能实时查询模型定价、基准成绩和流行度数据。该服务可避免代理在代码中硬编码错误的模型 slug。视频演示显示代理能够动态选择模型、获取价格并测试性能。这使代理不再依赖六个月前的训练数据猜测模型选择。AI产品OpenRouterMCP模型定价基准测试代理工具推荐理由:OpenRouter 出了个 MCP,你的代理能实时查模型价格和排名,再也不怕写错模型名了。原文
02:45a16z@a16z11x的AI销售代理(revenue agents)已为其客户产生了数亿美元的销售管道(pipeline)。a16z与CEO Prabhav Jain访谈,详细披露了11x内部使用的全套AI代理栈,这些内部代理帮助公司高效运作,从而将更多时间用于为客户构建代理。内部AI栈包括多个专门化代理,覆盖销售、运营等环节,实现了自动化流程。行业11xAI代理销售管道企业AIa16z推荐理由:11x用AI代理帮客户赚了数亿美元,还把自己内部的AI运营栈公开了。想看看企业怎么用AI跑销售管道的,这篇访谈别错过。原文
02:36Epoch AI@EpochAIResearchEpochAIResearch团队爬取了六家中国主要AI公司的1600多份招聘信息,分析其战略方向。研究涉及百度、阿里巴巴、腾讯、华为、字节跳动和DeepSeek等企业。数据显示这些公司正加大在AI基础设施、基础模型和行业应用方面的投入。招聘职位集中在算法、工程和产品领域,反映出对全栈AI人才的争夺。行业EpochAIResearch中国AI公司招聘信息行业分析人才竞争推荐理由:EpochAIResearch用1600+招聘信息扒出中国六大AI公司的真实布局,不看报告不知道他们在抢什么人。原文
02:25Paul Graham@paulgPaul Graham 在 X 平台发帖,将不使用LLM写作类比为有汽车和起重机却选择跑步和举重。该推文获得214次点赞、21次转发和36次引用。他认为逃避LLM写作是个人选择而非落后,这一类比引发关于AI写作工具的讨论。行业Paul GrahamLLMAI写作观点推荐理由:Paul Graham 用一个跑步举重的比喻,解释了为什么有人不用AI写作不是傻,而是个人选择。挺有意思的观点。原文
02:24Paul Graham@paulgPaul Graham在推文中表示,未来不依赖LLM(如GPT-4o)写作将是不常见的选择,但不会是古怪的异类,而是所有关注思维质量的人会做的事。Joe Weisenthal回复称,这种做法将类似于在新城市拒绝用Google Maps导航——对绝大多数人而言完全不可理解。这条讨论聚焦LLM对写作和思考习惯的长期影响。行业Paul GrahamLLM写作AI写作思考习惯推荐理由:Paul Graham聊LLM写作潮流,说不用反而可能才是聪明人,和Google Maps类比很有意思。原文
02:18Fireworks AI@FireworksAI_HQFireworks与Faros_AI联合对211个真实软件工程任务进行了评估。Claude Code搭配GLM-5.2的Judge得分0.568,每任务耗时321秒,成本0.92美元。对比组Claude Code + Opus 4.8得分为0.521、耗时775秒、成本1.76美元;Codex + GPT-5.5得分为0.466、耗时392秒、成本2.06美元。评测基于Faros自有代码库而非公开基准,更贴近实际开发场景。AI模型GLM-5.2Claude CodeOpus 4.8GPT-5.5编程助手推荐理由:Fireworks和Faros拿真实工程任务实测GLM-5.2,结果比Opus 4.8和GPT-5.5都更便宜更快,得分还高。想为代码任务选模型可以看看这个。原文
02:16vLLM@vllm_project精选vLLM 宣布 Day-0 支持 Liquid AI 的 LFM2.5-230M 小模型。该模型仅 230M 参数,预训练于 19T tokens 且支持 32K 上下文。专为手机、机器人、家庭自动化和网络设备上的 agent 任务设计。可运行于 CPU、NPU 和 GPU 等硬件。AI模型LFM2.5-230MvLLMLiquid AI智能体轻量模型推荐理由:vLLM 第一时间给 Liquid AI 的 LFM2.5 小模型做了适配,230M 参数跑 agent 任务,手机、机器人上都能用。原文
01:57Google DeepMind@GoogleDeepMind74°Google DeepMind 宣布 Gemini 3.5 Flash 新增原生计算机使用能力。开发者可利用该内置工具构建能跨浏览器、移动端和桌面界面观察并执行操作的定制智能体。该功能无需额外适配即可直接操控 GUI 元素。AI模型Gemini 3.5 FlashGoogle DeepMind智能体计算机使用推荐理由:DeepMind 给 Gemini 3.5 Flash 加了个内置计算机操作工具,开发者能直接让模型看屏幕、点按钮,跨浏览器和桌面都行。原文
01:51Harrison Chase@hwchase17精选73°LangChain团队发布技术博客,详细介绍SmithDB的构建与运行。SmithDB是一个专门为agent traces设计的数据库,其所有持久数据存储在对象存储中。博客阐述了如何在这种存储上构建、压缩和查询全文搜索索引,并处理每个GET请求50–100ms的延迟。团队分享了在生产环境中运行SmithDB倒排索引(inverted index)的经验。技巧SmithDBLangChain智能体追踪全文搜索数据库推荐理由:LangChain团队手把手教你如何为agent traces造一个数据库,对象存储上做全文搜索还能压到50-100ms延迟,干货满满。原文
01:48Microsoft Research@MSFTResearch微软研究人员提出一种名为generative causal testing的方法,将黑盒语言模型转化为清晰假设,并通过fMRI脑部扫描进行验证。实验揭示了特定脑区对语言特征(如词义、句法)的响应模式,例如左侧颞叶对语义角色的敏感度。该方法在多个基准测试中优于传统解释性技术,为理解神经语言处理提供了新途径。论文generative causal testing微软研究可解释性语言理解推荐理由:微软研究搞了个新招,把黑盒模型怎么处理语言变成可以验证的假设,还真的用脑扫描去测,看哪些脑区在干活,挺有意思。原文
01:46GitHub@githubGitHub 为 Copilot CLI 推出 LSP Setup 技能,支持在终端中查询跨14种编程语言的语义上下文。该技能可获取定义、引用、类型等代码信息,无需离开命令行。用户可通过安装最新版 GitHub CLI 并运行 copilot-lsp-setup 命令启用。目前在 8591 次浏览的推文中获得 24 个点赞。AI产品GitHub CopilotCLI编程助手代码智能语义理解推荐理由:终端党福音,GitHub Copilot CLI现在能像IDE一样查定义和引用,14种语言全支持,快试试。原文
01:46ElevenLabs@elevenlabsio76°ElevenLabs与Google DeepMind合作,将SynthID数字水印嵌入其生成的音频中。该水印人耳不可听,但可通过ElevenLabs Audio Detector检测。该检测器免费开放,用于识别AI生成的音频内容。此举针对日益逼真的AI语音,提升内容可追溯性。AI产品ElevenLabsGoogle DeepMindSynthIDAI检测数字水印推荐理由:ElevenLabs和DeepMind联手给AI音频打水印,还出了免费检测器,防伪利器,值得试试。原文
01:39elvis@omarsar0OpenRouter 发布了 MCP(模型上下文协议)功能,允许智能体在运行时基于实时智能动态选择、定价和测试模型。该功能解决了智能体依赖6个月前的训练数据猜测模型的问题。开发者可以用它运行长时间运行的智能体,并自动选择最合适的模型。AI产品OpenRouterMCP智能体模型选择开发者工具推荐理由:OpenRouter 出了个新工具,让你的智能体自己挑模型、比价格、做测试,不用再拿半年前的旧数据瞎猜了。原文
01:37Greg Brockman@gdbOpenAI内部数据显示,公司各部门正在广泛使用Codex代理工具。这些代理工具使员工能够处理更复杂、运行时间更长且跨职能的工作任务。OpenAI认为,随着这些工具能力提升,它们可能重塑未来工作方式。AI产品OpenAICodex智能体编程助手10 个信源在谈推荐理由:OpenAI自己爆料,他们内部用Codex搞定了更复杂的跨部门工作,数据真实,值得看看。原文
01:33OpenAI@OpenAI76°OpenAI官方透露,公司内部所有部门正在使用Codex Agent完成更复杂、更长周期、跨职能的工作。Codex Agent能够处理多步骤任务,提升自动化程度。这展示了代理工具在组织内实际落地的早期案例。行业OpenAICodexAgent智能体自动化工作流10 个信源在谈推荐理由:看看OpenAI自家怎么用Agent的,Codex在财务、工程、运营各部门跑起来了,不是空谈。原文
01:31AK@_akhaliqDomainShuttle是一个开放域主题驱动的文本生成视频模型,允许用户通过自然语言描述控制视频内容。该模型能够根据文本提示生成包含特定主题的视频片段,无需对每个主题进行单独训练。与现有方法相比,DomainShuttle在主题保真度和视频质量上表现更优,支持更灵活的自由形式主题控制。AI模型DomainShuttle文生视频开放域主题驱动生成推荐理由:想快速生成特定主题的视频素材?DomainShuttle 的开放域能力让你不需要训练就能直接用文字生成视频,很方便。原文
01:27Anthropic@AnthropicAIAnthropic宣布作为创始合作伙伴加入RAISE US非营利联盟。RAISE US由前美国商务部长Gina Raimondo和印第安纳州前州长Eric Holcomb共同主持。该联盟通过雇主主导的行动、AI赋能培训和政策创新,帮助美国工人适应向变革性AI的过渡。Anthropic是首家加入该联盟的AI公司,致力于建立AI时代的"人民战略"。行业AnthropicRAISE USAI劳动力培训AI政策10 个信源在谈推荐理由:Anthropic 跟政府和企业一起搞了个联盟,专门帮工人学 AI 技能、应对工作变化,不是卖模型而是搞人才培养。原文
01:26LangChain@LangChainAILangChain 团队解决了在对象存储中构建全文搜索索引的挑战:每个 GET 请求耗时 50-100ms,且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案,涉及批量写入、压缩策略以减少请求次数,以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。技巧LangChainSmithDB全文搜索对象存储倒排索引推荐理由:LangChain 分享了怎么在对象存储上搞全文搜索,延迟 50-100ms 的情况下还能压出来倒排索引,挺实在的实战经验。原文
01:24lmarena.ai@lmarena_ai精选Zai_org的GLM系列在Code Arena: Frontend基准上持续增长,GLM-4.6得分1408,GLM-5.2 (Max)达到1595,超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型,在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。AI模型GLMZai_orgCode Arena前端编码开源模型推荐理由:Zai_org的GLM-5.2开源模型在前端编码上超过了Opus,离领先的Claude Fable只差一点,值得试试原文
01:15Hugging Face@huggingfaceHugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程,无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。技巧Hugging Face开源模型本地部署推理推荐理由:想自己跑开源模型?Hugging Face 这场直播手把手教你在本地部署,省去云端费用和延迟。原文
01:08Paul Graham@paulgRippling 推出 Data Cloud,这是一个从头重建的现代数据堆栈,深度集成 AI。它围绕组织和员工数据构建,旨在帮助企业高效管理 token 消耗并减少 AI 无效输出。Rippling 创始人 Parker Conrad 表示该产品可解决 token burn 和 AI slop 问题。AI产品RipplingData Cloud企业数据AI集成推荐理由:Paul Graham 说 Rippling 十年后还在推出大更新。新 Data Cloud 把 AI 直接嵌入企业数据层,适合需要稳定又前沿方案的买家。原文
01:04Figma@figmaFigma 发布了 MCP connectors,让 Figma agent 能够连接外部工具与服务。该功能基于 Model Context Protocol(MCP)标准,目前处于早期阶段。用户可通过简单的配置让 agent 调用 Slack、Notion 等工具,扩展设计工作流。Figma 表示后续将开放更多连接器选项。AI产品FigmaMCP设计工具智能体10 个信源在谈推荐理由:Figma 出了 MCP 连接器,让设计 agent 能直接调用 Slack、Notion,工作流更顺了。原文
01:03a16z@a16zNetris完成由a16z领投的1500万美元Series A融资,该公司专注于为GPU集群提供网络自动化与多租户管理。其软件已在价值近10亿美元的数据中心运行,历经8年积累。过去12个月,Netris的ARR增长800%,部署超过35个AI集群,超过其他网络自动化供应商的总和。公司已与NVIDIA、HPE等合作,为AI基础设施解决East-West、OOB等复杂网络配置难题。行业Netrisa16zGPU集群网络自动化数据中心5 个信源在谈推荐理由:a16z领投的1500万美元融资,Netris专治GPU集群网络管理的难题,ARR一年涨8倍,部署量超对手总和,值得关注。原文
01:02AK@_akhaliq一条关于智能体原生内存系统的推文在X上获得3166次浏览和13个点赞。讨论聚焦于AI代理是否需要专属的记忆架构来提升自主性。作者质疑现有技术是否已为这种系统做好准备。暂无具体模型或基准数据支撑。行业智能体内存系统AI架构长期记忆推荐理由:有人在聊智能体要不要有自己的记忆系统,思路挺新鲜的,点开看看讨论。原文
00:57Philipp Schmid@_philschmidGoogle 在 Gemini 3.5 Flash 中上线了 computer use 功能,支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程,用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环,通过 adb 接口控制手机,也支持远程设备连接(adb connect <ip>:5555)。类似模式可扩展到 iOS 的 simctl。技巧Gemini 3.5 FlashGoogleAndroidadb智能体推荐理由:Google 刚给 Gemini 3.5 Flash 加了 computer use,这份教程用一条命令就能在模拟器上跑 agent 控制手机,还支持远程和 iOS,很实用。原文
00:53@koltregaskes@koltregaskes76°Google在AI Studio中发现了Gemini Omni Flash的预览版公告,将支持最高4k分辨率、60秒长度的输出。60秒时长是视频生成领域的重要指标。该预览版预计为用户提供更强的视频生成能力。AI产品Gemini Omni FlashGoogle AI Studio视频生成4k60秒输出推荐理由:谷歌要在AI Studio上线Gemini Omni Flash预览版,能生成4k分辨率、60秒的视频,视频长度很顶。原文
00:36Milvus@milvusio精选单个1-5分的RAG质量评分会隐藏严重问题:一个回答90%基于文档,但10%虚构核心参数就不可用,平均分仍显示4分。幻觉分布也不均匀,数值查找或多条件问题类型的幻觉率远高于平均,不按类型分桶就看不到偏差。优化答案相关性时,添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识,降低忠实度。更可靠的方法是声明级评估:将回答拆成原子事实,用NLI模型检查每个声明是否被检索内容支撑,计算接地率,并对关键参数设置硬性阻断。按问题类型分桶评分,Milvus可用标量字段直接过滤分析,不依赖额外报表管线。技巧RAGMilvus评估幻觉声明级评估推荐理由:如果你在用RAG做生产系统,这篇讲透了为什么平均分不靠谱,还给了按声明颗粒度和问题类型精准监测的方法,连Milvus怎么分桶都说了,很实用。原文
00:30Google AI Developers@googleaidevs精选73°Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体,处理长时任务。新增特性包括:内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。AI产品Gemini 3.5 FlashComputer Use智能体自动化测试Google推荐理由:Google 给 Gemini 3.5 Flash 加了 Computer Use 工具,能让智能体跨浏览器、手机和桌面干活,还能自定义安全策略,实用!原文
00:26shao__meng@shao__mengSuperNori 是一款针对家庭照料者的 Proactive Family AI Agent,能主动监测堵车、冰箱库存、孩子学习进度、纪念日等事件。用户无需手动操作,AI 会在合适时机询问是否处理。该项目已开放候补名单,目标减轻家庭中总在照顾他人的那个人的负担。AI产品SuperNori家庭AI智能体主动提醒1 个信源在谈推荐理由:家里总是你操心?SuperNori 这个 AI 代理会主动提醒你堵车、冰箱空了、孩子学什么,不用你一个个记,试试看。原文
00:24Firecrawl@firecrawl_devFirecrawl MCP 发布新功能,文档解析速度提升5倍。支持PDF、电子表格和文档,可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器,无需API密钥即可在免费层试用。AI产品FirecrawlMCP文档解析智能体PDF推荐理由:Firecrawl MCP 现在解析文档快了5倍,免费就能用,让你的智能体直接读PDF和表格。原文
00:01Geek@geekbbNyaterm是一个基于Tauri、React和Rust构建的现代远程终端工作台,集成了SSH、本地终端、Telnet、串口、SFTP、隧道、OTP、AI辅助和加密同步等功能。该项目由nyakang在GitHub上开源,适用于需要统一管理多种远程连接方式的用户。它提供了一个跨平台的图形界面,支持多种协议和高级功能。AI产品TauriReactRustNyaterm远程终端2 个信源在谈推荐理由:Nyaterm把SSH、串口、SFTP、AI辅助全整合到一个界面上,用Tauri/React/Rust做的,开源免费,适合运维和开发者。原文