01:31AK@_akhaliqDomainShuttle是一个开放域主题驱动的文本生成视频模型,允许用户通过自然语言描述控制视频内容。该模型能够根据文本提示生成包含特定主题的视频片段,无需对每个主题进行单独训练。与现有方法相比,DomainShuttle在主题保真度和视频质量上表现更优,支持更灵活的自由形式主题控制。AI模型DomainShuttle文生视频开放域主题驱动生成推荐理由:想快速生成特定主题的视频素材?DomainShuttle 的开放域能力让你不需要训练就能直接用文字生成视频,很方便。原文
01:27Anthropic@AnthropicAIAnthropic宣布作为创始合作伙伴加入RAISE US非营利联盟。RAISE US由前美国商务部长Gina Raimondo和印第安纳州前州长Eric Holcomb共同主持。该联盟通过雇主主导的行动、AI赋能培训和政策创新,帮助美国工人适应向变革性AI的过渡。Anthropic是首家加入该联盟的AI公司,致力于建立AI时代的"人民战略"。行业AnthropicRAISE USAI劳动力培训AI政策10 个信源在谈推荐理由:Anthropic 跟政府和企业一起搞了个联盟,专门帮工人学 AI 技能、应对工作变化,不是卖模型而是搞人才培养。原文
01:26LangChain@LangChainAILangChain 团队解决了在对象存储中构建全文搜索索引的挑战:每个 GET 请求耗时 50-100ms,且数据持久化在远程存储。他们介绍了 SmithDB 的倒排索引构造、压缩和查询方案,涉及批量写入、压缩策略以减少请求次数,以及针对高延迟的查询优化。这些方法在生产环境中已稳定运行。技巧LangChainSmithDB全文搜索对象存储倒排索引推荐理由:LangChain 分享了怎么在对象存储上搞全文搜索,延迟 50-100ms 的情况下还能压出来倒排索引,挺实在的实战经验。原文
01:24lmarena.ai@lmarena_ai精选Zai_org的GLM系列在Code Arena: Frontend基准上持续增长,GLM-4.6得分1408,GLM-5.2 (Max)达到1595,超越Opus 4.8并逼近Claude Fable 5的1665分。GLM-5.2 (Max)是该实验室最强的编码模型,在HTML/React真实任务上缩小了与前沿实验室的差距。该模型为开源发布。AI模型GLMZai_orgCode Arena前端编码开源模型推荐理由:Zai_org的GLM-5.2开源模型在前端编码上超过了Opus,离领先的Claude Fable只差一点,值得试试原文
01:15Hugging Face@huggingfaceHugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程,无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。技巧Hugging Face开源模型本地部署推理推荐理由:想自己跑开源模型?Hugging Face 这场直播手把手教你在本地部署,省去云端费用和延迟。原文
01:08Paul Graham@paulgRippling 推出 Data Cloud,这是一个从头重建的现代数据堆栈,深度集成 AI。它围绕组织和员工数据构建,旨在帮助企业高效管理 token 消耗并减少 AI 无效输出。Rippling 创始人 Parker Conrad 表示该产品可解决 token burn 和 AI slop 问题。AI产品RipplingData Cloud企业数据AI集成推荐理由:Paul Graham 说 Rippling 十年后还在推出大更新。新 Data Cloud 把 AI 直接嵌入企业数据层,适合需要稳定又前沿方案的买家。原文
01:04Figma@figmaFigma 发布了 MCP connectors,让 Figma agent 能够连接外部工具与服务。该功能基于 Model Context Protocol(MCP)标准,目前处于早期阶段。用户可通过简单的配置让 agent 调用 Slack、Notion 等工具,扩展设计工作流。Figma 表示后续将开放更多连接器选项。AI产品FigmaMCP设计工具智能体10 个信源在谈推荐理由:Figma 出了 MCP 连接器,让设计 agent 能直接调用 Slack、Notion,工作流更顺了。原文
01:03a16z@a16zNetris完成由a16z领投的1500万美元Series A融资,该公司专注于为GPU集群提供网络自动化与多租户管理。其软件已在价值近10亿美元的数据中心运行,历经8年积累。过去12个月,Netris的ARR增长800%,部署超过35个AI集群,超过其他网络自动化供应商的总和。公司已与NVIDIA、HPE等合作,为AI基础设施解决East-West、OOB等复杂网络配置难题。行业Netrisa16zGPU集群网络自动化数据中心5 个信源在谈推荐理由:a16z领投的1500万美元融资,Netris专治GPU集群网络管理的难题,ARR一年涨8倍,部署量超对手总和,值得关注。原文
01:02AK@_akhaliq一条关于智能体原生内存系统的推文在X上获得3166次浏览和13个点赞。讨论聚焦于AI代理是否需要专属的记忆架构来提升自主性。作者质疑现有技术是否已为这种系统做好准备。暂无具体模型或基准数据支撑。行业智能体内存系统AI架构长期记忆推荐理由:有人在聊智能体要不要有自己的记忆系统,思路挺新鲜的,点开看看讨论。原文
00:57Philipp Schmid@_philschmidGoogle 在 Gemini 3.5 Flash 中上线了 computer use 功能,支持浏览器、移动端和桌面环境。开发者 Philipp Schmid 发布了一个快速入门教程,用单个脚本从终端安装 Android 模拟器。教程包含基础 agent 循环,通过 adb 接口控制手机,也支持远程设备连接(adb connect <ip>:5555)。类似模式可扩展到 iOS 的 simctl。技巧Gemini 3.5 FlashGoogleAndroidadb智能体推荐理由:Google 刚给 Gemini 3.5 Flash 加了 computer use,这份教程用一条命令就能在模拟器上跑 agent 控制手机,还支持远程和 iOS,很实用。原文
00:53@koltregaskes@koltregaskes76°Google在AI Studio中发现了Gemini Omni Flash的预览版公告,将支持最高4k分辨率、60秒长度的输出。60秒时长是视频生成领域的重要指标。该预览版预计为用户提供更强的视频生成能力。AI产品Gemini Omni FlashGoogle AI Studio视频生成4k60秒输出推荐理由:谷歌要在AI Studio上线Gemini Omni Flash预览版,能生成4k分辨率、60秒的视频,视频长度很顶。原文
00:36Milvus@milvusio精选单个1-5分的RAG质量评分会隐藏严重问题:一个回答90%基于文档,但10%虚构核心参数就不可用,平均分仍显示4分。幻觉分布也不均匀,数值查找或多条件问题类型的幻觉率远高于平均,不按类型分桶就看不到偏差。优化答案相关性时,添加提示词“提供更完整背景”可能提升相关度但导致模型依赖参数知识,降低忠实度。更可靠的方法是声明级评估:将回答拆成原子事实,用NLI模型检查每个声明是否被检索内容支撑,计算接地率,并对关键参数设置硬性阻断。按问题类型分桶评分,Milvus可用标量字段直接过滤分析,不依赖额外报表管线。技巧RAGMilvus评估幻觉声明级评估推荐理由:如果你在用RAG做生产系统,这篇讲透了为什么平均分不靠谱,还给了按声明颗粒度和问题类型精准监测的方法,连Milvus怎么分桶都说了,很实用。原文
00:30Google AI Developers@googleaidevs精选73°Google AI Devs 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用。该工具支持在浏览器、移动和桌面环境中构建可看可操作的智能体,处理长时任务。新增特性包括:内置移动和桌面操作系统支持、所有函数调用的意图参数、可定制客户端函数支持人机交互接管、提示注入检测及可配置安全策略。可用于自动化 QA 测试和业务流程等场景。AI产品Gemini 3.5 FlashComputer Use智能体自动化测试Google推荐理由:Google 给 Gemini 3.5 Flash 加了 Computer Use 工具,能让智能体跨浏览器、手机和桌面干活,还能自定义安全策略,实用!原文
00:26shao__meng@shao__mengSuperNori 是一款针对家庭照料者的 Proactive Family AI Agent,能主动监测堵车、冰箱库存、孩子学习进度、纪念日等事件。用户无需手动操作,AI 会在合适时机询问是否处理。该项目已开放候补名单,目标减轻家庭中总在照顾他人的那个人的负担。AI产品SuperNori家庭AI智能体主动提醒1 个信源在谈推荐理由:家里总是你操心?SuperNori 这个 AI 代理会主动提醒你堵车、冰箱空了、孩子学什么,不用你一个个记,试试看。原文
00:24Firecrawl@firecrawl_devFirecrawl MCP 发布新功能,文档解析速度提升5倍。支持PDF、电子表格和文档,可将内容转为LLM-ready数据。支持本地运行或使用托管MCP服务器,无需API密钥即可在免费层试用。AI产品FirecrawlMCP文档解析智能体PDF推荐理由:Firecrawl MCP 现在解析文档快了5倍,免费就能用,让你的智能体直接读PDF和表格。原文
00:01Geek@geekbbNyaterm是一个基于Tauri、React和Rust构建的现代远程终端工作台,集成了SSH、本地终端、Telnet、串口、SFTP、隧道、OTP、AI辅助和加密同步等功能。该项目由nyakang在GitHub上开源,适用于需要统一管理多种远程连接方式的用户。它提供了一个跨平台的图形界面,支持多种协议和高级功能。AI产品TauriReactRustNyaterm远程终端2 个信源在谈推荐理由:Nyaterm把SSH、串口、SFTP、AI辅助全整合到一个界面上,用Tauri/React/Rust做的,开源免费,适合运维和开发者。原文
23:59OpenRouter@OpenRouterAI精选OpenRouter推出全新Benchmarks API,允许agent实时查询模型基准分数,涵盖Artificial Analysis和Design Arena两个评测平台。该API数据显示,Zai_org的GLM-5.2在编码和设计两类基准中均为当前最佳可用模型。API文档已随推文发布,开发者可集成使用。AI产品OpenRouterBenchmarks APIGLM-5.2Zai模型评估推荐理由:想给AI agent加实时模型排名?OpenRouter新API能查GLM-5.2在编码和设计上的分数,挺实用。原文
23:57Gary Marcus@GaryMarcusAlice预测未来2年内AI股票泡沫崩溃,市场将出现类似2008年的大规模修正。大部分AI公司倒闭,但云提供商和芯片制造商可能幸存。Anthropic和OpenAI等推理公司可能被政府救助否则违约。AI应用集中在聊天机器人、设备端助手(苹果)和医疗影像,主要由开源或设备端模型驱动。教育领域AI使用降低学生质量,学校转向课堂纸笔考试。行业AnthropicOpenAI开源模型设备端模型10 个信源在谈推荐理由:一位读者做出了具体AI行业预测,从泡沫到公司倒闭、从开源主导到教育影响,观点尖锐,值得一读。原文
23:55elvis@omarsar0Hyperagent是一款为本地agent提供专属云端机器的服务,解决了本地agent运行时的崩溃、泄密和频繁监控问题。Andrew Busse指出OpenClaw像保姆一样麻烦。新用户注册可获得100美元推理积分,迁移首个agent再获500美元。该服务在hyperagent.com提供有限期优惠。AI产品Hyperagent智能体云端推理Andrew Busse3 个信源在谈推荐理由:如果你受够了本地agent崩溃和泄露,Hyperagent给每个agent配云端专机,新用户还能拿600美元积分,赶紧试试。原文
23:55Tw93@HiTw93Mole项目团队使用AI从Twitter和论坛帖子中收集并分类用户正面评论,构建了一面"爱之墙"并展示在mole.fit网站上。该墙包含5条回复、41个爱心和3852次查看,所有善意的留言都被收录。用户可以在网站上查看自己是否被提及。技巧MoleAI数据整理用户反馈社交媒体推荐理由:这个项目用AI从社交平台扒出所有夸Mole的留言,拼成一面故事墙,还能找到有没有你的身影原文
23:46OpenRouter@OpenRouterAIOpenRouter 发布新功能,允许用户通过两条命令(claude mcp add --transport http openrouter mcp.openrouter.ai/mcp 和 claude mcp login openrouter)在一分钟内完成模型的选择、定价、测试和集成。该功能基于 MCP(Model Context Protocol),支持所有主流代理(如 Claude)。用户可在 openrouter.ai/mcp 立即使用。技巧OpenRouterClaudeMCP智能体工具推荐理由:OpenRouter 搞了个骚操作,两行命令就能把模型接到 Claude 等代理里,一分钟搞定测试和定价,省去一堆配置。原文
23:45OpenRouter@OpenRouterAI精选OpenRouter推出MCP(模型上下文协议),使AI智能体能够直接获取实时模型信息。该工具可动态评估模型价格、性能并测试,替代依赖6个月前训练数据的猜测。集成后智能体可为任务精准选型,提升效率。AI产品OpenRouterMCP智能体模型选择实时模型推荐理由:OpenRouter新出的MCP能让你的AI智能体实时选模型,不用瞎猜了,还能比价测试,直接集成。原文
23:39Geek@geekbbGitHub项目'no-xxx'在代码推送前自动运行AI审查。审查通过标记为绿灯。只有绿灯更改才被推送到远程仓库。生成无垃圾代码的干净PR。该流程可集成到Git工作流中。AI产品AI代码审查PR自动化GitHub推荐理由:推送前自动跑AI审查,省心省力,再也不用手动清理垃圾代码了。原文
23:37berryxia@berryxiaOrnith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源,并提供了 GGUF 版本,可在 Ollama、Unsloth 等工具中直接运行。AI模型Ornith-1.0Terminal-BenchSWE-BenchOllama智能体推荐理由:Ornith-1.0 用 RL 教模型搭执行框架,在 SWE-Bench 上表现顶尖,本地党还有 GGUF 版本可玩。原文
23:24Guillermo Rauch@rauchg精选AI SDK 7正式发布,新增推理控制(reasoning control)和代理级工具审批(agent-level tool approval)功能。支持MCP应用、持久化工作流(durable workflows)和终端UI。还包含文件和技能上传、沙箱支持、测试框架集成及遥测等特性。AI产品AI SDKaisdkMCP/工具推理控制智能体推荐理由:AI SDK 7来了,新增推理控制和代理工具审批,还支持MCP应用和持久化工作流。做AI应用开发的一定要看看。原文
22:57Viking@vikingmute推文介绍了ponytail项目和一个Vibe Coding提示词技巧,建议在提示词末尾加入“如果GitHub/npm上有成熟开源方案,直接复用”。该技巧基于DRY理念,能有效减少GPT等模型生成冗余代码的现象。该技巧特别适合新手避免over-engineering。技巧ponytailGPT提示词工程Vibe Coding编程助手推荐理由:给用GPT写代码的人:提示词末尾加‘复用开源方案’能防止AI重复造轮子,亲测有效。原文
22:55向阳乔木@vista8一位用户收到并分享了第一封由AI Agent自动生成的邮件,该邮件内容未经人工直接干预。邮件发送者未具体说明使用哪个Agent产品,但标志着AI驱动的自动化通信迈出实际一步。该推文获得460次浏览,引发对Agent应用场景的讨论。行业AI Agent邮件自动化推荐理由:朋友收到AI代理自己发的邮件了,挺新鲜,看看AI悄悄帮你干活的样子。原文
22:39向阳乔木@vista8腾讯推出了一款专为Agent设计的邮箱服务,允许用户抢注邮箱名。注册后,用户会获得一段提示词,可将其发给Codex或其他Agent来完成命令行界面设置。该邮箱旨在简化Agent的通信与配置流程,无需手动编写脚本。目前该功能已开放注册,用户可通过评论区链接体验。技巧腾讯Agent邮箱Codex提示词工程推荐理由:腾讯出了个给Agent用的邮箱,注册后拿到提示词就能让Codex自动配好CLI,省得自己写命令,挺方便的。原文
22:00LangChain@LangChainAI精选LangChain 推文指出通用聊天适合一次性问答,答案出现即结束。专门智能体适合重复性、有固定形状的工作,使用相同工具和格式。智能体能记住线程可能遗忘的上下文,适合多次运行相同流程。技巧LangChain智能体提示词工程推荐理由:LangChain用一句话说清楚了选择原则:如果下次解释方式一样,就该用智能体,别放聊天里。原文
21:57shao__meng@shao__mengGLM-5.5 据传将于八月发布,智谱尚未官方确认。该模型预计与 Claude Fable 5、GPT-5.6 等下一代模型正面竞争。目前无具体参数或基准数据公布,市场关注度较高。AI模型GLM-5.5Claude Fable 5GPT-5.6智谱模型传闻1 个信源在谈推荐理由:有传闻说智谱的 GLM-5.5 可能八月上线,要和 Claude 和 GPT 的新版硬刚,吃瓜群众可以蹲一下。原文
21:54Patrick Loeber@patloeberPatrick Loeber 在 #GoogleIOConnect 上介绍了如何使用 AI Studio、Antigravity 2.0、新的 Interactions API、Gemini 3.5 Flash 以及 Gemma 开发应用。AI Studio 是 Google 的 AI 开发平台,Antigravity 2.0 提供新功能,Interactions API 支持更灵活的交互设计。Gemini 3.5 Flash 是高效推理模型,Gemma 是轻量开源模型。演讲内容已发布在 Google 官方博客。行业AI StudioGemini 3.5 FlashGemmaGoogle I/OAI开发工具推荐理由:Google 开发者生态又更新了,Patrick 讲了 AI Studio、Gemini 3.5 Flash 和新的 Interactions API,做应用开发可以看看。原文
21:45Thomas Wolf@Thom_Wolf实验让100多个智能体协作一周,优化vLLM中Gemma 4推理速度,最终实现5倍提升。智能体自发拒绝人类社交工程尝试,发现验证漏洞并请求社区裁决。四智能体接力构建int4-lm_head检查点,经诊断配置错误后达到118 TPS(2.68×)。GPU富/贫分工、跨智能体内核调试、配额池化等行为涌现。智能体还指出127 TPS“墙”是假象,并讨论了int4-Marlin floor的循环证明问题。AI模型Gemma 4vLLM多智能体推理优化智能体协作2 个信源在谈推荐理由:这个实验展示了100多个AI智能体像人类社区一样自发协作、互相监督,甚至发现了验证漏洞。一周将Gemma 4推理速度优化5倍,很酷。原文
19:55The Rundown AI@therundownaiAnthropic和OpenAI加入了由非营利组织牵头的一项5亿美元计划,目标是利用AI技术攻克普通感冒。该计划将重点通过机器学习加速抗病毒药物筛选和临床试验设计。项目时间表为五年,预计将投入大量计算资源。具体合作细节尚未披露,但两家AI公司承诺提供模型支持。行业AnthropicOpenAI医疗AI5亿美元感冒治疗10 个信源在谈推荐理由:两家AI巨头联手砸5亿美元,想用AI治好感冒,挺新颖的。原文
19:54Geek@geekbb精选一个轻量Python脚本让Codex CLI反复回答同一道糖果数学题,用于对比不同模型的表现。脚本可调整reasoning effort参数并观察效果。代码开源于GitHub,便于复现和扩展。技巧Codex CLIreasoning effortPython脚本糖果数学题推理测试推荐理由:想测不同模型对同一道题的推理差别?用这个脚本跑糖果题,还能调reasoning effort,很直观。原文
19:39Genspark@genspark_aiADK Marketing Solutions 最初只把 AI 当高级搜索引擎用。借助 Genspark,他们将 AI 嵌入研究、演示、会议和跟进流程。两年内,公司整体生产力飙升 250%。这一案例来自华尔街日报的报道,展示了深度集成 AI 工作流的效果。AI产品GensparkADK Marketing Solutions企业AI应用工作流集成生产力提升推荐理由:别再把 AI 当搜索了,看看 ADK 怎么用 Genspark 把生产力翻了 2.5 倍,直接嵌入每个环节。原文
18:57shao__meng@shao__meng火山引擎发布53页ArkClaw安全白皮书,将AI Agent安全归纳为三层问题:OpenClaw原生风险、云SaaS通用风险和企业治理新痛点。白皮书详细列出OpenClaw六大原生风险,包括Gateway/CDP绑定0.0.0.0、外部内容操纵LLM污染HEARTBEAT.md等。还提出安全责任共担模型、七项架构设计原则和四层安全保障体系。最后给出三个企业最佳实践模块:统一鉴权网关、网络边界管控、持续安全运营。论文ArkClaw火山引擎Agent安全安全白皮书原生风险3 个信源在谈推荐理由:火山引擎发了份53页的安全白皮书,把AI Agent安全拆成三层六风险,还有架构原则和最佳实践,搞企业级Agent安全必读。原文
18:15shao__meng@shao__meng73°Anthropic指控阿里巴巴通过近25000个虚假账户大规模获取其Claude模型能力进行蒸馏。这一数字超过Anthropic此前指控DeepSeek、MiniMax和Kimi的数量总和。事件凸显了AI模型API被滥用于竞争对手蒸馏的风险。行业AnthropicClaudeAlibaba千问蒸馏10 个信源在谈推荐理由:朋友,Anthropic说阿里用了2.5万个假账号偷偷薅Claude的羊毛,比之前告DeepSeek他们加一起还多,这操作挺猛。原文
17:56Anton Osika@antonosika一家巴西初创公司完全基于Lovable平台构建和运营,在不到一年内达到了1800万美元的年运行率。该公司通过AI帮助其他企业加速业务流程。Lovable是一个无代码AI应用构建平台,这个案例展示了其快速商业化的能力。AI产品Lovable巴西无代码AI开发推荐理由:巴西一家公司全靠Lovable做产品,一年就做到1800万美金年收入,太猛了。原文
17:28berryxia@berryxia这篇帖子介绍了构建AI智能体的6个核心架构支柱和1个人机协同机制。MCP由Anthropic提出,作为通用标准让智能体即插即用外部工具。智能体循环包括感知→思考→行动→观察→重复的流程。单体与多智能体架构两种模式可灵活选择。智能体驱动的RAG动态路由查询并验证上下文。人机协同机制(HITL)在关键操作前插入人工检查点。技巧MCPAnthropic智能体智能体循环RAG10 个信源在谈推荐理由:想搭AI智能体但怕底层理论?这篇用7个点讲透架构,从MCP到记忆系统,普通开发者也能快速落地。原文
17:27Stanford AI Lab@StanfordAILab精选Stanford AI Lab发布OpenThoughts-Agent-v2和OpenThinkerAgent-32B,两者均基于Qwen-3开源数据。在计算控制比较中,该模型在全部训练规模下领先,并在7个agent基准测试上平均得分44.8%。模型在终端使用和编码任务上表现突出,且泛化能力强。AI模型OpenThoughts-Agent-v2Qwen-3Stanford AI Lab开源模型智能体推荐理由:斯坦福开源了新agent模型,基于Qwen-3在7个基准上平均44.8%,小模型也能打,值得一试。原文