00:17Paul Couvert@itsPaulAi83°MiniMax 发布开源权重模型 M3,在 SWE-Bench Pro 上达到 59.0%,与 GPT-5.5 持平,并在多项编码基准上与 Opus 4.7 不相上下。M3 还支持 1M 上下文、原生多模态,使用成本仅为 GPT 和 Opus 的十分之一。权重和技术报告将在约 10 天后在 Hugging Face 开放。这标志着开源模型首次在多个前沿能力上追平闭源顶级模型,对 AI 开发者和企业用户意义重大。AI模型开源/仓库推理模型编程助手MiniMaxM3推荐理由:开源模型首次在编码和智能体任务上追平 GPT-5.5 和 Opus,成本却低一个数量级。做 AI 应用开发或自建模型的团队,值得关注权重发布后直接试用。原文
22:36Ate-a-Pi@svpinoIngestr 是一个开源 CLI 工具,能以极快速度在不同数据源之间迁移数据。它支持几乎所有数据库、数据仓库和 SaaS 应用,几乎无需配置即可使用。用户只需一条命令即可完成数据迁移,且能与 Claude Code 或 Codex 等 AI 编程助手配合,实现自动化数据搬运。该工具以速度著称,适合需要频繁迁移数据的开发者和数据工程师。AI产品数据迁移CLI工具开源/仓库ETLIngestr推荐理由:数据迁移是日常开发中的高频痛点,Ingestr 用一条命令解决了跨数据库、仓库和 SaaS 的数据搬运问题,做数据工程或 ETL 的团队可以直接拿来用,省去配置时间。原文
18:24berryxia@berryxia精选76°KwaiKeye 在 Hugging Face 开源了多模态模型 Keye VL 2.0-30B-A3B,总参数 30B 但活跃参数仅 3B,采用 Apache 2.0 协议。模型通过 DeepSeek 稀疏注意力实现 256K 上下文,视频理解能力随输入帧数增加而准确率上升,打破长视频导致模型迷失的直觉。在多个长视频基准上,其表现与 Qwen3 VL 和 Gemini 3 Flash 相当。该模型证明了稀疏注意力可同时兼顾长上下文和深度理解,是多模态领域的重要进展。AI模型多模态模型稀疏注意力开源/仓库视频理解KwaiKeye推荐理由:做视频理解或多模态应用的开发者,终于有了一个长上下文和深度理解兼得的开源模型,建议直接去 Hugging Face 下载试试。原文
15:07NVIDIA AI@NVIDIAAI精选NVIDIA 宣布其 Cosmos 3 模型完全开源,包括模型权重和训练配方。该模型已在 Hugging Face 上发布,供开发者自由使用。此举延续了 NVIDIA 在 AI 领域开放生态的策略,旨在推动更多创新应用。Cosmos 3 的开放将加速研究者和工程师在视觉、语言等多模态任务上的探索。AI模型开源/仓库多模态模型NVIDIACosmos 3Hugging Face9 个信源在谈推荐理由:NVIDIA 把 Cosmos 3 的权重和训练配方全开源了,做多模态研究的团队可以直接下载使用,省去从头训练的算力成本,值得点开看看。原文
15:05NVIDIA AI@NVIDIAAI93°NVIDIA 宣布推出 Cosmos 3,号称全球首个完全开放的全能模型,原生支持视觉推理、世界生成和动作生成。该模型提供 Super(32B)和 Nano(8B)两个版本,面向物理 AI 领域的研究与开发。Cosmos 3 的开源特性有望加速机器人、自动驾驶等物理世界交互系统的训练与部署,降低开发者门槛。AI模型物理AI开源/仓库视觉推理世界生成NVIDIA9 个信源在谈推荐理由:做机器人或自动驾驶的团队终于有了一个全开源的物理世界模型——Cosmos 3 原生支持视觉推理和动作生成,32B 和 8B 两个版本覆盖不同算力场景,值得直接上手试试。原文
14:33Hugging Face: Blog(博客/媒体)83°NVIDIA 发布了 Cosmos 3,这是首个开源的物理 AI 全能模型,能够同时进行推理和行动。该模型基于多模态输入(如视觉、语言)理解物理世界,并生成可执行的动作序列。Cosmos 3 在机器人、自动驾驶等需要物理交互的领域具有重大意义,因为它将感知、推理和行动整合在一个模型中。NVIDIA 在 Hugging Face 上开源了该模型,开发者可以直接使用或微调。AI模型物理 AI开源/仓库NVIDIA机器人自动驾驶9 个信源在谈推荐理由:做机器人或自动驾驶的开发者终于有了一个开源的物理世界理解模型,能直接推理并生成动作,省去多模型拼接的麻烦,值得立即上手试试。原文
14:08Runway ML@runwayml精选76°Runway 宣布作为创始成员加入 Cosmos Coalition,这是一个由 NVIDIA 和多家顶级 AI 实验室发起的全球性倡议,旨在共同构建并开源面向物理 AI 的前沿世界模型。该联盟将通过一个通用的开放生态系统,加速世界模型的研究与开发,推动物理 AI 的进步。此举有望降低物理 AI 的门槛,促进跨机构协作,为机器人、自动驾驶等领域提供基础模型。行业物理 AI世界模型开源/仓库NVIDIARunway10 个信源在谈推荐理由:物理 AI 开发者终于有了开放生态——Runway 和 NVIDIA 牵头开源世界模型,做机器人或自动驾驶的团队可以直接参与共建,值得关注。原文
13:33岚叔@lufzzliz76°一位开发者用 Claude 在约 2 周内花费 800 美元,开发了《大唐长安·智机府》——一个基于浏览器的 3D 实时语音互动项目,并已开源。该项目将盛唐长安的 3D 沙盘、角色漫游、NPC 对话、诗词小游戏和实时语音 AI Agent 融合,定位为数字文旅加 3D 游戏加 AI 语音展示。技术架构上,主项目用 Three.js 搭建 3D 场景和交互,语音子项目通过 Next.js iframe 与 FastAPI 后端接入 Agora ConvoAI。关键难点包括 Agora 账号配置、浏览器音视频限制和 3D 世界尺度统一。作者建议复刻者从小场景开始,先跑通交互和语音链路再扩展。AI产品3D 游戏语音 AI Agent数字文旅开源/仓库Claude1 个信源在谈推荐理由:这个开源项目展示了如何用 AI 快速构建 3D 文旅互动体验,做数字文旅、游戏开发或 AI 语音应用的团队可以直接参考其技术架构和开发路径,值得逐帧学习。原文
12:14berryxia@berryxia开发者用两周时间,基于Three.js和Agora实时语音AI,构建了一个可在线漫游、对话的盛唐长安城3D项目。用户可以用WASD控制角色行走,靠近李白、杜甫等NPC按E键触发语音对话,NPC拥有独立性格和音色。项目还包含飞花令、猜谜等唐风小游戏,以及珍宝馆、AI展馆等互动场景。代码已全开源在GitHub,前端使用Three.js,后端为FastAPI,普通用户可直接在线体验,开发者也可复刻学习。AI产品Three.js实时语音AI数字文旅开源/仓库NPC对话1 个信源在谈推荐理由:这个项目把历史文化和AI能力巧妙融合,做3D互动或数字文旅的开发者可以直接参考开源代码复刻,想体验AI语音对话的普通用户也能在线玩,值得一试。原文
11:25elvis@omarsar0MiniMax 即将发布其新一代模型 M3,目前已在 OpenCode 平台上开放免费试用。AI 研究员 Omar 表示将使用自己的编码代理和测试框架对 M3 进行深度测试,并计划发布评测。这一消息引发了社区关注,已有近 3000 次浏览。M3 的发布可能为编程助手和智能体领域带来新的选择。AI模型MiniMaxM3编程助手智能体开源/仓库推荐理由:MiniMax M3 即将上线,做 AI 编程和智能体开发的团队可以趁免费期在 OpenCode 上抢先体验,看看它能否成为你工作流中的新利器。原文
10:54arXiv: OpenAI@Shenghu Jiang, Ruihao Gong精选研究人员提出了一种增量BPE分词算法,能够在流式场景中高效处理输入文本。该算法在最坏情况下每个字节的处理时间为O(log² t),总体复杂度为O(n log² t),其中n为输入长度,t为最大token长度。相比Hugging Face的tokenizers,该算法实现了约3倍的速度提升,并在病态输入上显著降低了延迟。此外,算法还支持流式输出,能在确定token边界后立即输出结果。这项研究为大型语言模型管道中的分词环节提供了实用的延迟优化。论文BPE分词增量算法流式处理LLM管道开源/仓库推荐理由:BPE分词是LLM推理的常见瓶颈,这个增量算法让流式场景提速3倍,做模型部署或实时推理的团队可以直接替换现有方案,值得一试。原文
10:47arXiv cs.AI@Weitong Qian, Beicheng Xu, Zhongao Xie, Bowen Fan, Guozheng Tang, Jiale Chen, Xinzhe Wu, Mingtian Yang, Chenyang Di, Jiajun Li, Lingching Tung, Peichao Lai, Yifei Xia, Ziyi Guo, Yanwei Xu, Yanzhao Qin, Shaoduo Gan, Xupeng Miao, Bin Cui精选AutoSci 是一个基于大语言模型的智能体系统,旨在自动化科学研究的完整生命周期,包括文献理解、想法生成、实验、论文撰写和审稿回复。它通过四个核心模块实现:SciMem 提供结构化研究记忆,区分长期知识记忆和项目级活动记忆;SciFlow 执行五阶段生命周期流程;SciDAG 用有向无环图增强复杂技能;SciEvolve 通过反馈信号持续优化系统。该系统解决了现有科研智能体无法统一支持全流程、缺乏持久记忆和自进化能力的问题。代码已开源,为科研自动化提供了可扩展的框架。AI产品科研自动化智能体记忆管理开源/仓库AutoSci推荐理由:做科研自动化的团队终于有了一个能覆盖全流程、带记忆还能自我进化的系统——AutoSci 把文献、实验、写作、审稿串起来了,搞学术自动化的开发者可以直接用它的开源代码试试。原文
10:29arXiv cs.AI@Jiazheng Xing, Hangjie Yuan, Lingling Cai, Xinyu Liu, Yujie Wei, Fei Du, Hai Ci, Tao Feng, Jiasheng Tang, Weihua Chen, Fan Wang, Yong LiuLumos-Nexus 是一种训练高效的统一视频生成框架,解决了将高保真生成器集成到统一训练循环中计算成本过高的问题。它采用两阶段设计:训练时仅用轻量级生成器与理解模块对齐,学习推理驱动的语义控制;推理时通过统一渐进频率桥接(UPFB)在共享潜在空间中将生成任务逐步交给高容量预训练生成器,实现从粗到细的优化,生成高保真视频而不牺牲推理质量。为填补推理驱动视频生成基准的空白,团队引入了 VR-Bench 评估模型将推断意图转化为连贯视频的能力。实验表明,Lumos-Nexus 在 VBench 上显著提升了视觉真实感和时间连贯性,在 VR-Bench 上展示了强大的推理生成性能。代码和模型已开源。论文视频生成统一模型推理驱动频率桥接开源/仓库推荐理由:视频生成领域终于有了兼顾推理能力和视觉保真度的方案,做视频理解与生成统一模型的团队可以直接参考其两阶段设计,省去大量训练成本。原文
10:27arXiv cs.LG@Daniel Peñaherrera, Rishal Aggarwal, David Ryan Koes计算化学中高效采样分子玻尔兹曼分布是一个长期挑战。传统方法计算成本高,而基于扩散模型的退火采样方法需要计算分数场的散度来估计重要性权重,对于大分子系统不可行。本文提出可扩展推理时退火(SITA),通过能量模型提供快速替代似然,重新训练流模型以逐步在更低温度下生成样本。在丙氨酸二肽和三肽上取得最先进性能,且避免了昂贵的散度项。代码已开源。论文分子模拟扩散模型退火采样能量模型开源/仓库推荐理由:SITA 解决了大分子系统退火采样中散度计算不可行的痛点,做计算化学和分子模拟的团队可以直接用开源代码复现,值得关注。原文
10:11arXiv cs.LG@Nianyi Lin, Jiajie Zhang, Lei Hou, Juanzi Li精选LongTraceRL 是一种新方法,旨在解决大语言模型在长上下文推理中难以定位和整合关键信息的问题。它通过知识图谱随机游走生成多跳问题,并利用搜索智能体的轨迹构建高混淆度的干扰文档,使训练上下文更具挑战性。同时,它提出了一种基于实体级过程监督的“评分奖励”,只对正确答案的推理过程进行细粒度评估,避免奖励作弊。在 4B 到 30B 的多个推理模型上,LongTraceRL 在五个长上下文基准测试中持续优于强基线,并促进了基于证据的推理。代码、数据集和模型已开源。论文长上下文推理强化学习搜索智能体奖励设计开源/仓库推荐理由:长上下文推理是当前大模型的瓶颈,LongTraceRL 用搜索轨迹和细粒度奖励解决了干扰项和奖励稀疏的问题,做推理模型训练或长文档理解的团队可以直接用开源代码复现。原文
09:41elvis@omarsar0知名 YouTuber PewDiePie 正在构建自己的智能体编排器并计划开源。这一举动出乎意料,表明即使是内容创作者也能轻松掌握智能体开发的核心技术。PewDiePie 强调“拥有智能体,拥有工具链”,鼓励更多人参与智能体生态建设。该消息在社交媒体上引发热议,展示了 AI 工具民主化的趋势。AI产品智能体开源/仓库PewDiePie编排器AI 工具民主化推荐理由:PewDiePie 亲自下场做智能体编排器,说明 AI 工具的门槛正在降低——做内容创作或独立开发的你,也可以像他一样自己造轮子,值得关注。原文
09:37elvis@omarsar0精选一位用户在 X 上分享使用 DeepSeek-v4-flash 的体验,称已花费数亿 token(约 10 美元),效果令人印象深刻。他将其用于自建编程智能体的自我改进,认为表现非常出色。该模型以极低的价格提供了高质量的性能,尤其适合需要大量 token 的开发者。更多细节将在后续分享。AI模型DeepSeek-v4-flash编程助手智能体性价比开源/仓库1 个信源在谈推荐理由:DeepSeek-v4-flash 以极低成本(百万 token 约 10 美元)实现高质量代码生成,做智能体或编程工具的开发者值得一试,性价比远超同类模型。原文
09:24Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在 X 上呼吁更多人公开分享编程和智能体追踪数据,以构建更好的数据集和开源模型。他指出已有不少人贡献,鼓励大家也分享自己的数据。同时,Simon Willison 抱怨 OpenAI 的 Codex Desktop 在更新中移除了“Copy as Markdown”功能,该功能曾是他最喜欢的导出完整聊天记录的方式。这一变化引发了对数据共享和工具可用性的讨论。公开分享追踪数据有助于推动开源模型进步,但工具功能的移除可能影响开发者体验。行业开源/仓库编程助手数据共享智能体OpenAI Codex10 个信源在谈推荐理由:如果你在训练或使用开源编程模型,公开分享追踪数据能直接提升数据集质量,Hugging Face 的号召值得响应。做 AI 编程工具的团队也能从中获得更丰富的训练素材。原文
08:33berryxia@berryxia一条推文指出,许多每月付费的AI工具、Bloomberg终端、交易系统等,本质是资本维持稳定收入的机制。GitHub上已有10个开源项目可替代这些付费产品,涵盖对冲基金、交易系统、金融终端、AI聊天、视频工作室、虚拟主播、广告生成、邮件管理、浏览器和视频制作。这些项目免费、功能强大、支持自托管,让用户完全掌握数据和控制权。例如,Fincept Terminal可替代Bloomberg,LibreChat可自托管多模型AI聊天,Open Higgsfield AI集成多种图像和视频生成模型。AI产品开源/仓库金融工具AI聊天视频生成自托管推荐理由:想省掉每月订阅费、又不想被厂商锁定的开发者和金融从业者,这10个开源项目直接给你机构级工具,建议收藏试玩。原文
10:19marktechpost@Michal Sutter精选72°Trajectory 与 UC Berkeley Sky Lab 和 Anyscale 合作,构建了一个用于持续学习的并发多 LoRA 训练栈。该方案将每个强化学习实验映射到始终热运行的引擎上的专用 LoRA 适配器,相比单租户基线实现了 2.81 倍的端到端实验吞吐量提升,且无奖励回归。代码已在 NovaSky-AI/SkyRL 开源。这一进展解决了持续学习中多实验并行效率低下的问题,对强化学习研究和工程团队有直接价值。AI模型LoRA持续学习强化学习开源/仓库训练栈推荐理由:做强化学习持续训练的团队终于有了高效的并行方案——2.81 倍吞吐量提升且不损失奖励,直接开源可用,建议试试。原文
09:36宝玉@dotey精选Matt Pocock 开源了 Sandcastle,一个用 TypeScript 脚本编排多个 AI Agent(如 Codex、Claude Code、Cursor、GitHub Copilot)协同工作的工具。它允许用户定义工作流,让不同 Agent 在虚拟机中依次或并行执行任务,例如让多个 Agent 分别生成技术方案并相互评分。该工具适合追求极致自动化的极客场景,但对普通用户门槛较高。AI产品智能体MCP/工具开源/仓库编程助手工作流编排6 个信源在谈推荐理由:多 Agent 编排是提升 AI 协作效率的关键,做复杂自动化或赛博养蛊的开发者可以直接试试这个开源方案。原文
05:07AI Notkilleveryone@ai_zona精选83°Model Context Protocol (MCP) 正式被 Linux 基金会采纳为标准,为 AI 智能体连接工具和数据提供统一协议。该协议标准化了智能体与外部工具的交互方式,支持跨不同大语言模型提供商使用。AIZona ADK 已原生支持 MCP,开发者可通过单一注册中心管理所有工具,实现任意模型调用。这标志着 AI 智能体生态向互操作性迈出关键一步。行业MCP/工具智能体开源/仓库标准协议AIZona ADK推荐理由:MCP 成为 Linux 基金会标准解决了 AI 智能体工具连接碎片化问题,做智能体开发的团队可以直接用统一协议对接工具,建议关注并尝试集成。原文
01:42Clement Delangue@ClementDelangueAI安全研究所(AISecurityInst)在Hugging Face上公开发布了其评估工具、数据集和模型,旨在促进AI安全研究的透明度和可复现性。这一举措允许全球研究人员审查、复现并基于这些资源进行开发,打破了AI安全研究封闭进行的传统。开源这些关键资源有助于加速AI安全领域的进展,并增强公众对AI系统的信任。AI产品AI安全开源/仓库评估工具数据集Hugging Face推荐理由:AI安全研究终于走向开放,做AI安全评估和模型审计的团队可以直接复用这些资源,建议点开看看具体有哪些工具和数据集。原文
00:18Jerry Liu@jerryjliu0精选LlamaIndex 创始人 Jerry Liu 宣布推出 LiteParse v2,用 Rust 完全重写,成为全球最快的 PDF 解析器。它基于网格投影算法,无需 LLM 即可将复杂页面布局(含文本和表格)转换为结构清晰的文本,支持 50+ 文档类型,可直接在 AI Agent 中使用。相比 pymupdf、pypdf 等开源方案,LiteParse v2 在速度和准确性上均占优。核心步骤包括文本行分组、锚点识别、对齐渲染等,详情可查看官方博客。AI产品PDF 解析RustLlamaIndex开源/仓库AI Agent3 个信源在谈推荐理由:LiteParse v2 解决了 PDF 解析慢、依赖大模型的痛点,做文档处理或 AI Agent 的开发者可以直接用,速度比同类快一个量级。原文
23:59Harrison Chase@hwchase17LangChain 宣布与 GEPA 集成,用户现在可以优化 LangChain 链的性能。GEPA 是一个用于优化 AI 工作流的工具,此次集成由开发者 @bryonkuchML 贡献的 PR 实现。该集成允许开发者通过 GEPA 的文档教程,轻松优化 LangChain 链,提升效率。这对于使用 LangChain 构建复杂 AI 应用的团队来说,是一个重要的性能优化手段。AI产品LangChainGEPA性能优化AI工作流开源/仓库推荐理由:LangChain 用户现在可以直接用 GEPA 优化链性能,省去手动调优的麻烦,做 AI 工作流的开发者值得一试。原文
23:57Geek@geekbb精选开发者 Nazzareno Giannelli 发布了一个基于 Bun、OpenTUI 和 SolidJS 构建的终端仪表盘项目,能够在 TUI(终端用户界面)中统一管理看板任务、日程安排和 Claude Code 代理会话。该项目将多种开发工作流集成到一个终端界面中,减少了上下文切换。对于频繁使用终端和 Claude Code 的开发者来说,这是一个提升效率的新工具。项目已在 GitHub 开源,可直接使用或二次开发。AI产品终端仪表盘TUIClaude CodeBun开源/仓库推荐理由:终端重度用户和 Claude Code 爱好者终于可以告别多窗口切换——这个开源仪表盘把看板、日历和 AI 代理会话塞进一个 TUI,做全栈开发的建议直接 clone 试试。原文
22:27AI Notkilleveryone@ai_zona@aizonaai 发布了开源AI智能体治理工具 @aizonaai/adk,采用MIT许可证。该项目强调透明性、社区协作和可审计性,旨在解决AI治理中的黑箱问题。通过开源,社区可以发现边缘案例并建立信任。开发者可以自由fork、贡献和审计代码。AI产品开源/仓库AI治理智能体透明性MIT许可推荐理由:AI治理的透明化是行业痛点,做AI安全或合规的团队可以直接参与审计和贡献,避免黑箱风险。原文
16:52elvis@omarsar0精选一位开发者预言,未来几个月人们将意识到 MCP(模型上下文协议)对智能体的根本重要性。MCP 的价值不仅在于连接工具,更在于它启用的抽象能力,例如通过智能体间交互实现自我改进系统。该开发者的整个编排器通过 MCP 工具实现了复杂交互、版本控制、评估工作流等。他认为 MCP 协议本身对未来所有进展至关重要,且很高兴大部分是开源的。AI产品MCP/工具智能体协议开源/仓库自我改进推荐理由:MCP 正在从工具连接协议进化为智能体自我改进的基础设施,做智能体编排和自动化系统的开发者值得关注这个趋势。原文
16:18向阳乔木@vista8姚金刚老师与组织者将在今晚八点通过WaytoAGI进行GEO(生成式引擎优化)首场直播分享,讲解GEO的底层逻辑、方法、系统原理及理念。分享将涉及GEOFlow系统、元Skill、17套GEO Skill合集、41篇最新GEO/AI搜索相关论文,以及多份白皮书、红皮书、蓝皮书等资料。组织者将负责AI工具和模型的问答环节,帮助参与者理解GEO如何从SEO演进而来,以及其在AI搜索时代的重要性。行业GEOAI搜索公开课开源/仓库营销推荐理由:GEO是AI搜索时代的新营销方向,做SEO或内容营销的团队值得关注这场公开课,可以直接获取系统方法和开源资料,建议点开了解底层逻辑。原文
16:07宝玉@dotey宝玉(@dotey)对其群聊总结 Skill 进行了小功能更新,现在用户在群里 @bot 并请求总结群聊记录时,机器人能够结合聊天记录的上下文,在总结的同时回复用户的问题。该 Skill 依赖于 wx-cli 读取微信群聊数据,推荐使用 Claude Code + Claude Opus 4.6 获得最佳效果。这一更新提升了群聊助手的交互性和实用性,让总结不再只是单向输出,而是能针对性地回答用户疑问。技巧群聊总结微信机器人Claude CodeClaude Opus 4.6开源/仓库推荐理由:做微信群聊自动化或社群运营的开发者,可以试试这个 Skill——它让 bot 不仅能总结,还能结合上下文回答问题,比单纯罗列消息更实用。原文
15:34Viking@vikingmute精选72°开发者 vikingmute 开源了 review-forge,一套用于审核 AI 生成代码的流程技能。该流程包含 review、synthesize、手动决策、fix 和 verify 五个步骤,通过让 GPT-5.5、Compose2.5、DeepSeek V4 Pro 等多个模型分别生成 bug 报告,再汇总交叉验证,最后由人工决定修复哪些问题。作者认为 AI 代码产出太快,长期不干预会导致系统失控,这套流程能有效提升代码质量。项目灵感来自文章《Using AI to write better code more slowly》,旨在让 AI 写得更慢但更好。AI产品代码审核多模型开源/仓库AI 编程review-forge推荐理由:多模型交叉审核解决了 AI 代码质量失控的痛点,适合重度使用 AI 编程的团队和个人开发者,建议直接 fork 项目试试这套流程。原文
14:12IT之家(博客/媒体)精选72°Nous Research 为开源 Hermes Agent 引入 Tool Search 功能,通过按需加载工具模式,解决 MCP 工具定义占用大量 tokens 的问题。Anthropic 报告显示,典型部署中工具模式可消耗约 50% 的 tokens,导致成本增加和准确率下降。启用 Tool Search 后,模型先搜索再加载参数,最后调用工具,Claude Opus 4 准确率从 49% 提升至 74%。该功能使用 BM25 算法匹配工具,并支持退回到字面子串匹配。AI产品智能体MCP/工具开源/仓库Hermes Agent工具搜索10 个信源在谈推荐理由:做智能体开发的团队终于能省下大量 tokens 成本——Hermes Agent 的 Tool Search 直接解决了 MCP 工具税问题,建议用多工具服务的开发者试试。原文
12:53Geek@geekbb精选阿里云推出 Model Studio CLI(百炼 CLI),这是一个官方命令行工具,支持与 Qwen 系列模型进行文本对话、多模态理解(图片、音频、视频)、图片与视频生成编辑、语音合成识别、知识库检索及网页搜索等功能。该工具将阿里云 AI 平台能力集成到终端,方便开发者通过命令行快速调用。项目已开源在 GitHub,适合需要自动化或脚本化调用 AI 能力的场景。AI产品阿里云百炼 CLI命令行工具多模态开源/仓库推荐理由:百炼 CLI 把阿里云的多模态和搜索能力直接搬到了命令行,做自动化脚本或需要批量调用 AI 的开发者可以省去写 API 调用的麻烦,值得一试。原文
12:43岚叔@lufzzliz一位开发者用 Opus 4.8 快速构建了一个 Mac 菜单栏小工具,可以实时查看 Claude Code 和 Codex 的缓存命中率、Token 消耗及额度使用情况。该工具零侵入,无需修改现有工作流。作者表示如果点赞或留言人数多,将开源该项目,并邀请用户提出其他想要的功能或 harnesses。AI产品Claude CodeCodexMac 工具缓存监控开源/仓库推荐理由:对于频繁使用 Claude Code 和 Codex 的开发者,这个菜单栏小工具能帮你实时掌握 API 消耗和缓存效率,避免超额。如果你也想要,不妨留言催更开源,还能定制你需要的功能。原文
12:12Google AI Developers@googleaidevs精选Eigent AI 团队在 Gemini API 上实现了 Managed Agents 功能,用于自动化审计 CI 失败。他们使用 Gemini 3.5 Flash 和 Gemini Managed Agents API,在几分钟内定位了真实 megatron-lm CI 失败的根因。工作流程包括协调代理规划审计、开发者代理加载技能并收集证据、Gemini 代理作为远程子代理进行深度推理。该方案已开源在 Eigent 平台上,展示了多代理协作在 DevOps 场景中的高效应用。AI产品智能体Gemini APICI/CD开源/仓库DevOps推荐理由:CI 失败排查是开发团队的日常痛点,Eigent 用多代理协作把根因定位从小时级压缩到分钟级,做 DevOps 或 ML 基础设施的团队值得关注这个开源方案。原文
11:35AK@_akhaliqHuggingFace 宣布其推理 API 现在支持超过 81,000 个模型,覆盖文本、图像、音频等多种模态。这意味着开发者可以直接通过 API 调用海量预训练模型,无需自行部署基础设施。这一更新大幅降低了 AI 模型的使用门槛,尤其适合快速原型开发和实验。对于需要灵活选择模型的团队来说,这是一个重要的资源整合。AI产品HuggingFace推理 API模型部署开发者工具开源/仓库推荐理由:81k 模型一键调用,省去部署烦恼——做 AI 应用开发的团队可以直接用 API 快速验证想法,值得收藏。原文
08:48marktechpost@Sana Hassan精选72°AgentTrove 是目前最大的开源智能体交互轨迹数据集,包含 170 万条 ShareGPT 格式的记录。本文提供了一份详细的 Python 教程,演示如何在不完全下载的情况下流式读取数据集、标准化智能体对话轮次、提取命令、分析轨迹,并最终将成功的交互轨迹导出为干净的 SFT 微调数据集。这对于需要高质量智能体训练数据的开发者来说非常实用。技巧智能体数据集SFT 微调Python 教程开源/仓库推荐理由:做智能体微调的团队终于有了大规模、可流式处理的开源轨迹数据,不用再自己爬取或合成。想快速上手构建 ShareGPT 格式 SFT 数据集的开发者,这篇教程可以直接照着跑。原文
08:26Ate-a-Pi@svpino精选一个包含30个开源端到端智能体示例的仓库被分享,这些示例使用Google ADK构建,展示了复杂的工作流程。每个示例都配有完整的文档、源代码和架构图,架构图本身被认为极具价值。用户可以通过一键部署功能快速运行这些示例。该仓库适合希望学习或构建智能体应用的开发者。AI产品智能体开源/仓库Google ADK工作流开发者工具推荐理由:做智能体开发的团队可以直接复用这些成熟的工作流模板,架构图能帮你省下大量设计时间,建议收藏。原文
04:58ollama@ollamaOpenJarvis 是一个由斯坦福大学 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI,现已支持通过 Ollama 运行。该项目属于“Intelligence Per Watt”研究的一部分,旨在探索高效的本地AI方案。OpenJarvis 强调在本地设备上运行,无需依赖云端,从而保护用户隐私并降低延迟。对于关注本地AI部署和隐私保护的开发者来说,这是一个值得尝试的新工具。AI产品本地AIOllama个人助手开源/仓库斯坦福推荐理由:斯坦福团队把本地AI的能效研究落地成了可用的个人助手,做边缘计算或隐私敏感应用的开发者可以直接用Ollama跑起来试试。原文
03:57Google AI Developers@googleaidevsLlamaIndex 团队基于 Google 新发布的 Agents API 构建了一个模板,该模板利用 LlamaParse 和 LiteParse 让智能体在沙箱 Linux 环境中自动处理非结构化文档。用户只需配置 Git 仓库、克隆到沙箱、安装相关 CLI 和 SDK,即可让代理自主完成文档解析与输出。这一方案解决了真实世界文档杂乱难处理的痛点,为开发者提供了可直接使用的自动化文档处理方案。相关代码已开源在 GitHub 上。AI产品智能体文档解析LlamaParseGemini API开源/仓库推荐理由:做文档解析或自动化流程的开发者可以直接用这个模板,省去从零搭建的麻烦——LlamaParse 加持的智能体在 Gemini 沙箱里跑,效果值得一试。原文