12:14berryxia@berryxia开发者用两周时间,基于Three.js和Agora实时语音AI,构建了一个可在线漫游、对话的盛唐长安城3D项目。用户可以用WASD控制角色行走,靠近李白、杜甫等NPC按E键触发语音对话,NPC拥有独立性格和音色。项目还包含飞花令、猜谜等唐风小游戏,以及珍宝馆、AI展馆等互动场景。代码已全开源在GitHub,前端使用Three.js,后端为FastAPI,普通用户可直接在线体验,开发者也可复刻学习。AI产品Three.js实时语音AI数字文旅开源/仓库NPC对话1 个信源在谈推荐理由:这个项目把历史文化和AI能力巧妙融合,做3D互动或数字文旅的开发者可以直接参考开源代码复刻,想体验AI语音对话的普通用户也能在线玩,值得一试。原文
11:25elvis@omarsar0MiniMax 即将发布其新一代模型 M3,目前已在 OpenCode 平台上开放免费试用。AI 研究员 Omar 表示将使用自己的编码代理和测试框架对 M3 进行深度测试,并计划发布评测。这一消息引发了社区关注,已有近 3000 次浏览。M3 的发布可能为编程助手和智能体领域带来新的选择。AI模型MiniMaxM3编程助手智能体开源/仓库推荐理由:MiniMax M3 即将上线,做 AI 编程和智能体开发的团队可以趁免费期在 OpenCode 上抢先体验,看看它能否成为你工作流中的新利器。原文
09:41elvis@omarsar0知名 YouTuber PewDiePie 正在构建自己的智能体编排器并计划开源。这一举动出乎意料,表明即使是内容创作者也能轻松掌握智能体开发的核心技术。PewDiePie 强调“拥有智能体,拥有工具链”,鼓励更多人参与智能体生态建设。该消息在社交媒体上引发热议,展示了 AI 工具民主化的趋势。AI产品智能体开源/仓库PewDiePie编排器AI 工具民主化推荐理由:PewDiePie 亲自下场做智能体编排器,说明 AI 工具的门槛正在降低——做内容创作或独立开发的你,也可以像他一样自己造轮子,值得关注。原文
09:37elvis@omarsar0精选一位用户在 X 上分享使用 DeepSeek-v4-flash 的体验,称已花费数亿 token(约 10 美元),效果令人印象深刻。他将其用于自建编程智能体的自我改进,认为表现非常出色。该模型以极低的价格提供了高质量的性能,尤其适合需要大量 token 的开发者。更多细节将在后续分享。AI模型DeepSeek-v4-flash编程助手智能体性价比开源/仓库1 个信源在谈推荐理由:DeepSeek-v4-flash 以极低成本(百万 token 约 10 美元)实现高质量代码生成,做智能体或编程工具的开发者值得一试,性价比远超同类模型。原文
09:24Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在 X 上呼吁更多人公开分享编程和智能体追踪数据,以构建更好的数据集和开源模型。他指出已有不少人贡献,鼓励大家也分享自己的数据。同时,Simon Willison 抱怨 OpenAI 的 Codex Desktop 在更新中移除了“Copy as Markdown”功能,该功能曾是他最喜欢的导出完整聊天记录的方式。这一变化引发了对数据共享和工具可用性的讨论。公开分享追踪数据有助于推动开源模型进步,但工具功能的移除可能影响开发者体验。行业开源/仓库编程助手数据共享智能体OpenAI Codex10 个信源在谈推荐理由:如果你在训练或使用开源编程模型,公开分享追踪数据能直接提升数据集质量,Hugging Face 的号召值得响应。做 AI 编程工具的团队也能从中获得更丰富的训练素材。原文
08:33berryxia@berryxia一条推文指出,许多每月付费的AI工具、Bloomberg终端、交易系统等,本质是资本维持稳定收入的机制。GitHub上已有10个开源项目可替代这些付费产品,涵盖对冲基金、交易系统、金融终端、AI聊天、视频工作室、虚拟主播、广告生成、邮件管理、浏览器和视频制作。这些项目免费、功能强大、支持自托管,让用户完全掌握数据和控制权。例如,Fincept Terminal可替代Bloomberg,LibreChat可自托管多模型AI聊天,Open Higgsfield AI集成多种图像和视频生成模型。AI产品开源/仓库金融工具AI聊天视频生成自托管推荐理由:想省掉每月订阅费、又不想被厂商锁定的开发者和金融从业者,这10个开源项目直接给你机构级工具,建议收藏试玩。原文
09:36宝玉@dotey精选Matt Pocock 开源了 Sandcastle,一个用 TypeScript 脚本编排多个 AI Agent(如 Codex、Claude Code、Cursor、GitHub Copilot)协同工作的工具。它允许用户定义工作流,让不同 Agent 在虚拟机中依次或并行执行任务,例如让多个 Agent 分别生成技术方案并相互评分。该工具适合追求极致自动化的极客场景,但对普通用户门槛较高。AI产品智能体MCP/工具开源/仓库编程助手工作流编排6 个信源在谈推荐理由:多 Agent 编排是提升 AI 协作效率的关键,做复杂自动化或赛博养蛊的开发者可以直接试试这个开源方案。原文
05:07AI Notkilleveryone@ai_zona精选83°Model Context Protocol (MCP) 正式被 Linux 基金会采纳为标准,为 AI 智能体连接工具和数据提供统一协议。该协议标准化了智能体与外部工具的交互方式,支持跨不同大语言模型提供商使用。AIZona ADK 已原生支持 MCP,开发者可通过单一注册中心管理所有工具,实现任意模型调用。这标志着 AI 智能体生态向互操作性迈出关键一步。行业MCP/工具智能体开源/仓库标准协议AIZona ADK推荐理由:MCP 成为 Linux 基金会标准解决了 AI 智能体工具连接碎片化问题,做智能体开发的团队可以直接用统一协议对接工具,建议关注并尝试集成。原文
01:42Clement Delangue@ClementDelangueAI安全研究所(AISecurityInst)在Hugging Face上公开发布了其评估工具、数据集和模型,旨在促进AI安全研究的透明度和可复现性。这一举措允许全球研究人员审查、复现并基于这些资源进行开发,打破了AI安全研究封闭进行的传统。开源这些关键资源有助于加速AI安全领域的进展,并增强公众对AI系统的信任。AI产品AI安全开源/仓库评估工具数据集Hugging Face推荐理由:AI安全研究终于走向开放,做AI安全评估和模型审计的团队可以直接复用这些资源,建议点开看看具体有哪些工具和数据集。原文
00:18Jerry Liu@jerryjliu0精选LlamaIndex 创始人 Jerry Liu 宣布推出 LiteParse v2,用 Rust 完全重写,成为全球最快的 PDF 解析器。它基于网格投影算法,无需 LLM 即可将复杂页面布局(含文本和表格)转换为结构清晰的文本,支持 50+ 文档类型,可直接在 AI Agent 中使用。相比 pymupdf、pypdf 等开源方案,LiteParse v2 在速度和准确性上均占优。核心步骤包括文本行分组、锚点识别、对齐渲染等,详情可查看官方博客。AI产品PDF 解析RustLlamaIndex开源/仓库AI Agent3 个信源在谈推荐理由:LiteParse v2 解决了 PDF 解析慢、依赖大模型的痛点,做文档处理或 AI Agent 的开发者可以直接用,速度比同类快一个量级。原文
23:59Harrison Chase@hwchase17LangChain 宣布与 GEPA 集成,用户现在可以优化 LangChain 链的性能。GEPA 是一个用于优化 AI 工作流的工具,此次集成由开发者 @bryonkuchML 贡献的 PR 实现。该集成允许开发者通过 GEPA 的文档教程,轻松优化 LangChain 链,提升效率。这对于使用 LangChain 构建复杂 AI 应用的团队来说,是一个重要的性能优化手段。AI产品LangChainGEPA性能优化AI工作流开源/仓库推荐理由:LangChain 用户现在可以直接用 GEPA 优化链性能,省去手动调优的麻烦,做 AI 工作流的开发者值得一试。原文
23:57Geek@geekbb精选开发者 Nazzareno Giannelli 发布了一个基于 Bun、OpenTUI 和 SolidJS 构建的终端仪表盘项目,能够在 TUI(终端用户界面)中统一管理看板任务、日程安排和 Claude Code 代理会话。该项目将多种开发工作流集成到一个终端界面中,减少了上下文切换。对于频繁使用终端和 Claude Code 的开发者来说,这是一个提升效率的新工具。项目已在 GitHub 开源,可直接使用或二次开发。AI产品终端仪表盘TUIClaude CodeBun开源/仓库推荐理由:终端重度用户和 Claude Code 爱好者终于可以告别多窗口切换——这个开源仪表盘把看板、日历和 AI 代理会话塞进一个 TUI,做全栈开发的建议直接 clone 试试。原文
22:27AI Notkilleveryone@ai_zona@aizonaai 发布了开源AI智能体治理工具 @aizonaai/adk,采用MIT许可证。该项目强调透明性、社区协作和可审计性,旨在解决AI治理中的黑箱问题。通过开源,社区可以发现边缘案例并建立信任。开发者可以自由fork、贡献和审计代码。AI产品开源/仓库AI治理智能体透明性MIT许可推荐理由:AI治理的透明化是行业痛点,做AI安全或合规的团队可以直接参与审计和贡献,避免黑箱风险。原文
16:52elvis@omarsar0精选一位开发者预言,未来几个月人们将意识到 MCP(模型上下文协议)对智能体的根本重要性。MCP 的价值不仅在于连接工具,更在于它启用的抽象能力,例如通过智能体间交互实现自我改进系统。该开发者的整个编排器通过 MCP 工具实现了复杂交互、版本控制、评估工作流等。他认为 MCP 协议本身对未来所有进展至关重要,且很高兴大部分是开源的。AI产品MCP/工具智能体协议开源/仓库自我改进推荐理由:MCP 正在从工具连接协议进化为智能体自我改进的基础设施,做智能体编排和自动化系统的开发者值得关注这个趋势。原文
16:18向阳乔木@vista8姚金刚老师与组织者将在今晚八点通过WaytoAGI进行GEO(生成式引擎优化)首场直播分享,讲解GEO的底层逻辑、方法、系统原理及理念。分享将涉及GEOFlow系统、元Skill、17套GEO Skill合集、41篇最新GEO/AI搜索相关论文,以及多份白皮书、红皮书、蓝皮书等资料。组织者将负责AI工具和模型的问答环节,帮助参与者理解GEO如何从SEO演进而来,以及其在AI搜索时代的重要性。行业GEOAI搜索公开课开源/仓库营销推荐理由:GEO是AI搜索时代的新营销方向,做SEO或内容营销的团队值得关注这场公开课,可以直接获取系统方法和开源资料,建议点开了解底层逻辑。原文
16:07宝玉@dotey宝玉(@dotey)对其群聊总结 Skill 进行了小功能更新,现在用户在群里 @bot 并请求总结群聊记录时,机器人能够结合聊天记录的上下文,在总结的同时回复用户的问题。该 Skill 依赖于 wx-cli 读取微信群聊数据,推荐使用 Claude Code + Claude Opus 4.6 获得最佳效果。这一更新提升了群聊助手的交互性和实用性,让总结不再只是单向输出,而是能针对性地回答用户疑问。技巧群聊总结微信机器人Claude CodeClaude Opus 4.6开源/仓库推荐理由:做微信群聊自动化或社群运营的开发者,可以试试这个 Skill——它让 bot 不仅能总结,还能结合上下文回答问题,比单纯罗列消息更实用。原文
15:34Viking@vikingmute精选72°开发者 vikingmute 开源了 review-forge,一套用于审核 AI 生成代码的流程技能。该流程包含 review、synthesize、手动决策、fix 和 verify 五个步骤,通过让 GPT-5.5、Compose2.5、DeepSeek V4 Pro 等多个模型分别生成 bug 报告,再汇总交叉验证,最后由人工决定修复哪些问题。作者认为 AI 代码产出太快,长期不干预会导致系统失控,这套流程能有效提升代码质量。项目灵感来自文章《Using AI to write better code more slowly》,旨在让 AI 写得更慢但更好。AI产品代码审核多模型开源/仓库AI 编程review-forge推荐理由:多模型交叉审核解决了 AI 代码质量失控的痛点,适合重度使用 AI 编程的团队和个人开发者,建议直接 fork 项目试试这套流程。原文
12:53Geek@geekbb精选阿里云推出 Model Studio CLI(百炼 CLI),这是一个官方命令行工具,支持与 Qwen 系列模型进行文本对话、多模态理解(图片、音频、视频)、图片与视频生成编辑、语音合成识别、知识库检索及网页搜索等功能。该工具将阿里云 AI 平台能力集成到终端,方便开发者通过命令行快速调用。项目已开源在 GitHub,适合需要自动化或脚本化调用 AI 能力的场景。AI产品阿里云百炼 CLI命令行工具多模态开源/仓库推荐理由:百炼 CLI 把阿里云的多模态和搜索能力直接搬到了命令行,做自动化脚本或需要批量调用 AI 的开发者可以省去写 API 调用的麻烦,值得一试。原文
12:43岚叔@lufzzliz一位开发者用 Opus 4.8 快速构建了一个 Mac 菜单栏小工具,可以实时查看 Claude Code 和 Codex 的缓存命中率、Token 消耗及额度使用情况。该工具零侵入,无需修改现有工作流。作者表示如果点赞或留言人数多,将开源该项目,并邀请用户提出其他想要的功能或 harnesses。AI产品Claude CodeCodexMac 工具缓存监控开源/仓库推荐理由:对于频繁使用 Claude Code 和 Codex 的开发者,这个菜单栏小工具能帮你实时掌握 API 消耗和缓存效率,避免超额。如果你也想要,不妨留言催更开源,还能定制你需要的功能。原文
12:12Google AI Developers@googleaidevs精选Eigent AI 团队在 Gemini API 上实现了 Managed Agents 功能,用于自动化审计 CI 失败。他们使用 Gemini 3.5 Flash 和 Gemini Managed Agents API,在几分钟内定位了真实 megatron-lm CI 失败的根因。工作流程包括协调代理规划审计、开发者代理加载技能并收集证据、Gemini 代理作为远程子代理进行深度推理。该方案已开源在 Eigent 平台上,展示了多代理协作在 DevOps 场景中的高效应用。AI产品智能体Gemini APICI/CD开源/仓库DevOps推荐理由:CI 失败排查是开发团队的日常痛点,Eigent 用多代理协作把根因定位从小时级压缩到分钟级,做 DevOps 或 ML 基础设施的团队值得关注这个开源方案。原文
11:35AK@_akhaliqHuggingFace 宣布其推理 API 现在支持超过 81,000 个模型,覆盖文本、图像、音频等多种模态。这意味着开发者可以直接通过 API 调用海量预训练模型,无需自行部署基础设施。这一更新大幅降低了 AI 模型的使用门槛,尤其适合快速原型开发和实验。对于需要灵活选择模型的团队来说,这是一个重要的资源整合。AI产品HuggingFace推理 API模型部署开发者工具开源/仓库推荐理由:81k 模型一键调用,省去部署烦恼——做 AI 应用开发的团队可以直接用 API 快速验证想法,值得收藏。原文
08:26Ate-a-Pi@svpino精选一个包含30个开源端到端智能体示例的仓库被分享,这些示例使用Google ADK构建,展示了复杂的工作流程。每个示例都配有完整的文档、源代码和架构图,架构图本身被认为极具价值。用户可以通过一键部署功能快速运行这些示例。该仓库适合希望学习或构建智能体应用的开发者。AI产品智能体开源/仓库Google ADK工作流开发者工具推荐理由:做智能体开发的团队可以直接复用这些成熟的工作流模板,架构图能帮你省下大量设计时间,建议收藏。原文
04:58ollama@ollamaOpenJarvis 是一个由斯坦福大学 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI,现已支持通过 Ollama 运行。该项目属于“Intelligence Per Watt”研究的一部分,旨在探索高效的本地AI方案。OpenJarvis 强调在本地设备上运行,无需依赖云端,从而保护用户隐私并降低延迟。对于关注本地AI部署和隐私保护的开发者来说,这是一个值得尝试的新工具。AI产品本地AIOllama个人助手开源/仓库斯坦福推荐理由:斯坦福团队把本地AI的能效研究落地成了可用的个人助手,做边缘计算或隐私敏感应用的开发者可以直接用Ollama跑起来试试。原文
03:57Google AI Developers@googleaidevsLlamaIndex 团队基于 Google 新发布的 Agents API 构建了一个模板,该模板利用 LlamaParse 和 LiteParse 让智能体在沙箱 Linux 环境中自动处理非结构化文档。用户只需配置 Git 仓库、克隆到沙箱、安装相关 CLI 和 SDK,即可让代理自主完成文档解析与输出。这一方案解决了真实世界文档杂乱难处理的痛点,为开发者提供了可直接使用的自动化文档处理方案。相关代码已开源在 GitHub 上。AI产品智能体文档解析LlamaParseGemini API开源/仓库推荐理由:做文档解析或自动化流程的开发者可以直接用这个模板,省去从零搭建的麻烦——LlamaParse 加持的智能体在 Gemini 沙箱里跑,效果值得一试。原文
21:52Geek@geekbbExort 是一个基于 Electron 的桌面应用,内置 OpenCode,为嵌入式开发提供集成 AI 编码代理的工作区。它支持 Arduino、ESP32、RP2040 等单片机,能帮助开发者写代码、编译、烧录,并直接查看串口日志和绘制波形图。该项目在 GitHub 上开源,旨在简化嵌入式开发流程,提升效率。AI产品嵌入式开发AI 编码代理开源/仓库ArduinoESP32推荐理由:嵌入式开发者终于有了一个集成 AI 的桌面工具——Exort 把写代码、编译、烧录、看日志全串起来了,做单片机开发的可以直接试试这个开源项目。原文
15:23Geek@geekbbSkillsGate 是一个可视化的 AI Agent 技能管理器,支持桌面应用和终端 UI,可统一管理 20 多种 Agent 的 91000 多个技能。用户只需搜索即可安装技能,无需再到 GitHub 手动查找 markdown 文件。该项目旨在解决技能分散、安装繁琐的问题,提升 Agent 技能管理的效率。目前已在 GitHub 开源,适合频繁使用多种 AI Agent 的开发者。AI产品AI Agent技能管理器开源/仓库桌面应用终端 UI推荐理由:做 AI Agent 开发或重度使用多 Agent 的团队,终于不用在 GitHub 翻 markdown 文件了——SkillsGate 让技能安装像 App Store 一样简单,值得一试。原文
14:36阶跃星辰 Stepfun@Stepfun_AI88°阶跃星辰发布了 Step 3.7 Flash 模型,专注于智能体效率,在 ClawEval-1.1、SimpleVQA Search 等基准测试中取得领先成绩。该模型采用 198B 稀疏 MoE 架构,约 11B 活跃参数,支持 400 TPS 推理速度和 256K 上下文,并提供三种推理级别。它擅长理解 UI、图表、文档和图像,并能直接编写代码或调用工具执行操作,在 τ²-bench 上工具调用可靠性超过 98%。模型权重以 Apache 2.0 开源,可在 Mac Studio M4 Max、DGX Spark 等设备本地运行,并兼容 Claude Code、MCP 等生态。AI模型阶跃星辰Step 3.7 Flash智能体开源/仓库推理模型2 个信源在谈推荐理由:做智能体、编程或搜索应用的开发者终于有了一个兼顾速度、成本和可靠性的开源模型——Step 3.7 Flash 在工具调用和视觉理解上表现突出,而且能在本地跑,建议直接试试。原文
14:34阶跃星辰 Stepfun@Stepfun_AIStepFun 宣布其模型获得 vLLM 的 Day-0 支持,这意味着新模型发布当天即可在 vLLM 推理框架中使用。vLLM 是流行的开源大模型推理引擎,支持高效部署。这一合作让开发者能更快地使用 StepFun 模型进行推理和部署。感谢 vLLM 项目的贡献。AI产品vLLMStepFun推理引擎开源/仓库模型部署推荐理由:vLLM 的 Day-0 支持意味着 StepFun 模型发布即可用,做模型推理部署的团队可以省去等待适配的时间,建议关注。原文
12:15OpenRouter@OpenRouterAI精选76°StepFun 发布了 Step 3.7 Flash 模型,这是一款面向智能体、编码、搜索和多模态工作流的高效模型。该模型采用 198B 稀疏 MoE 架构,仅激活约 11B 参数,支持 256K 上下文和三种推理级别,推理速度达 400 TPS。在 ClawEval-1.1、SimpleVQA Search 和 SWE-PRO 等基准测试中表现领先,并支持视觉理解、工具调用和本地运行。模型权重以 Apache 2.0 开源,可在 Mac Studio、DGX Spark 等设备上运行。AI模型智能体推理模型开源/仓库编程助手多模态推荐理由:Step 3.7 Flash 解决了智能体场景中速度与可靠性的平衡问题,做智能体开发、编码自动化和多模态应用的团队可以直接用开源权重部署,值得一试。原文
11:42Ate-a-Pi@svpino精选一个名为“self-improving agents”的开源框架允许智能体修改自身的三个核心部分:执行环境(harness)、底层模型权重和记忆层。这些智能体通过自我评估并根据表现进行适应,实现了自我改进。在MLE-Bench基准测试中,该框架超越了MLEvolve、AIRA-dojo等其他自我改进方案,甚至击败了Karpathy的autoresearcher。这标志着智能体自主进化能力的重要突破,为AI系统的持续优化提供了新思路。AI模型智能体自我改进开源/仓库MLE-BenchKarpathy推荐理由:对于研究智能体自主进化的开发者,这个框架展示了如何让AI通过自我修改实现性能跃升,值得直接尝试复现。原文
08:17Patrick Loeber@patloeber在Tech Europe举办的Applied AI大会上,Patrick Loeber与同事Lucia分享了如何规模化降低AI成本的策略,涵盖缓存、批量API和灵活层级等实用方法。演讲现场座无虚席,受到广泛关注。演讲者已将演示代码开源至GitHub,方便开发者直接参考使用。这些策略帮助团队在保持AI性能的同时显著降低调用成本,适合正在优化AI服务成本的工程团队。行业AI成本优化缓存批量API开源/仓库Tech Europe推荐理由:做AI应用开发的团队,缓存和批量API是降本最直接的手段,建议直接看GitHub上的demo代码,能省不少钱。原文
08:14Jerry Liu@jerryjliu0精选LlamaIndex 发布了 LiteParse v2,号称是世界上最快的 PDF 解析器,同时保持高精度。团队用 Rust 重写了整个库,并适配为 Python 和 Node 原生包。在 LLM QA 任务基准测试中,LiteParse 与 pdftotext 并列准确率第一,但速度更快;PyMuPDF 延迟接近,但在处理多栏、表格等复杂布局时表现不佳。LiteParse 还支持 50 多种文档格式(包括 .docx、.pptx、.xlsx),并提供 OCR 和截图工具,可直接在 AI Agent 中使用。AI产品PDF解析Rust开源/仓库LlamaIndex文档处理5 个信源在谈推荐理由:做 RAG 或文档处理的团队终于有了一个又快又准的开源选择——LiteParse 在速度和准确率上双杀现有方案,建议做 PDF 解析的开发者直接试。原文
03:00rohanpaul_ai@rohanpaul_ai78°Hexo AI 发布了开源递归自我改进框架 SIA(Self Improving AI),该框架允许 AI 智能体在完成任务后,不仅改进外部工作流程(如提示词、工具),还能直接更新模型内部权重,实现真正的自我进化。与当前大多数“冻结工人”式智能体不同,SIA 通过反复训练自身任务反馈来积累领域知识,无需人工手动编码策略。实验结果显示,SIA 在 LawBench 上提升 56.6%,GPU 内核运行时减少 91.9%,单细胞 RNA 去噪提升 502%。这一突破为构建持续自优化的 AI 系统提供了新路径。AI模型递归自我改进开源/仓库智能体模型权重更新SIA1 个信源在谈推荐理由:做 AI 智能体开发的团队终于有了一个能自我进化的开源框架——SIA 让模型从“冻结工人”变成“持续学习者”,直接提升任务效果,建议研究自优化系统的开发者点开看看。原文
01:48NVIDIA AI@NVIDIAAINVIDIA 宣布在其开源模型系列中采用 Linux 基金会的 OpenMDW 框架,旨在简化并统一模型、代码、文档和数据的许可协议。OpenMDW-1.1 是一个专为 AI 模型设计的宽松、统一的法律框架,可减少开发者和企业使用开源 AI 时的法律摩擦。该框架将应用于 Cosmos、Isaac GR00T、Ising 和 Nemotron 等模型系列。此举有望推动 AI 开源生态的标准化,降低合规成本。行业开源/仓库许可协议NVIDIAOpenMDWLinux 基金会4 个信源在谈推荐理由:NVIDIA 带头统一开源模型许可,解决了 AI 开发者最头疼的许可证碎片化问题。做模型部署或企业级 AI 应用的团队,建议关注 OpenMDW 框架,能省去不少法务沟通成本。原文
22:11Julien Chaumond@julien_cJasper AI 发布了 MONET 数据集,包含 1.05 亿个经过去重和重新标注的图像-文本对,采用 Apache 2.0 开源许可,是目前最大的开放许可文生图数据集之一。该数据集托管在 Hugging Face 上,旨在推动可复现的文生图研究。同时,Jasper 还开源了 Nano T2I 代码库,帮助开发者训练自己的文生图模型。这一发布解决了开源文生图领域缺乏大规模、高质量、可复现数据集的问题。AI产品文生图数据集开源/仓库Hugging FaceJasper推荐理由:做文生图研究的团队终于有了一个大规模、去重、重新标注的开源数据集,可以直接用于训练和复现实验,建议点开看看数据集和代码库。原文
17:45向阳乔木@vista8一条推文推荐了 GitHub 上 zeke/agents.md 项目,该项目展示了如何编写 agent.md 文件。agent.md 是用于定义 AI 智能体行为、目标和上下文的配置文件,类似于 AI 的“说明书”。该写法清晰、结构化,适合开发者参考来构建自己的 AI 智能体。对于正在学习或开发 AI 智能体的团队,这是一个实用的模板。AI产品智能体agent.md开源/仓库配置模板开发者推荐理由:做 AI 智能体开发的团队可以直接参考这个 agent.md 写法,省去自己摸索配置格式的时间,建议点开看看。原文
10:08Greg Brockman@gdbSimon Smith 开发了一个 Codex 技能,利用 GPT Realtime Whisper 端点实现会议实时转录,并允许用户随时向 Codex 提问关于会议内容的问题。转录过程在预览窗格中实时显示,会议结束后可获取完整转录和格式化版本。该功能使用实时端点,成本为每分钟 0.017 美元(30 分钟会议约 0.51 美元),比会后转录更贵。Smith 计划未来加入本地实时转录选项,如使用 Nemotron Speech Streaming。相关代码和说明已发布在 GitHub。AI产品Codex实时转录会议助手GPT Realtime Whisper开源/仓库推荐理由:对于需要实时记录和检索会议内容的团队,这个 Codex 技能直接解决了「边开会边提问」的痛点,做会议自动化或知识管理的开发者可以试试这个开源方案。原文
09:49LangChain@LangChainAI精选LangChain 发布了 LangSmith Context Hub,为团队和 Agent 提供统一的上下文存储、编辑、版本管理和检索能力。该工具支持技能、AGENTS.md 文件及其他 Markdown 文件的集中管理。视频详细解释了上下文的重要性、Context Hub 的优势以及如何在 Agent 中使用它。配套的 GitHub 示例代码可供开发者直接参考。AI产品LangSmithContext HubAgent上下文管理开源/仓库推荐理由:做 Agent 开发的团队终于有了正经的上下文管理方案——Context Hub 解决了多 Agent 协作时上下文碎片化的问题,建议做 AI 应用架构的开发者点开视频看看。原文
04:59Jerry Liu@jerryjliu0LlamaIndex 团队推出了 LiteParse v2,一个用 Rust 完全重写的 PDF 解析器,号称是目前最快且最准确的开源无模型解析器。相比 pymupdf、pypdf 等工具,速度提升最高达 100 倍,支持 50 多种文档格式。它提供 Python、Node.js 原生包以及 WASM 版本,可在浏览器和边缘环境运行,还能直接集成到 AI Agent 中使用。项目已在 GitHub 开源,适合需要高效文档解析的 AI 应用开发者。AI产品LlamaIndexLiteParsePDF 解析Rust开源/仓库7 个信源在谈推荐理由:做 RAG 或文档处理的团队终于有了一个又快又准的开源解析器——LiteParse v2 用 Rust 重写后速度提升 100 倍,还支持 50+ 格式和 WASM 边缘部署,建议直接替换掉 pymupdf 试试。原文
04:56宝玉@doteyRepoPrompt 是一款将整个代码仓库拼接成 XML 文本的工具,方便发送给支持长上下文的 AI 模型(如 Gemini 2、Claude 3.5、o1 pro)。其作者已被 OpenAI 招安,软件现已免费,并计划开源。此前付费用户将获得 Codex Credits 作为补偿。该工具目前仅支持 Mac 平台,可选择性包含部分文件。这一变化意味着开发者可以免费使用该工具,并期待其开源后的社区贡献。AI产品RepoPrompt开源/仓库AI编程助手长上下文OpenAI10 个信源在谈推荐理由:RepoPrompt 解决了将整个代码仓库高效喂给大模型的痛点,做 AI 编程或代码审查的开发者现在可以免费使用,而且即将开源,值得关注后续社区版本。原文