全部 AI 动态 · AI 热点

6月1日

12:14

berryxia@berryxia

开发者用两周时间，基于Three.js和Agora实时语音AI，构建了一个可在线漫游、对话的盛唐长安城3D项目。用户可以用WASD控制角色行走，靠近李白、杜甫等NPC按E键触发语音对话，NPC拥有独立性格和音色。项目还包含飞花令、猜谜等唐风小游戏，以及珍宝馆、AI展馆等互动场景。代码已全开源在GitHub，前端使用Three.js，后端为FastAPI，普通用户可直接在线体验，开发者也可复刻学习。

AI产品 Three.js 实时语音AI 数字文旅开源/仓库 NPC对话

推荐理由：这个项目把历史文化和AI能力巧妙融合，做3D互动或数字文旅的开发者可以直接参考开源代码复刻，想体验AI语音对话的普通用户也能在线玩，值得一试。

原文

11:25

elvis@omarsar0

MiniMax 即将发布其新一代模型 M3，目前已在 OpenCode 平台上开放免费试用。AI 研究员 Omar 表示将使用自己的编码代理和测试框架对 M3 进行深度测试，并计划发布评测。这一消息引发了社区关注，已有近 3000 次浏览。M3 的发布可能为编程助手和智能体领域带来新的选择。

AI模型 MiniMax M3 编程助手智能体开源/仓库

推荐理由：MiniMax M3 即将上线，做 AI 编程和智能体开发的团队可以趁免费期在 OpenCode 上抢先体验，看看它能否成为你工作流中的新利器。

原文

09:41

elvis@omarsar0

知名 YouTuber PewDiePie 正在构建自己的智能体编排器并计划开源。这一举动出乎意料，表明即使是内容创作者也能轻松掌握智能体开发的核心技术。PewDiePie 强调“拥有智能体，拥有工具链”，鼓励更多人参与智能体生态建设。该消息在社交媒体上引发热议，展示了 AI 工具民主化的趋势。

AI产品智能体开源/仓库 PewDiePie 编排器 AI 工具民主化

推荐理由：PewDiePie 亲自下场做智能体编排器，说明 AI 工具的门槛正在降低——做内容创作或独立开发的你，也可以像他一样自己造轮子，值得关注。

原文

09:37

elvis@omarsar0

精选

一位用户在 X 上分享使用 DeepSeek-v4-flash 的体验，称已花费数亿 token（约 10 美元），效果令人印象深刻。他将其用于自建编程智能体的自我改进，认为表现非常出色。该模型以极低的价格提供了高质量的性能，尤其适合需要大量 token 的开发者。更多细节将在后续分享。

AI模型 DeepSeek-v4-flash 编程助手智能体性价比开源/仓库

推荐理由：DeepSeek-v4-flash 以极低成本（百万 token 约 10 美元）实现高质量代码生成，做智能体或编程工具的开发者值得一试，性价比远超同类模型。

原文

09:24

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 在 X 上呼吁更多人公开分享编程和智能体追踪数据，以构建更好的数据集和开源模型。他指出已有不少人贡献，鼓励大家也分享自己的数据。同时，Simon Willison 抱怨 OpenAI 的 Codex Desktop 在更新中移除了“Copy as Markdown”功能，该功能曾是他最喜欢的导出完整聊天记录的方式。这一变化引发了对数据共享和工具可用性的讨论。公开分享追踪数据有助于推动开源模型进步，但工具功能的移除可能影响开发者体验。

行业开源/仓库编程助手数据共享智能体 OpenAI Codex

推荐理由：如果你在训练或使用开源编程模型，公开分享追踪数据能直接提升数据集质量，Hugging Face 的号召值得响应。做 AI 编程工具的团队也能从中获得更丰富的训练素材。

原文

08:33

berryxia@berryxia

一条推文指出，许多每月付费的AI工具、Bloomberg终端、交易系统等，本质是资本维持稳定收入的机制。GitHub上已有10个开源项目可替代这些付费产品，涵盖对冲基金、交易系统、金融终端、AI聊天、视频工作室、虚拟主播、广告生成、邮件管理、浏览器和视频制作。这些项目免费、功能强大、支持自托管，让用户完全掌握数据和控制权。例如，Fincept Terminal可替代Bloomberg，LibreChat可自托管多模型AI聊天，Open Higgsfield AI集成多种图像和视频生成模型。

AI产品开源/仓库金融工具 AI聊天视频生成自托管

推荐理由：想省掉每月订阅费、又不想被厂商锁定的开发者和金融从业者，这10个开源项目直接给你机构级工具，建议收藏试玩。

原文

5月31日

09:36

宝玉@dotey

精选

Matt Pocock 开源了 Sandcastle，一个用 TypeScript 脚本编排多个 AI Agent（如 Codex、Claude Code、Cursor、GitHub Copilot）协同工作的工具。它允许用户定义工作流，让不同 Agent 在虚拟机中依次或并行执行任务，例如让多个 Agent 分别生成技术方案并相互评分。该工具适合追求极致自动化的极客场景，但对普通用户门槛较高。

AI产品智能体 MCP/工具开源/仓库编程助手工作流编排

推荐理由：多 Agent 编排是提升 AI 协作效率的关键，做复杂自动化或赛博养蛊的开发者可以直接试试这个开源方案。

原文

05:07

AI Notkilleveryone@ai_zona

精选83°

Model Context Protocol (MCP) 正式被 Linux 基金会采纳为标准，为 AI 智能体连接工具和数据提供统一协议。该协议标准化了智能体与外部工具的交互方式，支持跨不同大语言模型提供商使用。AIZona ADK 已原生支持 MCP，开发者可通过单一注册中心管理所有工具，实现任意模型调用。这标志着 AI 智能体生态向互操作性迈出关键一步。

行业 MCP/工具智能体开源/仓库标准协议 AIZona ADK

推荐理由：MCP 成为 Linux 基金会标准解决了 AI 智能体工具连接碎片化问题，做智能体开发的团队可以直接用统一协议对接工具，建议关注并尝试集成。

原文

01:42

Clement Delangue@ClementDelangue

AI安全研究所（AISecurityInst）在Hugging Face上公开发布了其评估工具、数据集和模型，旨在促进AI安全研究的透明度和可复现性。这一举措允许全球研究人员审查、复现并基于这些资源进行开发，打破了AI安全研究封闭进行的传统。开源这些关键资源有助于加速AI安全领域的进展，并增强公众对AI系统的信任。

AI产品 AI安全开源/仓库评估工具数据集 Hugging Face

推荐理由：AI安全研究终于走向开放，做AI安全评估和模型审计的团队可以直接复用这些资源，建议点开看看具体有哪些工具和数据集。

原文

00:18

Jerry Liu@jerryjliu0

精选

LlamaIndex 创始人 Jerry Liu 宣布推出 LiteParse v2，用 Rust 完全重写，成为全球最快的 PDF 解析器。它基于网格投影算法，无需 LLM 即可将复杂页面布局（含文本和表格）转换为结构清晰的文本，支持 50+ 文档类型，可直接在 AI Agent 中使用。相比 pymupdf、pypdf 等开源方案，LiteParse v2 在速度和准确性上均占优。核心步骤包括文本行分组、锚点识别、对齐渲染等，详情可查看官方博客。

AI产品 PDF 解析 Rust LlamaIndex 开源/仓库 AI Agent

推荐理由：LiteParse v2 解决了 PDF 解析慢、依赖大模型的痛点，做文档处理或 AI Agent 的开发者可以直接用，速度比同类快一个量级。

原文

5月30日

23:59

Harrison Chase@hwchase17

LangChain 宣布与 GEPA 集成，用户现在可以优化 LangChain 链的性能。GEPA 是一个用于优化 AI 工作流的工具，此次集成由开发者 @bryonkuchML 贡献的 PR 实现。该集成允许开发者通过 GEPA 的文档教程，轻松优化 LangChain 链，提升效率。这对于使用 LangChain 构建复杂 AI 应用的团队来说，是一个重要的性能优化手段。

AI产品 LangChain GEPA 性能优化 AI工作流开源/仓库

推荐理由：LangChain 用户现在可以直接用 GEPA 优化链性能，省去手动调优的麻烦，做 AI 工作流的开发者值得一试。

原文

23:57

Geek@geekbb

精选

开发者 Nazzareno Giannelli 发布了一个基于 Bun、OpenTUI 和 SolidJS 构建的终端仪表盘项目，能够在 TUI（终端用户界面）中统一管理看板任务、日程安排和 Claude Code 代理会话。该项目将多种开发工作流集成到一个终端界面中，减少了上下文切换。对于频繁使用终端和 Claude Code 的开发者来说，这是一个提升效率的新工具。项目已在 GitHub 开源，可直接使用或二次开发。

AI产品终端仪表盘 TUI Claude Code Bun 开源/仓库

推荐理由：终端重度用户和 Claude Code 爱好者终于可以告别多窗口切换——这个开源仪表盘把看板、日历和 AI 代理会话塞进一个 TUI，做全栈开发的建议直接 clone 试试。

原文

22:27

AI Notkilleveryone@ai_zona

@aizonaai 发布了开源AI智能体治理工具 @aizonaai/adk，采用MIT许可证。该项目强调透明性、社区协作和可审计性，旨在解决AI治理中的黑箱问题。通过开源，社区可以发现边缘案例并建立信任。开发者可以自由fork、贡献和审计代码。

AI产品开源/仓库 AI治理智能体透明性 MIT许可

推荐理由：AI治理的透明化是行业痛点，做AI安全或合规的团队可以直接参与审计和贡献，避免黑箱风险。

原文

16:52

elvis@omarsar0

精选

一位开发者预言，未来几个月人们将意识到 MCP（模型上下文协议）对智能体的根本重要性。MCP 的价值不仅在于连接工具，更在于它启用的抽象能力，例如通过智能体间交互实现自我改进系统。该开发者的整个编排器通过 MCP 工具实现了复杂交互、版本控制、评估工作流等。他认为 MCP 协议本身对未来所有进展至关重要，且很高兴大部分是开源的。

AI产品 MCP/工具智能体协议开源/仓库自我改进

推荐理由：MCP 正在从工具连接协议进化为智能体自我改进的基础设施，做智能体编排和自动化系统的开发者值得关注这个趋势。

原文

16:18

向阳乔木@vista8

姚金刚老师与组织者将在今晚八点通过WaytoAGI进行GEO（生成式引擎优化）首场直播分享，讲解GEO的底层逻辑、方法、系统原理及理念。分享将涉及GEOFlow系统、元Skill、17套GEO Skill合集、41篇最新GEO/AI搜索相关论文，以及多份白皮书、红皮书、蓝皮书等资料。组织者将负责AI工具和模型的问答环节，帮助参与者理解GEO如何从SEO演进而来，以及其在AI搜索时代的重要性。

行业 GEO AI搜索公开课开源/仓库营销

推荐理由：GEO是AI搜索时代的新营销方向，做SEO或内容营销的团队值得关注这场公开课，可以直接获取系统方法和开源资料，建议点开了解底层逻辑。

原文

16:07

宝玉@dotey

宝玉（@dotey）对其群聊总结 Skill 进行了小功能更新，现在用户在群里 @bot 并请求总结群聊记录时，机器人能够结合聊天记录的上下文，在总结的同时回复用户的问题。该 Skill 依赖于 wx-cli 读取微信群聊数据，推荐使用 Claude Code + Claude Opus 4.6 获得最佳效果。这一更新提升了群聊助手的交互性和实用性，让总结不再只是单向输出，而是能针对性地回答用户疑问。

技巧群聊总结微信机器人 Claude Code Claude Opus 4.6 开源/仓库

推荐理由：做微信群聊自动化或社群运营的开发者，可以试试这个 Skill——它让 bot 不仅能总结，还能结合上下文回答问题，比单纯罗列消息更实用。

原文

15:34

Viking@vikingmute

精选72°

开发者 vikingmute 开源了 review-forge，一套用于审核 AI 生成代码的流程技能。该流程包含 review、synthesize、手动决策、fix 和 verify 五个步骤，通过让 GPT-5.5、Compose2.5、DeepSeek V4 Pro 等多个模型分别生成 bug 报告，再汇总交叉验证，最后由人工决定修复哪些问题。作者认为 AI 代码产出太快，长期不干预会导致系统失控，这套流程能有效提升代码质量。项目灵感来自文章《Using AI to write better code more slowly》，旨在让 AI 写得更慢但更好。

AI产品代码审核多模型开源/仓库 AI 编程 review-forge

推荐理由：多模型交叉审核解决了 AI 代码质量失控的痛点，适合重度使用 AI 编程的团队和个人开发者，建议直接 fork 项目试试这套流程。

原文

12:53

Geek@geekbb

精选

阿里云推出 Model Studio CLI（百炼 CLI），这是一个官方命令行工具，支持与 Qwen 系列模型进行文本对话、多模态理解（图片、音频、视频）、图片与视频生成编辑、语音合成识别、知识库检索及网页搜索等功能。该工具将阿里云 AI 平台能力集成到终端，方便开发者通过命令行快速调用。项目已开源在 GitHub，适合需要自动化或脚本化调用 AI 能力的场景。

AI产品阿里云百炼 CLI 命令行工具多模态开源/仓库

推荐理由：百炼 CLI 把阿里云的多模态和搜索能力直接搬到了命令行，做自动化脚本或需要批量调用 AI 的开发者可以省去写 API 调用的麻烦，值得一试。

原文

12:43

岚叔@lufzzliz

一位开发者用 Opus 4.8 快速构建了一个 Mac 菜单栏小工具，可以实时查看 Claude Code 和 Codex 的缓存命中率、Token 消耗及额度使用情况。该工具零侵入，无需修改现有工作流。作者表示如果点赞或留言人数多，将开源该项目，并邀请用户提出其他想要的功能或 harnesses。

AI产品 Claude Code Codex Mac 工具缓存监控开源/仓库

推荐理由：对于频繁使用 Claude Code 和 Codex 的开发者，这个菜单栏小工具能帮你实时掌握 API 消耗和缓存效率，避免超额。如果你也想要，不妨留言催更开源，还能定制你需要的功能。

原文

12:12

Google AI Developers@googleaidevs

精选

Eigent AI 团队在 Gemini API 上实现了 Managed Agents 功能，用于自动化审计 CI 失败。他们使用 Gemini 3.5 Flash 和 Gemini Managed Agents API，在几分钟内定位了真实 megatron-lm CI 失败的根因。工作流程包括协调代理规划审计、开发者代理加载技能并收集证据、Gemini 代理作为远程子代理进行深度推理。该方案已开源在 Eigent 平台上，展示了多代理协作在 DevOps 场景中的高效应用。

AI产品智能体 Gemini API CI/CD 开源/仓库 DevOps

推荐理由：CI 失败排查是开发团队的日常痛点，Eigent 用多代理协作把根因定位从小时级压缩到分钟级，做 DevOps 或 ML 基础设施的团队值得关注这个开源方案。

原文

11:35

AK@_akhaliq

HuggingFace 宣布其推理 API 现在支持超过 81,000 个模型，覆盖文本、图像、音频等多种模态。这意味着开发者可以直接通过 API 调用海量预训练模型，无需自行部署基础设施。这一更新大幅降低了 AI 模型的使用门槛，尤其适合快速原型开发和实验。对于需要灵活选择模型的团队来说，这是一个重要的资源整合。

AI产品 HuggingFace 推理 API 模型部署开发者工具开源/仓库

推荐理由：81k 模型一键调用，省去部署烦恼——做 AI 应用开发的团队可以直接用 API 快速验证想法，值得收藏。

原文

08:26

Ate-a-Pi@svpino

精选

一个包含30个开源端到端智能体示例的仓库被分享，这些示例使用Google ADK构建，展示了复杂的工作流程。每个示例都配有完整的文档、源代码和架构图，架构图本身被认为极具价值。用户可以通过一键部署功能快速运行这些示例。该仓库适合希望学习或构建智能体应用的开发者。

AI产品智能体开源/仓库 Google ADK 工作流开发者工具

推荐理由：做智能体开发的团队可以直接复用这些成熟的工作流模板，架构图能帮你省下大量设计时间，建议收藏。

原文

04:58

ollama@ollama

OpenJarvis 是一个由斯坦福大学 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI，现已支持通过 Ollama 运行。该项目属于“Intelligence Per Watt”研究的一部分，旨在探索高效的本地AI方案。OpenJarvis 强调在本地设备上运行，无需依赖云端，从而保护用户隐私并降低延迟。对于关注本地AI部署和隐私保护的开发者来说，这是一个值得尝试的新工具。

AI产品本地AI Ollama 个人助手开源/仓库斯坦福

推荐理由：斯坦福团队把本地AI的能效研究落地成了可用的个人助手，做边缘计算或隐私敏感应用的开发者可以直接用Ollama跑起来试试。

原文

03:57

Google AI Developers@googleaidevs

LlamaIndex 团队基于 Google 新发布的 Agents API 构建了一个模板，该模板利用 LlamaParse 和 LiteParse 让智能体在沙箱 Linux 环境中自动处理非结构化文档。用户只需配置 Git 仓库、克隆到沙箱、安装相关 CLI 和 SDK，即可让代理自主完成文档解析与输出。这一方案解决了真实世界文档杂乱难处理的痛点，为开发者提供了可直接使用的自动化文档处理方案。相关代码已开源在 GitHub 上。

AI产品智能体文档解析 LlamaParse Gemini API 开源/仓库

推荐理由：做文档解析或自动化流程的开发者可以直接用这个模板，省去从零搭建的麻烦——LlamaParse 加持的智能体在 Gemini 沙箱里跑，效果值得一试。

原文

5月29日

21:52

Geek@geekbb

Exort 是一个基于 Electron 的桌面应用，内置 OpenCode，为嵌入式开发提供集成 AI 编码代理的工作区。它支持 Arduino、ESP32、RP2040 等单片机，能帮助开发者写代码、编译、烧录，并直接查看串口日志和绘制波形图。该项目在 GitHub 上开源，旨在简化嵌入式开发流程，提升效率。

AI产品嵌入式开发 AI 编码代理开源/仓库 Arduino ESP32

推荐理由：嵌入式开发者终于有了一个集成 AI 的桌面工具——Exort 把写代码、编译、烧录、看日志全串起来了，做单片机开发的可以直接试试这个开源项目。

原文

15:23

Geek@geekbb

SkillsGate 是一个可视化的 AI Agent 技能管理器，支持桌面应用和终端 UI，可统一管理 20 多种 Agent 的 91000 多个技能。用户只需搜索即可安装技能，无需再到 GitHub 手动查找 markdown 文件。该项目旨在解决技能分散、安装繁琐的问题，提升 Agent 技能管理的效率。目前已在 GitHub 开源，适合频繁使用多种 AI Agent 的开发者。

AI产品 AI Agent 技能管理器开源/仓库桌面应用终端 UI

推荐理由：做 AI Agent 开发或重度使用多 Agent 的团队，终于不用在 GitHub 翻 markdown 文件了——SkillsGate 让技能安装像 App Store 一样简单，值得一试。

原文

14:36

阶跃星辰 Stepfun@Stepfun_AI

88°

阶跃星辰发布了 Step 3.7 Flash 模型，专注于智能体效率，在 ClawEval-1.1、SimpleVQA Search 等基准测试中取得领先成绩。该模型采用 198B 稀疏 MoE 架构，约 11B 活跃参数，支持 400 TPS 推理速度和 256K 上下文，并提供三种推理级别。它擅长理解 UI、图表、文档和图像，并能直接编写代码或调用工具执行操作，在 τ²-bench 上工具调用可靠性超过 98%。模型权重以 Apache 2.0 开源，可在 Mac Studio M4 Max、DGX Spark 等设备本地运行，并兼容 Claude Code、MCP 等生态。

AI模型阶跃星辰 Step 3.7 Flash 智能体开源/仓库推理模型

推荐理由：做智能体、编程或搜索应用的开发者终于有了一个兼顾速度、成本和可靠性的开源模型——Step 3.7 Flash 在工具调用和视觉理解上表现突出，而且能在本地跑，建议直接试试。

原文

14:34

阶跃星辰 Stepfun@Stepfun_AI

StepFun 宣布其模型获得 vLLM 的 Day-0 支持，这意味着新模型发布当天即可在 vLLM 推理框架中使用。vLLM 是流行的开源大模型推理引擎，支持高效部署。这一合作让开发者能更快地使用 StepFun 模型进行推理和部署。感谢 vLLM 项目的贡献。

AI产品 vLLM StepFun 推理引擎开源/仓库模型部署

推荐理由：vLLM 的 Day-0 支持意味着 StepFun 模型发布即可用，做模型推理部署的团队可以省去等待适配的时间，建议关注。

原文

12:15

OpenRouter@OpenRouterAI

精选76°

StepFun 发布了 Step 3.7 Flash 模型，这是一款面向智能体、编码、搜索和多模态工作流的高效模型。该模型采用 198B 稀疏 MoE 架构，仅激活约 11B 参数，支持 256K 上下文和三种推理级别，推理速度达 400 TPS。在 ClawEval-1.1、SimpleVQA Search 和 SWE-PRO 等基准测试中表现领先，并支持视觉理解、工具调用和本地运行。模型权重以 Apache 2.0 开源，可在 Mac Studio、DGX Spark 等设备上运行。

AI模型智能体推理模型开源/仓库编程助手多模态

推荐理由：Step 3.7 Flash 解决了智能体场景中速度与可靠性的平衡问题，做智能体开发、编码自动化和多模态应用的团队可以直接用开源权重部署，值得一试。

原文

11:42

Ate-a-Pi@svpino

精选

一个名为“self-improving agents”的开源框架允许智能体修改自身的三个核心部分：执行环境（harness）、底层模型权重和记忆层。这些智能体通过自我评估并根据表现进行适应，实现了自我改进。在MLE-Bench基准测试中，该框架超越了MLEvolve、AIRA-dojo等其他自我改进方案，甚至击败了Karpathy的autoresearcher。这标志着智能体自主进化能力的重要突破，为AI系统的持续优化提供了新思路。

AI模型智能体自我改进开源/仓库 MLE-Bench Karpathy

推荐理由：对于研究智能体自主进化的开发者，这个框架展示了如何让AI通过自我修改实现性能跃升，值得直接尝试复现。

原文

08:17

Patrick Loeber@patloeber

在Tech Europe举办的Applied AI大会上，Patrick Loeber与同事Lucia分享了如何规模化降低AI成本的策略，涵盖缓存、批量API和灵活层级等实用方法。演讲现场座无虚席，受到广泛关注。演讲者已将演示代码开源至GitHub，方便开发者直接参考使用。这些策略帮助团队在保持AI性能的同时显著降低调用成本，适合正在优化AI服务成本的工程团队。

行业 AI成本优化缓存批量API 开源/仓库 Tech Europe

推荐理由：做AI应用开发的团队，缓存和批量API是降本最直接的手段，建议直接看GitHub上的demo代码，能省不少钱。

原文

08:14

Jerry Liu@jerryjliu0

精选

LlamaIndex 发布了 LiteParse v2，号称是世界上最快的 PDF 解析器，同时保持高精度。团队用 Rust 重写了整个库，并适配为 Python 和 Node 原生包。在 LLM QA 任务基准测试中，LiteParse 与 pdftotext 并列准确率第一，但速度更快；PyMuPDF 延迟接近，但在处理多栏、表格等复杂布局时表现不佳。LiteParse 还支持 50 多种文档格式（包括 .docx、.pptx、.xlsx），并提供 OCR 和截图工具，可直接在 AI Agent 中使用。

AI产品 PDF解析 Rust 开源/仓库 LlamaIndex 文档处理

推荐理由：做 RAG 或文档处理的团队终于有了一个又快又准的开源选择——LiteParse 在速度和准确率上双杀现有方案，建议做 PDF 解析的开发者直接试。

原文

03:00

rohanpaul_ai@rohanpaul_ai

78°

Hexo AI 发布了开源递归自我改进框架 SIA（Self Improving AI），该框架允许 AI 智能体在完成任务后，不仅改进外部工作流程（如提示词、工具），还能直接更新模型内部权重，实现真正的自我进化。与当前大多数“冻结工人”式智能体不同，SIA 通过反复训练自身任务反馈来积累领域知识，无需人工手动编码策略。实验结果显示，SIA 在 LawBench 上提升 56.6%，GPU 内核运行时减少 91.9%，单细胞 RNA 去噪提升 502%。这一突破为构建持续自优化的 AI 系统提供了新路径。

AI模型递归自我改进开源/仓库智能体模型权重更新 SIA

推荐理由：做 AI 智能体开发的团队终于有了一个能自我进化的开源框架——SIA 让模型从“冻结工人”变成“持续学习者”，直接提升任务效果，建议研究自优化系统的开发者点开看看。

原文

01:48

NVIDIA AI@NVIDIAAI

NVIDIA 宣布在其开源模型系列中采用 Linux 基金会的 OpenMDW 框架，旨在简化并统一模型、代码、文档和数据的许可协议。OpenMDW-1.1 是一个专为 AI 模型设计的宽松、统一的法律框架，可减少开发者和企业使用开源 AI 时的法律摩擦。该框架将应用于 Cosmos、Isaac GR00T、Ising 和 Nemotron 等模型系列。此举有望推动 AI 开源生态的标准化，降低合规成本。

行业开源/仓库许可协议 NVIDIA OpenMDW Linux 基金会

推荐理由：NVIDIA 带头统一开源模型许可，解决了 AI 开发者最头疼的许可证碎片化问题。做模型部署或企业级 AI 应用的团队，建议关注 OpenMDW 框架，能省去不少法务沟通成本。

原文

5月28日

22:11

Julien Chaumond@julien_c

Jasper AI 发布了 MONET 数据集，包含 1.05 亿个经过去重和重新标注的图像-文本对，采用 Apache 2.0 开源许可，是目前最大的开放许可文生图数据集之一。该数据集托管在 Hugging Face 上，旨在推动可复现的文生图研究。同时，Jasper 还开源了 Nano T2I 代码库，帮助开发者训练自己的文生图模型。这一发布解决了开源文生图领域缺乏大规模、高质量、可复现数据集的问题。

AI产品文生图数据集开源/仓库 Hugging Face Jasper

推荐理由：做文生图研究的团队终于有了一个大规模、去重、重新标注的开源数据集，可以直接用于训练和复现实验，建议点开看看数据集和代码库。

原文

17:45

向阳乔木@vista8

AI产品智能体 agent.md 开源/仓库配置模板开发者

推荐理由：做 AI 智能体开发的团队可以直接参考这个 agent.md 写法，省去自己摸索配置格式的时间，建议点开看看。

原文

10:08

Greg Brockman@gdb

Simon Smith 开发了一个 Codex 技能，利用 GPT Realtime Whisper 端点实现会议实时转录，并允许用户随时向 Codex 提问关于会议内容的问题。转录过程在预览窗格中实时显示，会议结束后可获取完整转录和格式化版本。该功能使用实时端点，成本为每分钟 0.017 美元（30 分钟会议约 0.51 美元），比会后转录更贵。Smith 计划未来加入本地实时转录选项，如使用 Nemotron Speech Streaming。相关代码和说明已发布在 GitHub。

AI产品 Codex 实时转录会议助手 GPT Realtime Whisper 开源/仓库

推荐理由：对于需要实时记录和检索会议内容的团队，这个 Codex 技能直接解决了「边开会边提问」的痛点，做会议自动化或知识管理的开发者可以试试这个开源方案。

原文

09:49

LangChain@LangChainAI

精选

LangChain 发布了 LangSmith Context Hub，为团队和 Agent 提供统一的上下文存储、编辑、版本管理和检索能力。该工具支持技能、AGENTS.md 文件及其他 Markdown 文件的集中管理。视频详细解释了上下文的重要性、Context Hub 的优势以及如何在 Agent 中使用它。配套的 GitHub 示例代码可供开发者直接参考。

AI产品 LangSmith Context Hub Agent 上下文管理开源/仓库

推荐理由：做 Agent 开发的团队终于有了正经的上下文管理方案——Context Hub 解决了多 Agent 协作时上下文碎片化的问题，建议做 AI 应用架构的开发者点开视频看看。

原文

04:59

Jerry Liu@jerryjliu0

LlamaIndex 团队推出了 LiteParse v2，一个用 Rust 完全重写的 PDF 解析器，号称是目前最快且最准确的开源无模型解析器。相比 pymupdf、pypdf 等工具，速度提升最高达 100 倍，支持 50 多种文档格式。它提供 Python、Node.js 原生包以及 WASM 版本，可在浏览器和边缘环境运行，还能直接集成到 AI Agent 中使用。项目已在 GitHub 开源，适合需要高效文档解析的 AI 应用开发者。

AI产品 LlamaIndex LiteParse PDF 解析 Rust 开源/仓库

推荐理由：做 RAG 或文档处理的团队终于有了一个又快又准的开源解析器——LiteParse v2 用 Rust 重写后速度提升 100 倍，还支持 50+ 格式和 WASM 边缘部署，建议直接替换掉 pymupdf 试试。

原文

04:56

宝玉@dotey

RepoPrompt 是一款将整个代码仓库拼接成 XML 文本的工具，方便发送给支持长上下文的 AI 模型（如 Gemini 2、Claude 3.5、o1 pro）。其作者已被 OpenAI 招安，软件现已免费，并计划开源。此前付费用户将获得 Codex Credits 作为补偿。该工具目前仅支持 Mac 平台，可选择性包含部分文件。这一变化意味着开发者可以免费使用该工具，并期待其开源后的社区贡献。

AI产品 RepoPrompt 开源/仓库 AI编程助手长上下文 OpenAI

推荐理由：RepoPrompt 解决了将整个代码仓库高效喂给大模型的痛点，做 AI 编程或代码审查的开发者现在可以免费使用，而且即将开源，值得关注后续社区版本。

原文