全部 AI 动态 · AI 热点

AITOP

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

22:52

NVIDIA AI@NVIDIAAI

MiniMax 团队发布了 MiniMax M3，这是一个支持文本、图像和视频推理的长上下文多模态模型。模型采用稀疏注意力机制，总参数量约 428B，激活参数仅约 23B，在保持高性能的同时大幅降低了计算成本。该模型已开源权重，可在 Hugging Face 获取，并可通过 NVIDIA 的 GPU 加速端点免费试用。M3 的长上下文能力使其在处理视频、长文档等场景中具有优势。

AI模型 MiniMax M3 多模态模型长上下文开源/仓库

推荐理由：多模态推理模型终于有了高效的开源选择——MiniMax M3 用 23B 激活参数实现长上下文多模态推理，做视频分析或长文档处理的团队可以直接在 NVIDIA 端点免费试，值得关注。

原文

21:33

kimi_moonshot@kimi_moonshot

AI模型编程模型开源/仓库推理效率智能体 Kimi

推荐理由：Kimi-K2.7-Code 在编程和智能体任务上显著超越前代，且推理更高效，做 AI 编程或智能体开发的团队可以直接通过 API 或 Kimi Code 试用，值得关注。

原文

20:13

shao__meng@shao__meng

73°

AI模型 Kimi K2.7-Code 编码模型 Agent MCP/工具开源/仓库

推荐理由：K2.7-Code 在 MCP 场景下超过 Opus 4.8，且推理 token 减少 30%，做编程 Agent 的团队可以直接用开源模型跑长任务，成本更低、成功率更高。

原文

13:08

Guillaume Lample (Mistral)@GuillaumeLample

Mistral 发布了 Voxtral 2，包含两个新模型：Voxtral Realtime（实时转录，延迟可低于 200 毫秒，Apache 2 许可）和 Voxtral Mini Transcribe 2（支持说话人分离、词级时间戳和上下文偏置）。该模型支持 13 种语言，通过 Mistral API 提供，是市场上性价比最高的转录 API 之一。

AI模型 Mistral Voxtral 2 语音识别实时转录开源/仓库

推荐理由：做语音转录或实时字幕的开发者终于有了一个开源且低延迟的选择——Voxtral Realtime 的 Apache 2 许可和 sub-200ms 延迟值得一试。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:52

Artificial Analysis@ArtificialAnlys

精选

Ideogram 4.0 是 Ideogram 首个开放权重的模型，在开放权重文生图排行榜上位列第8。该模型支持 2K×2K 分辨率输出，具备强文本渲染、边界框布局控制和透明背景生成能力。它使用结构化 JSON 提示词来指定构图和场景元素，并通过提示词增强器将自然语言转换为结构化格式。在 API 方面，提供 Turbo、Default 和 Quality 三个档次，价格从每千张 30 美元到 100 美元不等。权重可免费下载用于评估和非商业用途，商业自托管需单独授权。

AI模型 Ideogram 4.0 开源/仓库文生图文本渲染布局控制

推荐理由：做图像生成或设计工具的开发者终于有了一个开源的高质量选择——Ideogram 4.0 的文本渲染和布局控制能力突出，且开放权重意味着可以本地部署和二次开发，值得关注。

原文

12:42

Sebastian Raschka@rasbt

精选

Nemotron 3 Ultra 是 NVIDIA 发布的新一代开源权重模型，延续了前代 Super 变体的 Mamba-2 注意力混合架构和 LatentMoE 设计，但规模更大。该模型在能力与效率之间取得了极佳平衡，性能表现令人印象深刻。开源权重意味着开发者可以自由下载、微调和部署，适合资源受限但追求高性能的场景。这一发布进一步丰富了开源大模型生态，为研究者和工程师提供了新的选择。

AI模型 Nemotron 3 Ultra Mamba-2 LatentMoE 开源/仓库 NVIDIA

推荐理由：NVIDIA 把 Mamba-2 混合架构和 LatentMoE 做到更大更强，追求高性价比模型的团队可以直接拿来用，省去从头训练的昂贵成本。

原文

12:42

Sebastian Raschka@rasbt

精选

Sebastian Raschka 分享了4个新加入开源权重、可在消费级硬件上运行的本地LLM模型。这些模型扩展了本地AI生态，让普通用户无需高端GPU即可运行大语言模型。具体模型包括一些轻量级但性能不错的选项，适合个人开发者和小团队。这一进展降低了AI应用的门槛，推动了去中心化AI的发展。

AI模型开源/仓库本地模型消费级硬件 LLM Sebastian Raschka

推荐理由：本地LLM生态又壮大了，做个人AI项目或隐私敏感应用的开发者可以直接关注，这些模型让消费级硬件跑大模型更现实了。

原文

12:34

Geek@geekbb

MarkMark 是一款专为 macOS 设计的原生 Markdown 阅读器，支持边阅读边批注，并可将审阅意见一键交给 AI 进行修订。该工具由开发者 easychen 发布在 GitHub 上，旨在提升 Markdown 文档的审阅和编辑效率。对于需要频繁审阅技术文档、博客或笔记的用户来说，MarkMark 提供了一种流畅的本地化解决方案。目前该项目已获得社区关注，适合 macOS 用户尝试。

AI产品 Markdown macOS 批注工具 AI修订开源/仓库

推荐理由：写文档、审稿的 macOS 用户终于有了原生批注工具，批注完直接丢给 AI 改，省去手动复制粘贴的麻烦，值得下载体验。

原文

12:26

xiaomimimo@xiaomimimo

精选

小米旗下 MiMo 团队发布了 MiMo Code V0.1，一款开源的终端 AI 编程助手。它内置了 MiMo V2.5 多模态模型，支持百万 token 上下文窗口，并具备无限上下文、智能体-模型协同、设计优先的 Compose 模式、自进化系统、语音输入等功能。该工具兼容 Claude Code，可零成本迁移现有技能和 MCP 服务器，并支持多种主流模型提供商。项目采用 MIT 许可，已在 GitHub 开源。

AI产品编程助手开源/仓库 MiMo Code 多模态模型终端工具

推荐理由：小米把终端 AI 编程助手做成了开源产品，百万 token 上下文和自进化系统对处理大型项目的开发者很实用，兼容 Claude Code 让迁移几乎无感，建议试试。

原文

12:25

Sakana AI@SakanaAILabs

精选

Sakana AI 宣布成立递归自我改进（RSI）实验室，专注于用 AI 重新设计 AI 开发流程。该实验室整合了多项突破性成果，包括 LLM² 自动优化偏好算法、Darwin Gödel Machine 自主重写代码库、ShinkaEvolve 高效程序进化等。团队认为递归自我改进可在适度算力下实现，不应被超大规模集群垄断。目前正在东京招募前沿科学家和工程师，以构建开放、自适应的集体自我改进架构。

AI产品 Sakana AI 递归自我改进 AI 自动化东京实验室开源/仓库

推荐理由：Sakana AI 把自我改进 AI 从理论推向实践，整合了多项已验证的技术成果。做 AI 研究和开发的团队值得关注——他们正在探索一条不同于堆算力的路径，可能改变未来 AI 开发范式。

原文

12:22

向阳乔木@vista8

开发者@vista8分享了使用Fable 5开发在线Photoshop的案例，核心是先用一个专门为AI设计的PRD文档生成Prompt，生成需求文档后再交给AI Agent开发。这种方法能显著提升功能完整度和丰富性，比直接让AI开发更精准高效。视频展示了P0需求点的开发效果，并提供了开源地址和安装指令。

AI产品 AI Agent PRD生成 Fable 5 在线Photoshop 开源/仓库

推荐理由：AI Agent开发效率虽高，但PRD质量直接影响结果——这个专门为AI设计的PRD Prompt解决了需求不精准的痛点，做AI应用开发的团队可以直接拿来用，提升开发效果。

原文

12:19

Tri Dao (FlashAttention)@tri_dao

精选

一位开发者宣布，快速 muon 优化器即将支持消费级显卡。所有代码均以 matmul + epilogue 形式编写，因此一旦为 Blackwell 消费级显卡实现了主循环，所有高级对称矩阵乘法即可自动获得光速性能。这意味着普通用户也能在自家显卡上高效运行该优化器，无需依赖专业硬件。

AI模型 muon优化器消费级显卡 Blackwell 矩阵乘法开源/仓库

推荐理由：这个优化器让消费级显卡也能跑出专业级训练性能，做模型微调或自训练的开发者可以直接关注，省下买高端硬件的钱。

原文

12:10

vLLM@vllm_project

精选

Inferoa 是一个由 @agenticin 构建的社区智能体框架，基于 vLLM 技术栈。它通过推理经济学来塑造智能体循环，包括前缀缓存管理、上下文优化以及在自托管模型和前沿模型之间的路由。该框架旨在帮助开发者更高效地运行智能体，降低推理成本。vLLM 项目团队对此表示期待，并希望开发者能进一步扩展其功能。

AI产品智能体 vLLM 推理优化社区框架开源/仓库

推荐理由：Inferoa 把推理成本优化直接嵌入智能体循环，做智能体应用或自托管模型的开发者值得关注，能帮你省下不少推理开销。

原文

12:09

vLLM@vllm_project

精选

vLLM 项目宣布推出 vime，一个在 vLLM 生态中用于 LLM 后训练的强化学习框架。vime 基于 slime 的训练设计，并利用 vLLM 推理引擎，提供简单、稳定且高效的 RL 训练方案。该框架旨在与 NeMo RL、OpenRLHF、verl 等共存，为用户提供更多选择。vime 的推出丰富了 vLLM 后训练生态，推动互操作性和创新。

AI产品 vLLM RLHF 后训练强化学习开源/仓库

推荐理由：做 LLM 后训练的团队终于有了 vLLM 生态内的 RL 框架选择——vime 简单稳定，直接可用，想尝试不同 RL 框架的开发者值得关注。

原文

12:08

vLLM@vllm_project

精选

vLLM-Omni 项目在 GitHub 上达到 5000 星标，从去年 11 月社区启动至今，已发展为支持 30 多种多模态模型的高效推理引擎。它覆盖 Qwen3-Omni、HunyuanImage-3.0、Wan 2.2、BAGEL、MiMo-Audio 和 Flux2 等模型，并兼容 NVIDIA、AMD、华为昇腾、Intel 等多种硬件。该项目致力于提供可扩展、开源的多模态推理方案，吸引了大量社区贡献。

AI产品 vLLM-Omni 多模态推理开源/仓库推理引擎 GitHub Stars

推荐理由：多模态推理开发者终于有了一个统一的高效引擎——vLLM-Omni 支持 30+ 模型和多种硬件，做多模态应用或推理优化的团队可以直接拿来用，省去重复造轮子的时间。

原文

12:05

Allen AI (Ai2)@allen_ai

精选

Allen AI 宣布其机器人基础模型 MolmoAct 2 在不到一个月内被下载超过 40 万次。现在他们开源了完整的代码和训练数据，允许开发者进行微调或在此基础上构建。这标志着机器人领域的一个重要开放资源，降低了进入门槛。

AI模型机器人开源/仓库基础模型微调 Allen AI

推荐理由：机器人开发者终于有了一个完全开源的基础模型可用，MolmoAct 2 的完整代码和数据让你可以直接微调或构建自己的机器人应用，值得立即尝试。

原文

12:02

LMSYS Org (SGLang)@lmsysorg

精选

LMSYS 在博客中介绍了 Token-In-Token-Out (TITO) 技术，用于解决强化学习中推理与训练 token 不一致导致的策略偏移问题。TITO 通过确保训练器使用推理引擎产生的精确 token，使每个 token 保持在策略上，从而提升训练效率。该技术将每个任务视为一个样本而非每个回合，在 30-50 回合的轨迹上可节省约 10 倍计算量。Miles 框架通过推理会话服务器、追加式 token 缓冲区、可插拔 TITO tokenizer 和 TokenSeqComparator 等组件实现 TITO。该技术已支持 Qwen3、GLM、Kimi-K2、Nemotron、Minimax 和 DeepSeek 等模型系列。

论文强化学习 TITO Miles token 对齐开源/仓库

推荐理由：做 RL 训练或大模型推理的团队终于有了解决策略偏移的实用方案——TITO 让每个 token 都对齐，计算量还能省 10 倍，搞 Agent 训练的开发者值得点开看看。

原文

11:58

Nous Research@NousResearch

NousResearch 宣布 Hermes Agent 新增自动化蓝图功能，允许用户将传统的 Cron 定时任务转换为可点击、可填写、可对话的工作流。这一更新降低了自动化任务的配置门槛，使非技术用户也能通过自然语言或简单界面管理定时任务。Hermes Agent 作为开源智能体框架，此次升级进一步强化了其在实际工作流自动化中的实用性。

AI产品智能体自动化工作流开源/仓库 Hermes Agent Cron

推荐理由：自动化蓝图让 Cron 任务变得像填表一样简单，做运维或日常任务自动化的团队可以直接用，省去写脚本的麻烦。

原文

11:58

Nous Research@NousResearch

Nous Research 发布了 Hermes Agent，一个旨在让 AI 智能体更自由、更灵活地执行任务的框架。该框架通过模块化设计和动态任务规划，使智能体能够自主适应复杂环境，减少人工干预。Hermes Agent 支持多种工具集成，并优化了推理效率，为开发者提供了更强大的智能体构建能力。这一发布标志着智能体技术向更高自主性迈进一步，尤其适合需要复杂任务自动化的场景。

AI产品智能体开源/仓库任务自动化 Nous Research 框架

推荐理由：Hermes Agent 解决了智能体自主性不足的痛点，做自动化任务和智能体开发的团队可以直接用它来构建更灵活的 AI 系统，值得一试。

原文

09:33

shao__meng@shao__meng

Warp 团队提出 Spec 驱动开发 (SDD) 方法，通过产品规格 (PRODUCT.md) 和技术规格 (TECH.md) 将需求固化为可执行文档，作为 PR 的一部分提交和审查。该方法包含五个步骤：写产品规格、写技术规格、按规格实现、规格一致性校验、端到端验证。Warp 开源了三个 Skills（/write-product-spec、/write-tech-spec、/validate-changes-match-specs），可复用至任何 Agent 工作流，解决 Agent 因需求理解偏差导致的错误。核心在于把人的工程习惯（先 PRD、再设计、再实现、再验收）变成 Agent 可执行的流水线。

技巧 Spec 驱动开发 Agent 工作流 Warp 开源/仓库编程助手

推荐理由：做 AI 编程或 Agent 工作流的开发者，终于有了一个可落地的「需求→实现→校验」闭环方案，Warp 开源了三个 Skills 可以直接用，建议试试。

原文

04:12

Richard Socher@RichardSocher

精选

Richard Socher 宣布其公司 Recursive 在递归自我改进超级智能（RSI）方向取得里程碑：一个自动化科学发现系统在三个 AI 基准测试（NanoGPT speedrun、NanoChat、Sol-ExecBench）上取得 SOTA 结果。该系统由 AI 自主生成代码和想法，无需人类团队发明，实现了从构思到验证的闭环。Recursive 已开源该系统的发现成果，强调其解决方案是创造性的、良性的，而非危险或简单的优化。这标志着向“尤里卡机器”迈出了第一步，未来可指向任意难题自动产出发明。

AI模型自动化科研 RSI 开源/仓库 SOTA Richard Socher

推荐理由：AI 自动化科研终于有了可复现的实例——Recursive 的系统自己写代码、跑实验、拿 SOTA，做 AI 研究的团队值得看看这种“AI 做 AI 研究”的范式是否可行。

原文

04:09

Cognition@cognition_labs

Cognition 宣布开源 Devin CLI 中最强大的功能 /handoff，允许用户将任务从本地机器交接给云端 Devin 代理。安装后可作为 Claude Code、Codex 等编程代理的插件使用，用户关闭笔记本电脑后，代理仍能在云端继续运行。这一功能解决了长时间运行任务必须保持设备在线的痛点，提升了开发者的灵活性和效率。开源版本现已可用，适合需要持续执行复杂任务的 AI 编程用户。

AI产品 Devin CLI 开源/仓库编程助手云端代理任务交接

推荐理由：Devin 的 /handoff 解决了 AI 编程中「不能关电脑」的痛点，做自动化任务或长时间调试的开发者可以直接用上，省心省电。

原文

03:36

Simon Willison@simonw

Datasette 1.0a33 版本正式发布，核心更新是将 ?_extra= JSON API 机制从表格页面扩展至行和查询页面，使得用户可以在更多场景下灵活定制 API 返回的字段。该版本的大部分代码由 Claude Fable 5 辅助生成，体现了 AI 辅助开发的实践。这一改进让 Datasette 的 API 更加一致和强大，方便开发者按需获取数据。

AI产品 Datasette JSON API 开源/仓库 AI辅助开发 Claude Fable 5

推荐理由：Datasette 用户终于可以在行和查询页面使用 ?_extra= 机制了，做数据 API 的开发者建议升级，能更灵活地控制返回字段。

原文

01:50

Ideogram@ideogram_ai

Ideogram 4.0 是 Ideogram 首个开放权重的模型，发布一周后，开源和创意社区已经用它做出了超出预期的应用。JSON 和边界框提示（bounding box prompting）正在成为新的标准用法。官方在推文中汇总了第一周的社区亮点，展示了模型在可控生成和结构化提示方面的潜力。

AI模型 Ideogram 4.0 开源/仓库图像生成 JSON 提示边界框提示

推荐理由：开源图像生成模型终于有了更可控的提示方式——JSON 和边界框让精确布局成为可能，做 AI 绘画工具或创意生成的开发者值得关注社区玩法。

原文

01:42

Richard Socher@RichardSocher

精选

Recursive 公司宣布其自动化开放发现系统在三个 AI 任务上取得了最先进成果，包括 NanoGPT speedrun、NanoChat 和 NVIDIA 的 Sol-ExecBench。该系统旨在实现递归自我改进超级智能（RSI），通过自动化科学方法循环（构思、实现、验证）来扩展人类知识。所有代码和想法均由 AI 系统自身生成，而非人类团队。Recursive 已开源系统发现，强调其解决方案具有创造性和良性，而非危险或优化导向。这是迈向“尤里卡机器”的早期里程碑，但已展示出解决多种 AI 研究问题的能力。

AI模型递归自我改进 AI 研究自动化开源/仓库 NanoGPT Sol-ExecBench

推荐理由：AI 研究自动化终于有了可验证的成果——Recursive 的系统在三个基准上跑赢 SOTA，做 AI 研究的团队可以直接看开源代码，感受下机器自己搞科研的潜力。

原文

01:38

Geek@geekbb

一款基于 SwiftUI 构建的原生 macOS Markdown 阅读器发布，采用三栏布局（目录树、渲染视图、大纲导航），底层使用 cmark-gfm 和 WKWebView 进行渲染。它支持 Mermaid 图表、KaTeX 数学公式、PlantUML 流程图、Prism.js 代码高亮，内置 33 套主题，并提供 Quick Look 预览、PDF 导出和多语言功能。对于经常阅读或编写 Markdown 文档的 macOS 用户来说，这是一个功能全面且体验流畅的本地工具。

AI产品 Markdown macOS SwiftUI 开源/仓库文档工具

推荐理由：macOS 上终于有了一个原生且功能齐全的 Markdown 阅读器，支持 Mermaid 和 KaTeX 等扩展语法，做技术写作或文档维护的开发者可以直接下载使用，体验比浏览器插件更流畅。

原文

6月11日

22:46

Geek@geekbb

一位开发者分享了一个名为 TinyTroupe 的本地网页研究引擎，专为 MCP（模型上下文协议）设计。用户输入问题后，它会自动搜索、排序、抓取网页并提取关键段落，最终生成带来源链接的 prompt，供 LLM 回答。默认使用 SearXNG 搜索，DuckDuckGo 兜底，只需 Docker 即可部署。该项目在 GitHub 上开源，适合需要本地化、可控信息检索的 AI 应用场景。

AI产品 MCP/工具本地部署网页研究引擎开源/仓库 Docker

推荐理由：做 MCP 工具或本地 AI 工作流的开发者，这个项目能帮你省掉手动搜索和整理网页的麻烦，直接丢问题就能拿到结构化 prompt，值得抽时间试试。

原文

20:52

Geek@geekbb

editxr 是一款终端内的所见即所得 Markdown 编辑器，输入 Markdown 时直接渲染样式，编辑行保持纯文本。它内置 AI 辅助功能：选中一段文字后，可让 LLM 修改，并以内联 diff 展示改动，用户确认后才写入。该项目在 GitHub 上开源，适合终端重度用户和 Markdown 写作者。

AI产品 Markdown编辑器终端工具 AI辅助所见即所得开源/仓库

推荐理由：终端里写 Markdown 终于能实时预览了，还带 AI 改写的内联 diff，写文档的开发者可以直接用起来，体验很流畅。

原文

16:35

AI Will@FinanceYF5

shadcn 发布了一个名为 improve 的新工具，核心思路是让最强模型（如 GPT-4）负责智能决策和规划，而低成本模型负责具体执行。该工具可以在整个代码库或当前工作分支上运行，自动生成包含审计、调研、范围界定、执行、测试及终止条件的完整计划。这解决了大型代码库自动化重构中成本与质量平衡的痛点，让开发者能以更低成本获得高质量代码优化。项目已在 GitHub 开源，值得关注。

AI产品代码优化 shadcn/improve 开源/仓库智能体成本优化

推荐理由：做代码库重构或自动化优化的开发者，终于有了一个兼顾成本与质量的方案——用强模型定方向、弱模型干苦活，直接开源可试。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

11:25

小互@imxiaohu

78°

Google 开源了 DiffusionGemma，一种基于扩散架构的语言模型，区别于逐词生成的 Transformer，它能一次性生成 256 个 tokens 的整块文本，再通过多轮迭代逐步优化。在 H100 上推理速度可达 1000+ tokens/s，RTX 5090 上 700+ tokens/s，26B 参数模型仅需 18GB 显存。其生成过程类似写草稿后反复修改，能自动修正前文错误，提升输出质量。这一开源模型为需要高吞吐、长文本生成的场景提供了新选择。

AI模型 Google DiffusionGemma 扩散模型开源/仓库文本生成

推荐理由：DiffusionGemma 解决了 Transformer 逐词生成速度慢、无法回头修改的痛点，做文本生成或长内容创作的开发者可以直接在消费级显卡上跑，体验 1000+ tokens/s 的生成速度。

原文

11:13

Geek@geekbb

雪峰 Agent 是一个基于 Python 的 AI 高考志愿顾问，内置了 2600 多所高校和 792 个专业的数据。它通过多轮追问了解用户的家庭背景、分数和就业诉求，然后给出真实的择校建议。该项目已在 GitHub 开源，适合高考生和家长使用。

AI产品 AI 志愿顾问高考开源/仓库教育 Python

推荐理由：高考志愿填报是每年数百万家庭的刚需，雪峰 Agent 用 AI 把择校建议从经验驱动变成数据驱动，做教育产品开发或关心子女升学的家长值得点开看看。

原文

10:29

shao__meng@shao__meng

小米团队基于OpenCode fork开发了MiMoCode，这是一款国产Coding Agent，在14天内由5人通过Vibe Coding方式完成。它保留了OpenCode的核心能力，并叠加了记忆、上下文管理、子智能体编排、Goal驱动自主循环、Compose工作流以及Dream/Distill自我进化机制。技术栈为TypeScript+Bun。MiMoCode内置MiMo Auto限时免费通道，支持小米MiMo平台OAuth、Claude Code认证迁移及任意OpenAI兼容API，是MiMo-V2.5系列模型的官方配套Harness，模型能力与框架深度耦合。该项目已开源在GitHub。

AI产品 Coding Agent 开源/仓库小米MiMo Vibe Coding 智能体编排

推荐理由：小米开源了深度耦合MiMo模型的Coding Agent，做AI编程工具或Agent开发的团队可以直接拿来用，还能体验自我进化机制，值得fork试试。

原文

09:22

Viking@vikingmute

SenseNova Skills 是一套基于 SenseNova 智能体模型的开源办公技能套件，已在 GitHub 获得 4.1k Stars。它专注于真实办公场景，支持自动生成高质量 PPT、信息图、Excel 数据分析、深度研究报告等。用户将英伟达财报数据输入后，几分钟即可得到结构清晰、图表自动生成的 PPTX。该套件可集成到 Codex、OpenClaw Hermes 等 Agent 工作流中，实现办公任务全自动化。

AI产品智能体办公自动化开源/仓库 PPT生成 SenseNova

推荐理由：做办公自动化的开发者终于有了现成的 Agent 技能包——PPT 和信息图生成质量高，集成简单，建议直接加到工作流里试试。

原文

09:17

berryxia@berryxia

精选72°

开发者 Prince Canuma 在 Google 发布 DiffusionGemma 和 Cohere North Mini Code 当天，就将这两个模型移植到了 Mac 的 MLX 框架中，实现零等待本地运行。DiffusionGemma 采用新架构，可生成 256 token 整块，支持双向注意力和迭代自纠错，26B MoE 仅激活 3.8B，量化后 18GB 内存即可运行。North Mini Code 30B MoE 只需 3B 激活参数，BF16 下推理速度达 66 tok/s。这得益于与 Google DeepMind 和 Cohere 的深度合作，实现了 Day-0 支持。用户可通过 mlx-vlm v0.6.3 一键安装体验。

AI产品 MLX DiffusionGemma Cohere North Mini Code 本地推理开源/仓库

推荐理由：Mac 开发者终于能在本地跑最新大模型了，DiffusionGemma 和 North Mini Code 都支持 Day-0 运行，做本地 AI 实验的可以直接装来玩。

原文

08:04

berryxia@berryxia

78°

小米开源了MiMo-Code，一个基于终端的AI编程助手，解决了AI在重启项目后失忆的痛点。它fork了OpenCode，增加了SQLite持久记忆、build/plan/compose三类子代理、自动checkpoint和智能上下文预算。支持跨会话记忆、Git操作、调试、TDD、代码审查和语音输入，零配置兼容任何OpenAI模型。一键curl安装，MIT协议，开发者可本地使用和修改，将AI从临时工具变为长期伙伴。

AI产品编程助手开源/仓库持久记忆自主子代理 MiMo-Code

推荐理由：MiMo-Code用最朴实的终端+记忆+自治解决了AI编程助手“每次重启都失忆”的老毛病，做长期项目的开发者可以直接装来试试，让AI像老搭档一样记得住、自己长。

原文

06:50

berryxia@berryxia

78°

Google 发布 DiffusionGemma，一种基于扩散模型的新型文本生成模型，速度可达 1000+ token/s，是传统自回归模型的 4 倍。它摒弃了逐词生成的方式，而是通过并行起草、纠错和精炼整段文本，实现高速生成。模型已以 Apache 2.0 协议开源，权重在 Hugging Face 上可获取，18GB 消费级显卡即可本地运行。该模型在代码、数学和复杂编辑任务上表现优异，支持实时补空、格式化和自我修复。这一发布可能颠覆文本生成的范式，从串行生成转向并行炼句。

AI模型扩散模型文本生成开源/仓库 Google 并行生成

推荐理由：DiffusionGemma 把文本生成速度拉到 4 倍，还彻底开源，做本地部署或加速日常 workflow 的开发者可以直接拖权重玩。

原文

06:19

LangChain@LangChainAI

Nebius 发布了 Agent Blueprint，这是一个开源参考架构，旨在解决 AI 智能体在生产环境中因基础设施问题而失败的问题。该架构连接了智能体栈各层的成熟组件，包括 Deep Agents 和 LangSmith。它提供了构建、运营和持续改进生产级智能体的标准化方案，帮助开发者避免常见陷阱。对于正在构建或计划部署 AI 智能体的团队来说，这是一个值得关注的参考框架。

行业智能体开源/仓库生产部署 Nebius LangSmith

推荐理由：智能体部署失败往往出在基础设施而非模型本身，Nebius 的开源架构直接给出了生产级参考方案，做智能体开发的团队可以拿来就用，省去自己踩坑的时间。

原文

06:14

Sundar Pichai@sundarpichai

Google CEO Sundar Pichai 宣布，Google 的模型权重已在 Hugging Face 上以 Apache 2.0 许可证开源。这意味着开发者可以自由下载、使用和修改这些模型，无需担心商业限制。此举降低了 AI 模型的使用门槛，尤其对研究者和中小团队利好。开源社区可以基于这些权重进行二次开发或集成到自己的应用中。

AI模型开源/仓库 Hugging Face Google 模型权重 Apache 2.0

推荐理由：Google 将模型权重以 Apache 2.0 开源，解决了开发者获取高质量预训练模型的门槛问题，做 AI 应用或研究的团队可以直接下载使用，值得关注。

原文

05:16

Kevin Weil@kevinweil

Crownlands 宣布开源 Gateway 4M，这是迄今为止从活体人类中释放的最大单细胞组织数据集，旨在加速脑衰老和神经退行性疾病的研究。该数据集包含来自多个组织的单细胞转录组数据，为科学家和 AI 模型提供了宝贵的人类生物学参考。此举被认为对推动 AI 在科学与健康领域的影响至关重要，尤其有助于理解疾病机制和开发新疗法。

行业开源/仓库单细胞数据集脑衰老神经退行性疾病 Crownlands

推荐理由：做生物信息学或 AI 药物研发的团队终于有了大规模活体人类单细胞数据可用，直接下载就能用于模型训练或疾病研究，建议相关研究者点开看看。

原文

03:18

Clement Delangue@ClementDelangue

Google、Hugging Face 与开源 AI 社区联合发起 Gemma 挑战赛，旨在通过数十个智能体协作，让 Gemma 4 E4B 模型运行更快。Hugging Face 的 Hub 正从人类协作平台演变为智能体协作平台，这一赛事展示了 AI 智能体在模型优化中的潜力。挑战赛鼓励开发者参与，推动开源 AI 生态发展。

AI产品智能体开源/仓库 Gemma Hugging Face 模型优化

推荐理由：这是 AI 智能体协作的实战案例，做模型优化或智能体开发的团队值得关注——看看智能体如何像人类一样在 Hub 上合作提速模型。

原文