22:52NVIDIA AI@NVIDIAAIMiniMax 团队发布了 MiniMax M3,这是一个支持文本、图像和视频推理的长上下文多模态模型。模型采用稀疏注意力机制,总参数量约 428B,激活参数仅约 23B,在保持高性能的同时大幅降低了计算成本。该模型已开源权重,可在 Hugging Face 获取,并可通过 NVIDIA 的 GPU 加速端点免费试用。M3 的长上下文能力使其在处理视频、长文档等场景中具有优势。AI模型MiniMaxM3多模态模型长上下文开源/仓库10 个信源在谈推荐理由:多模态推理模型终于有了高效的开源选择——MiniMax M3 用 23B 激活参数实现长上下文多模态推理,做视频分析或长文档处理的团队可以直接在 NVIDIA 端点免费试,值得关注。原文
21:33kimi_moonshot@kimi_moonshot月之暗面发布并开源了最新编程模型 Kimi-K2.7-Code,相比 K2.6 在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。该模型减少了过度思考,推理 token 使用量降低 30%,同时改进了长时编程任务中的指令遵循和成功率。模型已通过 Kimi API 和 Kimi Code 可用,即将推出 6 倍高速模式。AI模型编程模型开源/仓库推理效率智能体Kimi推荐理由:Kimi-K2.7-Code 在编程和智能体任务上显著超越前代,且推理更高效,做 AI 编程或智能体开发的团队可以直接通过 API 或 Kimi Code 试用,值得关注。原文
20:13shao__meng@shao__meng73°Kimi 开源了最新编码模型 K2.7-Code,基于 K2.6 针对编程 Agent 专项优化,重点提升长链路编码任务成功率并减少推理 token。在编码基准上全面进步,其中 Kimi Code Bench v2 提升 21.8%,MLS Bench Lite 提升 31.5%。Agent 方面,MCP Mark Verified 得分 81.1,超过 Opus 4.8 的 76.4,在多工具编排上具备竞争力。效率方面,推理 token 整体减少约 30%,Program Bench 的 token 消耗降低 42% 同时分数提升。模型支持强制 Thinking 模式、Preserve Thinking 和多模态输入,已在 Hugging Face 开源。AI模型KimiK2.7-Code编码模型AgentMCP/工具开源/仓库推荐理由:K2.7-Code 在 MCP 场景下超过 Opus 4.8,且推理 token 减少 30%,做编程 Agent 的团队可以直接用开源模型跑长任务,成本更低、成功率更高。原文
13:08Guillaume Lample (Mistral)@GuillaumeLampleMistral 发布了 Voxtral 2,包含两个新模型:Voxtral Realtime(实时转录,延迟可低于 200 毫秒,Apache 2 许可)和 Voxtral Mini Transcribe 2(支持说话人分离、词级时间戳和上下文偏置)。该模型支持 13 种语言,通过 Mistral API 提供,是市场上性价比最高的转录 API 之一。AI模型MistralVoxtral 2语音识别实时转录开源/仓库推荐理由:做语音转录或实时字幕的开发者终于有了一个开源且低延迟的选择——Voxtral Realtime 的 Apache 2 许可和 sub-200ms 延迟值得一试。原文
12:52Artificial Analysis@ArtificialAnlys精选Ideogram 4.0 是 Ideogram 首个开放权重的模型,在开放权重文生图排行榜上位列第8。该模型支持 2K×2K 分辨率输出,具备强文本渲染、边界框布局控制和透明背景生成能力。它使用结构化 JSON 提示词来指定构图和场景元素,并通过提示词增强器将自然语言转换为结构化格式。在 API 方面,提供 Turbo、Default 和 Quality 三个档次,价格从每千张 30 美元到 100 美元不等。权重可免费下载用于评估和非商业用途,商业自托管需单独授权。AI模型Ideogram 4.0开源/仓库文生图文本渲染布局控制2 个信源在谈推荐理由:做图像生成或设计工具的开发者终于有了一个开源的高质量选择——Ideogram 4.0 的文本渲染和布局控制能力突出,且开放权重意味着可以本地部署和二次开发,值得关注。原文
12:42Sebastian Raschka@rasbt精选Nemotron 3 Ultra 是 NVIDIA 发布的新一代开源权重模型,延续了前代 Super 变体的 Mamba-2 注意力混合架构和 LatentMoE 设计,但规模更大。该模型在能力与效率之间取得了极佳平衡,性能表现令人印象深刻。开源权重意味着开发者可以自由下载、微调和部署,适合资源受限但追求高性能的场景。这一发布进一步丰富了开源大模型生态,为研究者和工程师提供了新的选择。AI模型Nemotron 3 UltraMamba-2LatentMoE开源/仓库NVIDIA10 个信源在谈推荐理由:NVIDIA 把 Mamba-2 混合架构和 LatentMoE 做到更大更强,追求高性价比模型的团队可以直接拿来用,省去从头训练的昂贵成本。原文
12:42Sebastian Raschka@rasbt精选Sebastian Raschka 分享了4个新加入开源权重、可在消费级硬件上运行的本地LLM模型。这些模型扩展了本地AI生态,让普通用户无需高端GPU即可运行大语言模型。具体模型包括一些轻量级但性能不错的选项,适合个人开发者和小团队。这一进展降低了AI应用的门槛,推动了去中心化AI的发展。AI模型开源/仓库本地模型消费级硬件LLMSebastian Raschka推荐理由:本地LLM生态又壮大了,做个人AI项目或隐私敏感应用的开发者可以直接关注,这些模型让消费级硬件跑大模型更现实了。原文
12:34Geek@geekbbMarkMark 是一款专为 macOS 设计的原生 Markdown 阅读器,支持边阅读边批注,并可将审阅意见一键交给 AI 进行修订。该工具由开发者 easychen 发布在 GitHub 上,旨在提升 Markdown 文档的审阅和编辑效率。对于需要频繁审阅技术文档、博客或笔记的用户来说,MarkMark 提供了一种流畅的本地化解决方案。目前该项目已获得社区关注,适合 macOS 用户尝试。AI产品MarkdownmacOS批注工具AI修订开源/仓库3 个信源在谈推荐理由:写文档、审稿的 macOS 用户终于有了原生批注工具,批注完直接丢给 AI 改,省去手动复制粘贴的麻烦,值得下载体验。原文
12:26xiaomimimo@xiaomimimo精选小米旗下 MiMo 团队发布了 MiMo Code V0.1,一款开源的终端 AI 编程助手。它内置了 MiMo V2.5 多模态模型,支持百万 token 上下文窗口,并具备无限上下文、智能体-模型协同、设计优先的 Compose 模式、自进化系统、语音输入等功能。该工具兼容 Claude Code,可零成本迁移现有技能和 MCP 服务器,并支持多种主流模型提供商。项目采用 MIT 许可,已在 GitHub 开源。AI产品编程助手开源/仓库MiMo Code多模态模型终端工具推荐理由:小米把终端 AI 编程助手做成了开源产品,百万 token 上下文和自进化系统对处理大型项目的开发者很实用,兼容 Claude Code 让迁移几乎无感,建议试试。原文
12:25Sakana AI@SakanaAILabs精选Sakana AI 宣布成立递归自我改进(RSI)实验室,专注于用 AI 重新设计 AI 开发流程。该实验室整合了多项突破性成果,包括 LLM² 自动优化偏好算法、Darwin Gödel Machine 自主重写代码库、ShinkaEvolve 高效程序进化等。团队认为递归自我改进可在适度算力下实现,不应被超大规模集群垄断。目前正在东京招募前沿科学家和工程师,以构建开放、自适应的集体自我改进架构。AI产品Sakana AI递归自我改进AI 自动化东京实验室开源/仓库推荐理由:Sakana AI 把自我改进 AI 从理论推向实践,整合了多项已验证的技术成果。做 AI 研究和开发的团队值得关注——他们正在探索一条不同于堆算力的路径,可能改变未来 AI 开发范式。原文
12:22向阳乔木@vista8开发者@vista8分享了使用Fable 5开发在线Photoshop的案例,核心是先用一个专门为AI设计的PRD文档生成Prompt,生成需求文档后再交给AI Agent开发。这种方法能显著提升功能完整度和丰富性,比直接让AI开发更精准高效。视频展示了P0需求点的开发效果,并提供了开源地址和安装指令。AI产品AI AgentPRD生成Fable 5在线Photoshop开源/仓库10 个信源在谈推荐理由:AI Agent开发效率虽高,但PRD质量直接影响结果——这个专门为AI设计的PRD Prompt解决了需求不精准的痛点,做AI应用开发的团队可以直接拿来用,提升开发效果。原文
12:19Tri Dao (FlashAttention)@tri_dao精选一位开发者宣布,快速 muon 优化器即将支持消费级显卡。所有代码均以 matmul + epilogue 形式编写,因此一旦为 Blackwell 消费级显卡实现了主循环,所有高级对称矩阵乘法即可自动获得光速性能。这意味着普通用户也能在自家显卡上高效运行该优化器,无需依赖专业硬件。AI模型muon优化器消费级显卡Blackwell矩阵乘法开源/仓库推荐理由:这个优化器让消费级显卡也能跑出专业级训练性能,做模型微调或自训练的开发者可以直接关注,省下买高端硬件的钱。原文
12:10vLLM@vllm_project精选Inferoa 是一个由 @agenticin 构建的社区智能体框架,基于 vLLM 技术栈。它通过推理经济学来塑造智能体循环,包括前缀缓存管理、上下文优化以及在自托管模型和前沿模型之间的路由。该框架旨在帮助开发者更高效地运行智能体,降低推理成本。vLLM 项目团队对此表示期待,并希望开发者能进一步扩展其功能。AI产品智能体vLLM推理优化社区框架开源/仓库推荐理由:Inferoa 把推理成本优化直接嵌入智能体循环,做智能体应用或自托管模型的开发者值得关注,能帮你省下不少推理开销。原文
12:09vLLM@vllm_project精选vLLM 项目宣布推出 vime,一个在 vLLM 生态中用于 LLM 后训练的强化学习框架。vime 基于 slime 的训练设计,并利用 vLLM 推理引擎,提供简单、稳定且高效的 RL 训练方案。该框架旨在与 NeMo RL、OpenRLHF、verl 等共存,为用户提供更多选择。vime 的推出丰富了 vLLM 后训练生态,推动互操作性和创新。AI产品vLLMRLHF后训练强化学习开源/仓库推荐理由:做 LLM 后训练的团队终于有了 vLLM 生态内的 RL 框架选择——vime 简单稳定,直接可用,想尝试不同 RL 框架的开发者值得关注。原文
12:08vLLM@vllm_project精选vLLM-Omni 项目在 GitHub 上达到 5000 星标,从去年 11 月社区启动至今,已发展为支持 30 多种多模态模型的高效推理引擎。它覆盖 Qwen3-Omni、HunyuanImage-3.0、Wan 2.2、BAGEL、MiMo-Audio 和 Flux2 等模型,并兼容 NVIDIA、AMD、华为昇腾、Intel 等多种硬件。该项目致力于提供可扩展、开源的多模态推理方案,吸引了大量社区贡献。AI产品vLLM-Omni多模态推理开源/仓库推理引擎GitHub Stars10 个信源在谈推荐理由:多模态推理开发者终于有了一个统一的高效引擎——vLLM-Omni 支持 30+ 模型和多种硬件,做多模态应用或推理优化的团队可以直接拿来用,省去重复造轮子的时间。原文
12:05Allen AI (Ai2)@allen_ai精选Allen AI 宣布其机器人基础模型 MolmoAct 2 在不到一个月内被下载超过 40 万次。现在他们开源了完整的代码和训练数据,允许开发者进行微调或在此基础上构建。这标志着机器人领域的一个重要开放资源,降低了进入门槛。AI模型机器人开源/仓库基础模型微调Allen AI推荐理由:机器人开发者终于有了一个完全开源的基础模型可用,MolmoAct 2 的完整代码和数据让你可以直接微调或构建自己的机器人应用,值得立即尝试。原文
12:02LMSYS Org (SGLang)@lmsysorg精选LMSYS 在博客中介绍了 Token-In-Token-Out (TITO) 技术,用于解决强化学习中推理与训练 token 不一致导致的策略偏移问题。TITO 通过确保训练器使用推理引擎产生的精确 token,使每个 token 保持在策略上,从而提升训练效率。该技术将每个任务视为一个样本而非每个回合,在 30-50 回合的轨迹上可节省约 10 倍计算量。Miles 框架通过推理会话服务器、追加式 token 缓冲区、可插拔 TITO tokenizer 和 TokenSeqComparator 等组件实现 TITO。该技术已支持 Qwen3、GLM、Kimi-K2、Nemotron、Minimax 和 DeepSeek 等模型系列。论文强化学习TITOMilestoken 对齐开源/仓库推荐理由:做 RL 训练或大模型推理的团队终于有了解决策略偏移的实用方案——TITO 让每个 token 都对齐,计算量还能省 10 倍,搞 Agent 训练的开发者值得点开看看。原文
11:58Nous Research@NousResearchNousResearch 宣布 Hermes Agent 新增自动化蓝图功能,允许用户将传统的 Cron 定时任务转换为可点击、可填写、可对话的工作流。这一更新降低了自动化任务的配置门槛,使非技术用户也能通过自然语言或简单界面管理定时任务。Hermes Agent 作为开源智能体框架,此次升级进一步强化了其在实际工作流自动化中的实用性。AI产品智能体自动化工作流开源/仓库Hermes AgentCron推荐理由:自动化蓝图让 Cron 任务变得像填表一样简单,做运维或日常任务自动化的团队可以直接用,省去写脚本的麻烦。原文
11:58Nous Research@NousResearchNous Research 发布了 Hermes Agent,一个旨在让 AI 智能体更自由、更灵活地执行任务的框架。该框架通过模块化设计和动态任务规划,使智能体能够自主适应复杂环境,减少人工干预。Hermes Agent 支持多种工具集成,并优化了推理效率,为开发者提供了更强大的智能体构建能力。这一发布标志着智能体技术向更高自主性迈进一步,尤其适合需要复杂任务自动化的场景。AI产品智能体开源/仓库任务自动化Nous Research框架推荐理由:Hermes Agent 解决了智能体自主性不足的痛点,做自动化任务和智能体开发的团队可以直接用它来构建更灵活的 AI 系统,值得一试。原文
09:33shao__meng@shao__mengWarp 团队提出 Spec 驱动开发 (SDD) 方法,通过产品规格 (PRODUCT.md) 和技术规格 (TECH.md) 将需求固化为可执行文档,作为 PR 的一部分提交和审查。该方法包含五个步骤:写产品规格、写技术规格、按规格实现、规格一致性校验、端到端验证。Warp 开源了三个 Skills(/write-product-spec、/write-tech-spec、/validate-changes-match-specs),可复用至任何 Agent 工作流,解决 Agent 因需求理解偏差导致的错误。核心在于把人的工程习惯(先 PRD、再设计、再实现、再验收)变成 Agent 可执行的流水线。技巧Spec 驱动开发Agent 工作流Warp开源/仓库编程助手推荐理由:做 AI 编程或 Agent 工作流的开发者,终于有了一个可落地的「需求→实现→校验」闭环方案,Warp 开源了三个 Skills 可以直接用,建议试试。原文
04:12Richard Socher@RichardSocher精选Richard Socher 宣布其公司 Recursive 在递归自我改进超级智能(RSI)方向取得里程碑:一个自动化科学发现系统在三个 AI 基准测试(NanoGPT speedrun、NanoChat、Sol-ExecBench)上取得 SOTA 结果。该系统由 AI 自主生成代码和想法,无需人类团队发明,实现了从构思到验证的闭环。Recursive 已开源该系统的发现成果,强调其解决方案是创造性的、良性的,而非危险或简单的优化。这标志着向“尤里卡机器”迈出了第一步,未来可指向任意难题自动产出发明。AI模型自动化科研RSI开源/仓库SOTARichard Socher推荐理由:AI 自动化科研终于有了可复现的实例——Recursive 的系统自己写代码、跑实验、拿 SOTA,做 AI 研究的团队值得看看这种“AI 做 AI 研究”的范式是否可行。原文
04:09Cognition@cognition_labsCognition 宣布开源 Devin CLI 中最强大的功能 /handoff,允许用户将任务从本地机器交接给云端 Devin 代理。安装后可作为 Claude Code、Codex 等编程代理的插件使用,用户关闭笔记本电脑后,代理仍能在云端继续运行。这一功能解决了长时间运行任务必须保持设备在线的痛点,提升了开发者的灵活性和效率。开源版本现已可用,适合需要持续执行复杂任务的 AI 编程用户。AI产品Devin CLI开源/仓库编程助手云端代理任务交接推荐理由:Devin 的 /handoff 解决了 AI 编程中「不能关电脑」的痛点,做自动化任务或长时间调试的开发者可以直接用上,省心省电。原文
03:36Simon Willison@simonwDatasette 1.0a33 版本正式发布,核心更新是将 ?_extra= JSON API 机制从表格页面扩展至行和查询页面,使得用户可以在更多场景下灵活定制 API 返回的字段。该版本的大部分代码由 Claude Fable 5 辅助生成,体现了 AI 辅助开发的实践。这一改进让 Datasette 的 API 更加一致和强大,方便开发者按需获取数据。AI产品DatasetteJSON API开源/仓库AI辅助开发Claude Fable 510 个信源在谈推荐理由:Datasette 用户终于可以在行和查询页面使用 ?_extra= 机制了,做数据 API 的开发者建议升级,能更灵活地控制返回字段。原文
01:50Ideogram@ideogram_aiIdeogram 4.0 是 Ideogram 首个开放权重的模型,发布一周后,开源和创意社区已经用它做出了超出预期的应用。JSON 和边界框提示(bounding box prompting)正在成为新的标准用法。官方在推文中汇总了第一周的社区亮点,展示了模型在可控生成和结构化提示方面的潜力。AI模型Ideogram 4.0开源/仓库图像生成JSON 提示边界框提示2 个信源在谈推荐理由:开源图像生成模型终于有了更可控的提示方式——JSON 和边界框让精确布局成为可能,做 AI 绘画工具或创意生成的开发者值得关注社区玩法。原文
01:42Richard Socher@RichardSocher精选Recursive 公司宣布其自动化开放发现系统在三个 AI 任务上取得了最先进成果,包括 NanoGPT speedrun、NanoChat 和 NVIDIA 的 Sol-ExecBench。该系统旨在实现递归自我改进超级智能(RSI),通过自动化科学方法循环(构思、实现、验证)来扩展人类知识。所有代码和想法均由 AI 系统自身生成,而非人类团队。Recursive 已开源系统发现,强调其解决方案具有创造性和良性,而非危险或优化导向。这是迈向“尤里卡机器”的早期里程碑,但已展示出解决多种 AI 研究问题的能力。AI模型递归自我改进AI 研究自动化开源/仓库NanoGPTSol-ExecBench10 个信源在谈推荐理由:AI 研究自动化终于有了可验证的成果——Recursive 的系统在三个基准上跑赢 SOTA,做 AI 研究的团队可以直接看开源代码,感受下机器自己搞科研的潜力。原文
01:38Geek@geekbb一款基于 SwiftUI 构建的原生 macOS Markdown 阅读器发布,采用三栏布局(目录树、渲染视图、大纲导航),底层使用 cmark-gfm 和 WKWebView 进行渲染。它支持 Mermaid 图表、KaTeX 数学公式、PlantUML 流程图、Prism.js 代码高亮,内置 33 套主题,并提供 Quick Look 预览、PDF 导出和多语言功能。对于经常阅读或编写 Markdown 文档的 macOS 用户来说,这是一个功能全面且体验流畅的本地工具。AI产品MarkdownmacOSSwiftUI开源/仓库文档工具4 个信源在谈推荐理由:macOS 上终于有了一个原生且功能齐全的 Markdown 阅读器,支持 Mermaid 和 KaTeX 等扩展语法,做技术写作或文档维护的开发者可以直接下载使用,体验比浏览器插件更流畅。原文
22:46Geek@geekbb一位开发者分享了一个名为 TinyTroupe 的本地网页研究引擎,专为 MCP(模型上下文协议)设计。用户输入问题后,它会自动搜索、排序、抓取网页并提取关键段落,最终生成带来源链接的 prompt,供 LLM 回答。默认使用 SearXNG 搜索,DuckDuckGo 兜底,只需 Docker 即可部署。该项目在 GitHub 上开源,适合需要本地化、可控信息检索的 AI 应用场景。AI产品MCP/工具本地部署网页研究引擎开源/仓库Docker推荐理由:做 MCP 工具或本地 AI 工作流的开发者,这个项目能帮你省掉手动搜索和整理网页的麻烦,直接丢问题就能拿到结构化 prompt,值得抽时间试试。原文
20:52Geek@geekbbeditxr 是一款终端内的所见即所得 Markdown 编辑器,输入 Markdown 时直接渲染样式,编辑行保持纯文本。它内置 AI 辅助功能:选中一段文字后,可让 LLM 修改,并以内联 diff 展示改动,用户确认后才写入。该项目在 GitHub 上开源,适合终端重度用户和 Markdown 写作者。AI产品Markdown编辑器终端工具AI辅助所见即所得开源/仓库推荐理由:终端里写 Markdown 终于能实时预览了,还带 AI 改写的内联 diff,写文档的开发者可以直接用起来,体验很流畅。原文
16:35AI Will@FinanceYF5shadcn 发布了一个名为 improve 的新工具,核心思路是让最强模型(如 GPT-4)负责智能决策和规划,而低成本模型负责具体执行。该工具可以在整个代码库或当前工作分支上运行,自动生成包含审计、调研、范围界定、执行、测试及终止条件的完整计划。这解决了大型代码库自动化重构中成本与质量平衡的痛点,让开发者能以更低成本获得高质量代码优化。项目已在 GitHub 开源,值得关注。AI产品代码优化shadcn/improve开源/仓库智能体成本优化1 个信源在谈推荐理由:做代码库重构或自动化优化的开发者,终于有了一个兼顾成本与质量的方案——用强模型定方向、弱模型干苦活,直接开源可试。原文
11:25小互@imxiaohu78°Google 开源了 DiffusionGemma,一种基于扩散架构的语言模型,区别于逐词生成的 Transformer,它能一次性生成 256 个 tokens 的整块文本,再通过多轮迭代逐步优化。在 H100 上推理速度可达 1000+ tokens/s,RTX 5090 上 700+ tokens/s,26B 参数模型仅需 18GB 显存。其生成过程类似写草稿后反复修改,能自动修正前文错误,提升输出质量。这一开源模型为需要高吞吐、长文本生成的场景提供了新选择。AI模型GoogleDiffusionGemma扩散模型开源/仓库文本生成6 个信源在谈推荐理由:DiffusionGemma 解决了 Transformer 逐词生成速度慢、无法回头修改的痛点,做文本生成或长内容创作的开发者可以直接在消费级显卡上跑,体验 1000+ tokens/s 的生成速度。原文
11:13Geek@geekbb雪峰 Agent 是一个基于 Python 的 AI 高考志愿顾问,内置了 2600 多所高校和 792 个专业的数据。它通过多轮追问了解用户的家庭背景、分数和就业诉求,然后给出真实的择校建议。该项目已在 GitHub 开源,适合高考生和家长使用。AI产品AI 志愿顾问高考开源/仓库教育Python推荐理由:高考志愿填报是每年数百万家庭的刚需,雪峰 Agent 用 AI 把择校建议从经验驱动变成数据驱动,做教育产品开发或关心子女升学的家长值得点开看看。原文
10:29shao__meng@shao__meng小米团队基于OpenCode fork开发了MiMoCode,这是一款国产Coding Agent,在14天内由5人通过Vibe Coding方式完成。它保留了OpenCode的核心能力,并叠加了记忆、上下文管理、子智能体编排、Goal驱动自主循环、Compose工作流以及Dream/Distill自我进化机制。技术栈为TypeScript+Bun。MiMoCode内置MiMo Auto限时免费通道,支持小米MiMo平台OAuth、Claude Code认证迁移及任意OpenAI兼容API,是MiMo-V2.5系列模型的官方配套Harness,模型能力与框架深度耦合。该项目已开源在GitHub。AI产品Coding Agent开源/仓库小米MiMoVibe Coding智能体编排10 个信源在谈推荐理由:小米开源了深度耦合MiMo模型的Coding Agent,做AI编程工具或Agent开发的团队可以直接拿来用,还能体验自我进化机制,值得fork试试。原文
09:22Viking@vikingmuteSenseNova Skills 是一套基于 SenseNova 智能体模型的开源办公技能套件,已在 GitHub 获得 4.1k Stars。它专注于真实办公场景,支持自动生成高质量 PPT、信息图、Excel 数据分析、深度研究报告等。用户将英伟达财报数据输入后,几分钟即可得到结构清晰、图表自动生成的 PPTX。该套件可集成到 Codex、OpenClaw Hermes 等 Agent 工作流中,实现办公任务全自动化。AI产品智能体办公自动化开源/仓库PPT生成SenseNova1 个信源在谈推荐理由:做办公自动化的开发者终于有了现成的 Agent 技能包——PPT 和信息图生成质量高,集成简单,建议直接加到工作流里试试。原文
09:17berryxia@berryxia精选72°开发者 Prince Canuma 在 Google 发布 DiffusionGemma 和 Cohere North Mini Code 当天,就将这两个模型移植到了 Mac 的 MLX 框架中,实现零等待本地运行。DiffusionGemma 采用新架构,可生成 256 token 整块,支持双向注意力和迭代自纠错,26B MoE 仅激活 3.8B,量化后 18GB 内存即可运行。North Mini Code 30B MoE 只需 3B 激活参数,BF16 下推理速度达 66 tok/s。这得益于与 Google DeepMind 和 Cohere 的深度合作,实现了 Day-0 支持。用户可通过 mlx-vlm v0.6.3 一键安装体验。AI产品MLXDiffusionGemmaCohere North Mini Code本地推理开源/仓库推荐理由:Mac 开发者终于能在本地跑最新大模型了,DiffusionGemma 和 North Mini Code 都支持 Day-0 运行,做本地 AI 实验的可以直接装来玩。原文
08:04berryxia@berryxia78°小米开源了MiMo-Code,一个基于终端的AI编程助手,解决了AI在重启项目后失忆的痛点。它fork了OpenCode,增加了SQLite持久记忆、build/plan/compose三类子代理、自动checkpoint和智能上下文预算。支持跨会话记忆、Git操作、调试、TDD、代码审查和语音输入,零配置兼容任何OpenAI模型。一键curl安装,MIT协议,开发者可本地使用和修改,将AI从临时工具变为长期伙伴。AI产品编程助手开源/仓库持久记忆自主子代理MiMo-Code10 个信源在谈推荐理由:MiMo-Code用最朴实的终端+记忆+自治解决了AI编程助手“每次重启都失忆”的老毛病,做长期项目的开发者可以直接装来试试,让AI像老搭档一样记得住、自己长。原文
06:50berryxia@berryxia78°Google 发布 DiffusionGemma,一种基于扩散模型的新型文本生成模型,速度可达 1000+ token/s,是传统自回归模型的 4 倍。它摒弃了逐词生成的方式,而是通过并行起草、纠错和精炼整段文本,实现高速生成。模型已以 Apache 2.0 协议开源,权重在 Hugging Face 上可获取,18GB 消费级显卡即可本地运行。该模型在代码、数学和复杂编辑任务上表现优异,支持实时补空、格式化和自我修复。这一发布可能颠覆文本生成的范式,从串行生成转向并行炼句。AI模型扩散模型文本生成开源/仓库Google并行生成推荐理由:DiffusionGemma 把文本生成速度拉到 4 倍,还彻底开源,做本地部署或加速日常 workflow 的开发者可以直接拖权重玩。原文
06:19LangChain@LangChainAINebius 发布了 Agent Blueprint,这是一个开源参考架构,旨在解决 AI 智能体在生产环境中因基础设施问题而失败的问题。该架构连接了智能体栈各层的成熟组件,包括 Deep Agents 和 LangSmith。它提供了构建、运营和持续改进生产级智能体的标准化方案,帮助开发者避免常见陷阱。对于正在构建或计划部署 AI 智能体的团队来说,这是一个值得关注的参考框架。行业智能体开源/仓库生产部署NebiusLangSmith推荐理由:智能体部署失败往往出在基础设施而非模型本身,Nebius 的开源架构直接给出了生产级参考方案,做智能体开发的团队可以拿来就用,省去自己踩坑的时间。原文
06:14Sundar Pichai@sundarpichaiGoogle CEO Sundar Pichai 宣布,Google 的模型权重已在 Hugging Face 上以 Apache 2.0 许可证开源。这意味着开发者可以自由下载、使用和修改这些模型,无需担心商业限制。此举降低了 AI 模型的使用门槛,尤其对研究者和中小团队利好。开源社区可以基于这些权重进行二次开发或集成到自己的应用中。AI模型开源/仓库Hugging FaceGoogle模型权重Apache 2.0推荐理由:Google 将模型权重以 Apache 2.0 开源,解决了开发者获取高质量预训练模型的门槛问题,做 AI 应用或研究的团队可以直接下载使用,值得关注。原文
05:16Kevin Weil@kevinweilCrownlands 宣布开源 Gateway 4M,这是迄今为止从活体人类中释放的最大单细胞组织数据集,旨在加速脑衰老和神经退行性疾病的研究。该数据集包含来自多个组织的单细胞转录组数据,为科学家和 AI 模型提供了宝贵的人类生物学参考。此举被认为对推动 AI 在科学与健康领域的影响至关重要,尤其有助于理解疾病机制和开发新疗法。行业开源/仓库单细胞数据集脑衰老神经退行性疾病Crownlands推荐理由:做生物信息学或 AI 药物研发的团队终于有了大规模活体人类单细胞数据可用,直接下载就能用于模型训练或疾病研究,建议相关研究者点开看看。原文
03:18Clement Delangue@ClementDelangueGoogle、Hugging Face 与开源 AI 社区联合发起 Gemma 挑战赛,旨在通过数十个智能体协作,让 Gemma 4 E4B 模型运行更快。Hugging Face 的 Hub 正从人类协作平台演变为智能体协作平台,这一赛事展示了 AI 智能体在模型优化中的潜力。挑战赛鼓励开发者参与,推动开源 AI 生态发展。AI产品智能体开源/仓库GemmaHugging Face模型优化推荐理由:这是 AI 智能体协作的实战案例,做模型优化或智能体开发的团队值得关注——看看智能体如何像人类一样在 Hub 上合作提速模型。原文