16:14Z.ai (智谱国际)@Zai_org精选智谱 AI 发布新旗舰模型 GLM-5.2,现已面向所有 GLM 编程计划用户(包括 Lite、Pro、Max 和 Team 计划)开放。该模型具备强大的编码能力,支持 100 万 token 上下文,并在长周期任务中表现持续强劲。API 和聊天机器人服务将于下周上线,模型也将于下周以 MIT 许可证正式开源。AI模型GLM-5.2智谱AI开源模型编程助手2 个信源在谈推荐理由:智谱开源新旗舰,百万上下文原文
16:09Viking@vikingmuteShadcn 的 /improve 思路主张用最强大的模型(如 GPT-6)深入理解代码库、发现问题并产出高质量计划,而将实际执行交给更便宜的模型完成。Skill 本身绝不直接修改代码,只负责产出计划,主 Skill 包括快速和全面等多种模式。该 repo 发布 4 天即获 3.7K stars,作者认为 skills 是目前最容易获得 stars 的方式。技巧shadcn/improve编程助手开源模型智能体1 个信源在谈推荐理由:Shadcn 教你用最强模型出计划原文
10:52Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在推文中强调 AI 发展没有必然性,所有人都有选择权。他对比两条路径:封闭 API 导致权力集中,或开源 AI 让所有人参与。他引用 SemiAnalysis 的案例:里约热内卢市基于 Qwen 7/2 后训练了 Rio 3.5 Open 397B 模型,该模型采用 SwiReasoning 框架,动态切换标准链式推理和隐空间推理,通过熵置信信号提升 token 效率。行业Clement DelangueHugging Face开源模型QwenSwiReasoning推荐理由:开源 vs 封闭,里约市用 Qwen 做示范原文
09:52Geek@geekbb精选一个名为 Archify 的开源项目展示了通过 LLM(如 pi 和 DeepSeek)将自然语言描述转换为结构化 JSON,再经 Node.js 渲染器用纯几何算法生成 SVG 并注入自包含 HTML 的流程。该方法无需依赖任何生图模型,仅利用 LLM 的指令遵循能力即可实现从文本到矢量图形的转换。项目代码托管在 GitHub 上,提供了一种轻量级的 AI 绘图新思路。技巧DeepSeekpiArchifySVG开源模型推荐理由:不用生图模型也能画图原文
02:22Paul Couvert@itsPaulAiPaulAI在推文中强调AI不应被封闭组织垄断,建议使用闭源模型创建技能、工具、数据集和工作流,以改进本地模型。他指出本地AI模型现在易于使用且能力远超预期,可连接Codex、Claude Code等工具实现自动化。用户可根据需要微调这些模型。技巧开源模型本地模型CodexClaude Code微调推荐理由:教你用闭源模型养本地模型原文
02:01lmarena.ai@lmarena_ai精选Kimi 发布并开源了最新编程模型 Kimi-K2.7-Code,相比 K2.6 在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。推理效率优化,推理 token 使用量降低 30%。支持长程编程任务,指令遵循和端到端成功率更高。模型已通过 Kimi API 和 Kimi Code 提供。AI模型Kimi-K2.7-CodeKimi开源模型编程助手推理模型5 个信源在谈推荐理由:Kimi 开源新编程模型,性能全面超越前代原文
22:21Geek@geekbb精选智谱AI宣布GLM-5.2完全开源,这是其最强开源模型。该模型支持1M上下文窗口,在长周期任务独立完成方面保持领先,为复杂智能体应用提供基础支持。GLM-5.2也是智谱最强国产编程模型的核心引擎。今晚5:21起,所有GLM编程计划用户(Lite/Pro/Max)均可使用,API下周上线。AI模型GLM-5.2智谱AI开源模型智能体编程助手2 个信源在谈推荐理由:智谱开源最强模型GLM-5.2,1M上下文免费可用原文
18:22Thomas Wolf@Thom_WolfThom Wolf在推文中指出,开源模型在AGI时代将成为文明韧性的关键组成部分。他认为,无论任何个体行为者如何决策,开源模型都能确保人类保留对有意义智能水平的访问权。这一观点强调了开源AI在分散控制权和保障集体利益方面的重要性。行业开源模型AGI文明韧性Thom Wolf推荐理由:开源模型保障AGI时代人类智能原文
17:52orange.ai@oran_geFable 5 模型因美国政府以国家安全为由要求 Anthropic 下架,已从全球范围移除。Kimi 发布开源 coding 模型 K2.7 Code,相比 K2.6 提升 20% 编码能力,思考 token 减少 30%,API 输入 6.5 元、输出 27 元。智谱宣布即将发布 GLM 5.2,强调前沿智能应开放可用。行业Fable 5AnthropicKimiK2.7 CodeGLM 5.2开源模型10 个信源在谈推荐理由:Fable 5 下架,Kimi 和智谱发新模型原文
17:51shao__meng@shao__meng智谱发布GLM-5.2旗舰模型,面向所有GLM Coding Plan用户(Lite、Pro、Max、Team)开放。该模型具备强大编码能力,支持1M上下文,并在长任务处理上持续优化。API和聊天机器人服务将于下周上线,模型也将以MIT许可证正式开源。AI模型GLM-5.2智谱开源模型编码助手1M上下文推荐理由:智谱GLM-5.2开源,1M上下文编码强原文
16:52Fireworks AI@FireworksAI_HQFireworks AI 宣布其平台支持 Qwen 3.7 模型,并提供与 OpenAI 和 Anthropic 兼容的 API 端点。该服务可无缝集成到 Claude Code、Cursor、LangChain 等现有工具中。用户可立即使用无服务器版本,并申请 Qwen 3.7 Max 的早期访问。Fireworks AI 还提供定制工作负载支持。AI产品Qwen 3.7Fireworks AIAPI端点开源模型10 个信源在谈推荐理由:Fireworks 让 Qwen 3.7 即插即用原文
13:17Amazon Science@AmazonScience精选Amazon 研究人员推出 Simple Strands Agent (SSA),这是一个轻量级开源框架。SSA 在 SWE-Bench-Verified、SWE-Bench-Pro 和 Terminal-Bench2 三个基准上均达到当前最优 (SOTA)。该框架通过缩小模型意图与执行之间的差距来提升性能。SSA 的设计强调简洁与可复现性。AI模型Simple Strands AgentAmazonSWE-Bench开源模型编程助手1 个信源在谈推荐理由:轻量开源,三个基准登顶原文
11:15ollama@ollamaKimi-K2.7-Code 是 Kimi 最新开源的编程模型,现已在 Ollama 云上可用,部署于美国 NVIDIA B300 数据中心 GPU。相比 K2.6,该模型在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。推理 token 使用量降低 30%,减少过度思考。支持长周期编码任务,指令遵循能力更强。AI模型Kimi-K2.7-CodeOllama编程助手开源模型NVIDIA B30010 个信源在谈推荐理由:Kimi 新编程模型上线 Ollama,性能大涨原文
11:05lmarena.ai@lmarena_ai精选NVIDIA 的 Nemotron 3 Ultra 在 Agent Arena 排行榜上位列第20名,在开源模型中排第5。该模型在用户表扬与投诉的净差值和工具幻觉率方面表现突出,但在可操控性和 bash 恢复能力上存在短板。排行榜基于30万+任务、200万+工具调用和4000万行代码的评测数据。当前分数置信区间较宽,排名仍在稳定中。AI模型Nemotron 3 UltraNVIDIAAgent Arena开源模型智能体10 个信源在谈推荐理由:NVIDIA 开源模型在智能体评测中排第5原文
10:55MiniMax_AI@MiniMax_AI精选MiniMax 发布 M3 模型,总参数量约 428B,激活参数约 23B。该模型在编码、长周期智能体和原生多模态(文本、图像、视频)任务上表现优异,支持 1M token 上下文长度。M3 以开源权重形式发布,在 Baseten 平台可运行。AI模型MiniMaxM3开源模型多模态智能体推荐理由:开源模型能打编码和多模态原文
10:53Together AI@togethercompute精选MiniMax 发布开源权重原生多模态模型 MiniMax-M3,具备 1M 上下文窗口和 MiniMax 稀疏注意力机制。模型提供思考与非思考两种模式。Together AI 作为首选云合作伙伴,通过推理优化在并发场景下实现高达 125% 的吞吐量提升。AI模型MiniMax-M3Together AI多模态开源模型1M上下文7 个信源在谈推荐理由:MiniMax 新模型上线,吞吐量提升 125%原文
10:18berryxia@berryxia精选73°Kimi 发布 K2.7-Code 模型,开源权重和代码至 Hugging Face。相比上一代,token 消耗减少 30%,agent 长任务成功率提升。在 Kimi Code Bench v2 上提升 21.8%,Program Bench 提升 11%,MLS Bench Lite 提升 31.5%。模型通过高效推理解决 coding model 过度思考问题,并预告 6x High-Speed Mode。AI模型KimiK2.7-Code开源模型编程助手推理模型推荐理由:Kimi 开源新模型,少烧 token 还能干更多活原文
09:44orange.ai@oran_ge开发者 oran_ge 用 Claude Fable 5 打磨文案三遍,发现改后文字虽更讲究但人味儿递减。经讨论,将缺失归结为“存在感”——文字背后缺乏具体的人与代价。据此制作《人味儿写作心法.skill》并开源发布,专用于 AI 改稿场景,帮助保留文字的人味儿。技巧Claude Fable 5提示词工程开源模型写作10 个信源在谈推荐理由:开源技能让 AI 改稿保留人味儿原文
22:47vLLM@vllm_project73°MiniMax AI 发布了新一代开源模型 MiniMax M3,具备前沿的编码和智能体能力,原生支持图像和视频输入、计算机使用功能,并拥有 100 万 token 的上下文窗口。其核心是 MSA(MiniMax Sparse Attention)稀疏注意力架构,通过仅对 top 128-token KV 块进行注意力计算,大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持,可在 NVIDIA 和 AMD 硬件上运行,支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。AI模型MiniMax M3稀疏注意力1M上下文开源模型vLLM10 个信源在谈推荐理由:M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈,做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。原文
17:56shao__meng@shao__meng精选在华为开发者大会HDC 2026上,余承东宣布开源盘古模型全面升级,推出openPangu 2.0版本。该版本在性能、效率等方面进行了优化,具体改进细节尚未公布。余承东强调团队将保持领先,持续追赶行业前沿。AI模型openPangu华为盘古开源模型推荐理由:华为开源盘古2.0来了原文
05:29Cohere@cohere精选Cohere 在两天前发布了其首个开源编程模型 North Mini Code。该模型专为代码生成和编程任务设计,可免费使用。开发者已开始利用它构建各种应用,社区反响积极。AI模型North Mini CodeCohere开源模型编程助手3 个信源在谈推荐理由:Cohere 出了个免费编程模型原文
00:26SiliconFlowAI@siliconflowai精选NousResearch 推出了 Hermes Agent Desktop,这是一款桌面端智能体工具,允许用户通过 SiliconFlow 平台一键切换多种前沿开源模型,包括 DeepSeek-V4、GLM-5.1、Kimi-K2.6 和 MiniMax-M3 等。该工具旨在降低使用开源模型的复杂度,让开发者无需手动配置即可快速体验不同模型的能力。SiliconFlow 作为底层推理平台,提供了统一的 API 和模型管理功能,进一步简化了部署流程。这一发布意味着开源模型生态在易用性上迈出了重要一步,尤其适合需要频繁对比或切换模型的 AI 应用开发者。AI产品智能体开源模型模型切换NousResearchSiliconFlow7 个信源在谈推荐理由:做 AI 应用或智能体开发的团队终于可以像换 App 一样切换开源模型了——Hermes Agent Desktop 把模型切换成本降到零,建议直接上手试试。原文
03:20Clement Delangue@ClementDelangueHugging Face 联合创始人 Clement Delangue 在 X 上发起讨论,询问是否应该尝试训练一个开源 AI 建筑模型。他指出 Hugging Face 拥有丰富的相关数据集,包括 HF、MLintern、transformers、trl 等。该提议引发了社区关注,获得 36 条评论、6 次转发、150 个赞和 4284 次浏览。这表明开源 AI 在建筑领域的应用潜力正受到关注,可能推动建筑行业智能化发展。行业开源模型建筑行业Hugging Face数据集AI 应用推荐理由:Hugging Face 联合创始人的提议直击开源 AI 在垂直领域的落地机会,建筑行业的开发者或研究者可以关注这个方向,看看能否用现有数据集推动创新。原文
03:06NVIDIA AI@NVIDIAAI76°Google DeepMind 推出实验性开源模型 DiffusionGemma,采用文本扩散技术,每步并行生成 256 个 token,推理速度可达 150+ TPS(DGX Spark)或 1000+ TPS(单张 H100)。该模型激活仅 3.8B 参数,量化后可在 24GB VRAM 消费级 GPU 上运行,适合代码填充、内联编辑等非线性任务。NVIDIA 从首日起提供 BF16/NVFP4 检查点、免费 GPU 加速端点及 vLLM 支持。DiffusionGemma 优先速度而非极致质量,生产场景仍推荐标准 Gemma 4。AI模型文本扩散并行生成开源模型Google DeepMindNVIDIA10 个信源在谈推荐理由:文本扩散模型把生成速度拉到新高度,做代码补全或实时编辑的开发者可以直接在 NVIDIA 端点试跑,感受并行 token 的爽感。原文
01:46elvis@omarsar0AI 研究员 Omar 指出,随着超级强大的 AI 模型即将发布,当前最大的错误是锁定单一供应商。他建议从成本和工程角度出发,规划如何利用多种模型组合,包括开源模型。通过模型路由(routing)将任务分配给最适合的模型,能获得灵活性、数据控制权和用例自由。这对 AI 工程师和研究者来说,是未来工程化的关键策略。行业模型锁定模型路由开源模型AI 工程供应商策略推荐理由:Omar 点破了模型锁定的风险,做 AI 工程和选型的团队值得花时间规划模型路由策略,避免被单一供应商绑架。原文
23:46elvis@omarsar0Elvis 在推文中警告,未来几周将发布超级强大的 AI 模型,可能带来能力阶跃变化。他建议不要锁定单一供应商,而应从工程角度考虑如何组合使用多种模型(包括开源模型),以便随时切换并利用各自优势。对于编程智能体,开源模型已与前沿模型相当。他推荐将 AI 模型路由作为工程重点,以高效分配任务。行业AI模型模型路由开源模型编程智能体供应商锁定推荐理由:Elvis 点出了 AI 模型即将爆发的关键节点,做 AI 工程和智能体开发的团队应该立刻开始规划模型路由策略,避免被单一供应商绑定。原文
17:26Together AI@togethercomputeTogether AI 宣布与云分销商 Pax8 合作,将高性能、低成本的 AI 基础设施和领先的开源模型带给全球中小企业。此举打破了 AI 资源被大公司垄断的局面,使中小企业也能利用先进的 AI 技术。合作将通过 Pax8 的渠道网络,让更多企业轻松获取 Together AI 的模型和服务。行业AI 基础设施开源模型中小企业Together AIPax8推荐理由:中小企业终于能低成本用上顶级 AI 基础设施,做技术选型或预算有限的团队可以直接关注。原文
10:58shao__meng@shao__meng精选76°Cohere 发布了其首个开源编程模型 North Mini Code,采用 MoE 架构(30B 参数,3B 激活),拥有 128 个专家,每 token 激活 8 个。模型支持 256K 输入和 64K 输出上下文,最低可在 1× H100(FP8)上运行。训练采用三阶段后训练方法,包括级联 SFT、可验证奖励强化学习(RLVR)和跨 Harness 泛化,使其在 Agent 编程任务上表现突出。在 SWE-Bench Verified 上 pass@10 达 80.2%,Terminal-Bench v2 pass@10 达 55.1%,并在同量级开源模型中领先。模型原生支持交错思考与工具调用,适合子 Agent 编排、代码审查、终端操作等场景。AI模型开源模型编程模型Agent编程MoE架构Cohere6 个信源在谈推荐理由:Cohere 用 30B 参数实现了超越 120B 模型的 Agent 编程能力,做自动化代码修复和多步软件工程的开发者可以直接用起来,效率提升明显。原文
08:42elvis@omarsar0AI专家警告,未来几周将有超级强大的AI模型发布,模型能力可能迎来阶跃式变化。最大的错误是锁定单一供应商,应从成本和工程角度考虑组合使用多种模型(包括开源模型)。对于编程智能体,开源模型已与前沿模型相当。建议提前规划任务路由策略,AI模型路由是高回报的工程方向。行业AI模型模型路由开源模型编程智能体供应商锁定推荐理由:AI能力即将跃升,锁定单一供应商是最大风险——做AI工程和智能体开发的团队,现在就该规划模型路由策略,建议点开看看具体怎么准备。原文
08:25AI Will@FinanceYF588°NVIDIA 近日发布 Nemotron 3 Ultra,这是一款专为长期运行的 AI Agent 设计的旗舰开源模型。该模型采用 550B 参数的 MoE 架构,激活参数仅 55B,推理速度比同级开源模型快 5 倍,Agent 任务成本降低 30%。Nemotron 3 Ultra 旨在解决复杂、长时间运行的 Agent 任务中的效率与成本问题,为开发者提供高性能且经济的选择。该模型的开源特性有望推动 Agent 应用生态的发展。AI模型NVIDIANemotron 3 Ultra开源模型AgentMoE10 个信源在谈推荐理由:做 Agent 开发的团队终于有了一个高性能且成本可控的开源选择——Nemotron 3 Ultra 推理快 5 倍、成本降 30%,值得直接上手试试。原文
03:09Jerry Liu@jerryjliu0精选LlamaIndex 创始人 Jerry Liu 指出,没有前沿实验室能独占成本、延迟与精度的帕累托前沿所有点,开源模型在成本上可低数个数量级。他观察到组织对模型路由和成本优化的兴趣激增,原因包括企业更谨慎管理成本,以及 AI 初创公司寻求构建护城河和提高毛利率。他引用 Chamath 的数据对比:每月 10 亿 token 输入/输出场景下,GPT-5.5 Pro 成本约 10.5 万美元,而 DeepSeek V4 Pro 仅需 5220 美元,能力差距远小于价格差距。Jerry 认为,随着控制平面(如 Software Factory)普及,前沿实验室收入增速将下降,开源模型收入将飙升。行业开源模型成本优化模型路由帕累托前沿LlamaIndex推荐理由:Jerry Liu 用真实成本数据揭示了模型选择的巨大经济差异,做 AI 应用选型或成本控制的团队值得仔细看——选对模型能省下 20-40 倍 token 成本。原文
13:20Perplexity@perplexity_ai72°Perplexity 宣布其 Pro 和 Max 订阅用户现在可以使用 Nemotron 3 Ultra 模型。该模型由 NVIDIA 开发,是一款专为长时间运行的智能体任务设计的新开源模型。此举将高性能的智能体能力直接提供给付费用户,无需额外配置。对于依赖 AI 进行复杂、持续任务的用户来说,这是一个直接可用的新选择。AI产品PerplexityNemotron 3 UltraNVIDIA智能体开源模型10 个信源在谈推荐理由:做长任务智能体的开发者可以直接在 Perplexity 上体验 NVIDIA 的最新开源模型,省去部署成本,值得 Pro/Max 用户试试。原文
08:27rohanpaul_ai@rohanpaul_aiAnthropic 表示其 80% 的新生产代码由 Claude 编写,标志着 AI 编程在大型科技公司中的深度应用。Google 新论文显示通用 LLM 通过规划证明和逐步检查,在形式数学任务上从低于 10% 提升至 70% 的准确率。Google 开源 Gemma 4 12B 模型,支持音频和视频分析,可在消费级 16GB GPU 上完全本地运行。阿里巴巴发布 Qwen3.7-Plus,支持文本、视频和图像输入,价格低廉但保持闭源。Anthropic 的化学报告也展示了令人惊讶的结果。行业AnthropicClaudeGoogleGemma 4Qwen3.7-PlusAI编程数学推理开源模型10 个信源在谈推荐理由:AI 编程和数学推理的突破正在改变开发和研究方式,做 AI 应用或数学研究的团队值得关注这些进展,尤其是 Claude 的代码生成和 Gemma 4 的本地部署能力。原文
08:03Aravind Srinivas@AravSrinivasNVIDIA 最新的开源模型 Nemotron 3 Ultra 现已上线 Perplexity,面向所有 Pro 和 Max 用户开放。该模型专为长时间运行的智能体任务设计,是美国领先的开源模型之一。用户可以直接在 Perplexity 平台上体验其长上下文和推理能力。此举进一步丰富了 Perplexity 的模型选择,为开发者提供了更多开源选项。AI产品Nemotron 3 UltraNVIDIAPerplexity开源模型智能体10 个信源在谈推荐理由:NVIDIA 的 Nemotron 3 Ultra 是专为长时智能体任务设计的开源模型,做 AI 智能体开发的团队可以直接在 Perplexity 上试用,省去本地部署的麻烦。原文
05:16lmarena.ai@lmarena_aiImage Arena 最新排名显示,开源文生图模型竞争激烈。Ideogram-4.0 Quality 以 1204 分位居第一,腾讯 Hunyuan Image 3.0 以 1151 分紧随其后,仅比第三名 Flux-2 Dev 高 1 分。阿里 Qwen Image 2512 和 HiDream-O1 Image 分别位列第四和第五。前六名来自不同实验室,而 Flux 和 Qwen 在前 15 名中占据多个席位,显示出深度优势。AI模型文生图开源模型IdeogramHunyuanQwen推荐理由:开源文生图模型的排名变化直接反映技术趋势,做图像生成应用或研究的人可以据此选择模型,值得关注 Ideogram 和 Hunyuan 的最新进展。原文
22:18Paul Couvert@itsPaulAi72°NVIDIA 发布了开源模型 Nemotron 3 Ultra,专为智能体任务和编程设计。该模型在性能上接近闭源模型 GPT 5.5,但推理成本仅为后者的十分之一($0.051 vs $0.57)。Nemotron 3 Ultra 速度比同类模型快5倍,成本低30%,已在 Hugging Face 上开源。这标志着开源模型与闭源模型之间的质量差距正在迅速缩小,尤其适合处理大型代码库和智能体应用。AI模型NVIDIANemotron 3 Ultra开源模型推理模型编程助手10 个信源在谈推荐理由:开源模型性能逼近闭源,成本却低一个数量级——做智能体或编程的开发者可以直接在 Hugging Face 上试用,省下不少推理预算。原文
19:26SiliconFlowAI@siliconflowaiDeepSeek 在 OpenRouter 平台上的 Token 使用量连续四周排名第一,显示出其模型在开发者社区中的广泛采用。SiliconFlow 宣布为这一份额提供重要支持,并提供了完整的 DeepSeek 模型系列,包括 V4 Pro、Flash、V3.2 等,其中 V4 Pro 和 Flash 以最佳性价比著称。这一趋势反映了 DeepSeek 在开源模型领域的竞争力,尤其是在推理和编程任务上的表现。AI模型DeepSeekOpenRouterToken 份额开源模型SiliconFlow推荐理由:DeepSeek 连续四周霸榜 OpenRouter Token 份额,说明开发者正在大量使用其模型做推理和编程。如果你在找性价比高的开源模型,SiliconFlow 上 V4 Pro 和 Flash 值得试试。原文
08:12lmarena.ai@lmarena_ai精选83°NVIDIA 今日正式发布 Nemotron 3 Ultra,这是一款 550B 参数的混合专家(MoE)开源模型,定位为前沿智能(frontier-intelligence)模型,专为长时间运行的智能体任务打造。相比其他开源前沿模型,Nemotron 3 Ultra 推理速度提升 5 倍,复杂智能体任务成本降低高达 30%。该模型旨在解决当前开源模型在长周期、高复杂度任务中推理慢、成本高的问题,为开发者提供更高效的智能体基础设施。AI模型NVIDIANemotron 3 UltraMoE开源模型智能体10 个信源在谈推荐理由:做智能体开发和部署的团队终于有了一个开源的高效选择——Nemotron 3 Ultra 直接降低长任务推理成本 30%,建议关注并测试其在实际 agent 场景中的表现。原文
01:18Paul Couvert@itsPaulAiNvidia 发布了 Nemotron 3 Ultra 开源 AI 模型,专为智能体任务和编程场景优化。该模型在推理速度上比同类模型快 5 倍,成本降低 30%,并已在 Hugging Face 上开放下载。它特别适合处理大型代码库,并支持 Hermes Agent 等智能体框架。这一发布意味着开发者可以更高效、更经济地构建 AI 智能体应用。AI模型NvidiaNemotron 3 Ultra开源模型智能体编程助手10 个信源在谈推荐理由:做智能体开发或大型代码库编程的团队,终于有了一个又快又便宜的开源选择——Nemotron 3 Ultra 速度提升 5 倍、成本降低 30%,值得直接上 Hugging Face 试试。原文
00:12Geek@geekbb精选Nvidia 与 Nous Research 合作,在 Hermes 平台(Nous Portal)上提供最新的 Nemotron 3 Ultra 模型免费使用两周。该模型属于开放前沿基础模型,旨在推动开源模型发展。用户可通过 Nous Portal 直接访问并体验。AI模型Nemotron 3 UltraNvidiaNous ResearchHermes开源模型10 个信源在谈推荐理由:免费体验强模型原文