16:38marktechpost@Asif RazzaqCohere 推出了其首个面向开发者的编程模型 North Mini Code,采用混合专家架构,总参数量 30B,但每次推理仅激活 3B 参数,可在单张 H100 GPU 上运行。该模型支持 256K 上下文长度,专为智能体编程场景设计,能够高效处理代码生成、调试和自动化任务。作为开源权重模型,它降低了开发者部署高性能编程模型的门槛,尤其适合资源受限的团队。这一发布标志着 Cohere 正式进入 AI 编程助手领域,与 Code Llama、StarCoder 等模型竞争。AI模型CohereNorth Mini Code混合专家模型编程助手智能体10 个信源在谈推荐理由:Cohere 用 3B 活跃参数实现了 30B 模型的效果,做智能体编程的团队可以在单卡 H100 上直接部署,省成本又高效,建议做代码自动化的开发者试试。原文
05:48marktechpost@Asif Razzaq83°NVIDIA 发布了 Nemotron 3 Ultra,一个 550B 总参数(55B 激活)的开放混合专家模型,采用 Mamba-Transformer 混合架构。该模型支持 100 万 token 的上下文窗口,推理吞吐量比同等精度的开放 LLM 高约 6 倍。NVIDIA 同时开源了模型权重、训练数据和配方,遵循 OpenMDW-1.1 许可。这一发布旨在解决长时运行智能体在推理效率和上下文长度上的瓶颈,为 AI 代理和复杂任务自动化提供了更高效的基础模型。AI模型NVIDIANemotron 3 Ultra混合专家模型长上下文智能体10 个信源在谈推荐理由:长时智能体开发者终于有了一个兼顾超长上下文和高推理效率的开放模型——Nemotron 3 Ultra 的 6 倍吞吐量提升能显著降低部署成本,做 Agent 或 RAG 系统的团队值得直接试。原文
12:50IT之家(博客/媒体)精选78°英伟达发布 Nemotron 3 Ultra 开源模型,拥有 5500 亿参数,采用混合专家架构,专为全天候运行的自主智能体设计。该模型在推理速度上较同级别前沿模型最高提升 5 倍,使用成本降低 30%,并已适配 Hermes Agent、LangChain 等主流智能体平台。同时推出安全防护和语音识别模型,增强企业级智能体能力。CrowdStrike 和 Palantir 已将其用于网络安全和业务流程自动化。模型将于 6 月 4 日通过 Hugging Face 等平台以 NIM 微服务形式开放。AI模型英伟达Nemotron 3 Ultra开源模型智能体混合专家模型5 个信源在谈推荐理由:英伟达把大模型推理速度和成本同时优化了,做智能体开发或企业自动化的团队可以直接用上,比现有开源方案更高效省钱,值得关注。原文