AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:混合专家模型×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
16:38
16:38marktechpost@Asif Razzaq
Cohere 推出了其首个面向开发者的编程模型 North Mini Code,采用混合专家架构,总参数量 30B,但每次推理仅激活 3B 参数,可在单张 H100 GPU 上运行。该模型支持 256K 上下文长度,专为智能体编程场景设计,能够高效处理代码生成、调试和自动化任务。作为开源权重模型,它降低了开发者部署高性能编程模型的门槛,尤其适合资源受限的团队。这一发布标志着 Cohere 正式进入 AI 编程助手领域,与 Code Llama、StarCoder 等模型竞争。
AI模型CohereNorth Mini Code混合专家模型编程助手智能体

推荐理由:Cohere 用 3B 活跃参数实现了 30B 模型的效果,做智能体编程的团队可以在单卡 H100 上直接部署,省成本又高效,建议做代码自动化的开发者试试。
原文
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月5日
05:48
05:48marktechpost@Asif Razzaq
83°
NVIDIA 发布了 Nemotron 3 Ultra,一个 550B 总参数(55B 激活)的开放混合专家模型,采用 Mamba-Transformer 混合架构。该模型支持 100 万 token 的上下文窗口,推理吞吐量比同等精度的开放 LLM 高约 6 倍。NVIDIA 同时开源了模型权重、训练数据和配方,遵循 OpenMDW-1.1 许可。这一发布旨在解决长时运行智能体在推理效率和上下文长度上的瓶颈,为 AI 代理和复杂任务自动化提供了更高效的基础模型。
AI模型NVIDIANemotron 3 Ultra混合专家模型长上下文智能体

推荐理由:长时智能体开发者终于有了一个兼顾超长上下文和高推理效率的开放模型——Nemotron 3 Ultra 的 6 倍吞吐量提升能显著降低部署成本,做 Agent 或 RAG 系统的团队值得直接试。
原文
6月1日
12:50
12:50IT之家(博客/媒体)
精选78°
英伟达发布 Nemotron 3 Ultra 开源模型,拥有 5500 亿参数,采用混合专家架构,专为全天候运行的自主智能体设计。该模型在推理速度上较同级别前沿模型最高提升 5 倍,使用成本降低 30%,并已适配 Hermes Agent、LangChain 等主流智能体平台。同时推出安全防护和语音识别模型,增强企业级智能体能力。CrowdStrike 和 Palantir 已将其用于网络安全和业务流程自动化。模型将于 6 月 4 日通过 Hugging Face 等平台以 NIM 微服务形式开放。
AI模型英伟达Nemotron 3 Ultra开源模型智能体混合专家模型

推荐理由:英伟达把大模型推理速度和成本同时优化了,做智能体开发或企业自动化的团队可以直接用上,比现有开源方案更高效省钱,值得关注。
原文
精选全部日报登录