20:05vLLM@vllm_project精选Cohere 开源了他们使用 AI 编码智能体维护 vLLM fork 的方法。该方法将维护视为控制循环:每次上游发布后 rebase,运行测试,诊断错误,修复,重复直到通过。原本数周的工作缩短到数天。技能库已开源(cohere-ai/vllm-skills),且修复已回馈上游。技巧CoherevLLM编码智能体开源推荐理由:Cohere 开源了用 AI agent 维护 vLLM fork 的实践,把几周工作缩到几天,修复还回馈了上游。原文
12:33Cohere@cohereCohere CEO Aidan Gomez 在推文中强调,使用 Cohere 服务时不存在分阶段发布或突然禁用的情况。他表示客户拥有完全控制权,Cohere 无法查看或关闭客户的模型。这体现了 Cohere 在企业 AI 信任与安全方面的差异化策略。行业Cohere企业AIAI安全信任与控制推荐理由:Cohere CEO 亲口说客户完全控场,不能偷看也不能关停,想要企业级安全 AI 的可以看看。原文
12:51Cohere@cohere精选Cohere宣布其首个开源智能体编码模型的4-bit量化版本已可用。该量化版模型体积显著缩小,可在Mac上本地运行。用户可通过链接获取模型权重。此次发布使得开发者能够更便捷地在个人设备上运行智能体编码模型。AI模型Cohere4-bit量化智能体编码模型开源模型推荐理由:Cohere把自己最新的编程智能体模型压缩到4-bit,Mac上就能跑,本地开发效率直接拉满!原文
12:49Cohere@cohereCohere CEO Aidan Gomez在Fortune杂志评论文章中指出,数字主权核心是用户对数据查看、系统修改和关闭权限的控制权。他认为AI工业革命早期阶段,各国仍危险地依赖少数几家大型科技公司。文章提出需重新思考AI基础设施的自主权。行业CohereAidan GomezFortuneAI主权数字主权推荐理由:Cohere CEO说现在各国AI太依赖几个巨头,该想想数据谁看、系统谁管了,挺实在的观点。原文
12:58Cohere@cohereCohere 联合创始人 Nick Frosst 在 MTSlive 上警告,订阅专有 LLM 存在风险,强调技术应归用户所有。Cohere 随后发布了新模型 North Mini Code,旨在让用户拥有和控制模型。此模型针对代码任务优化,支持主权使用。AI模型CohereNorth Mini Code开源模型代码模型推荐理由:Cohere 发了开源代码模型原文
15:38Sebastian Raschka@rasbt精选Cohere 推出了一款新的轻量级 30B 开源模型,基于 Command A+ 的并行 Transformer 架构,层数几乎翻倍。该模型专为智能体编程任务优化,在 Terminal-Bench 和 SWE-Bench 等基准测试中表现优于 Gemma 4。在 Terminal-Bench 中,模型需使用终端、检查环境、运行命令并读取输出;在 SWE-Bench 中,模型需处理真实 GitHub 软件问题,理解仓库、定位文件、生成补丁并通过测试。在 SciCode 和 LiveCodeBench 等传统代码基准上,模型也具备竞争力,但整体性能略低于 Qwen3.6。AI模型CohereCommand A+30B智能体编程助手推荐理由:Cohere 新 30B 模型专攻智能体编程,比 Gemma 4 强原文
12:09vLLM@vllm_project精选vLLM 宣布对 Cohere 的 North Mini Code 模型提供 Day-0 支持,该模型是一个开源的编码模型,专为智能体工作流设计。模型采用 Mixture-of-Experts 架构,总参数量 30B,活跃参数 3B,支持 256K 上下文和 64K 最大生成长度。它具备推理、工具使用和结构化输出能力,可直接通过最新稳定版 vLLM 部署。这一支持让开发者能快速在 vLLM 上运行该模型,用于构建复杂的智能体应用。AI产品vLLMCohereNorth Mini Code编码模型智能体3 个信源在谈推荐理由:做智能体工作流和编码应用的开发者,现在可以直接用 vLLM 部署 Cohere 的 North Mini Code 模型,省去适配麻烦,建议试试。原文
05:29Cohere@cohere精选Cohere 在两天前发布了其首个开源编程模型 North Mini Code。该模型专为代码生成和编程任务设计,可免费使用。开发者已开始利用它构建各种应用,社区反响积极。AI模型North Mini CodeCohere开源模型编程助手3 个信源在谈推荐理由:Cohere 出了个免费编程模型原文
16:38marktechpost@Asif RazzaqCohere 推出了其首个面向开发者的编程模型 North Mini Code,采用混合专家架构,总参数量 30B,但每次推理仅激活 3B 参数,可在单张 H100 GPU 上运行。该模型支持 256K 上下文长度,专为智能体编程场景设计,能够高效处理代码生成、调试和自动化任务。作为开源权重模型,它降低了开发者部署高性能编程模型的门槛,尤其适合资源受限的团队。这一发布标志着 Cohere 正式进入 AI 编程助手领域,与 Code Llama、StarCoder 等模型竞争。AI模型CohereNorth Mini Code混合专家模型编程助手智能体10 个信源在谈推荐理由:Cohere 用 3B 活跃参数实现了 30B 模型的效果,做智能体编程的团队可以在单卡 H100 上直接部署,省成本又高效,建议做代码自动化的开发者试试。原文
01:34elvis@omarsar0Cohere 发布了其首个开源编程模型 North Mini Code,专为智能体性能设计,小巧高效。该模型旨在本地运行,满足开发者对本地编程代理的需求。社区对此反应积极,认为距离实现本地运行的编程代理已不远。Cohere 团队鼓励社区参与和反馈,推动模型进一步优化。AI模型开源/仓库编程助手智能体CohereNorth Mini Code3 个信源在谈推荐理由:Cohere 开源编程模型 North Mini Code 解决了本地运行编程代理的痛点,适合追求高效、本地化开发的程序员和 AI 智能体开发者,建议立即体验。原文
13:13Cohere@cohere精选Cohere 宣布其首个编程模型 OpenCode North Mini Code 完全开源,并免费提供在 OpenCode 平台上。该模型拥有 256K 上下文窗口,支持长代码理解与生成。此举旨在推动主权 AI 理念,让更多开发者和组织能够自主使用和定制 AI 编程能力。开源版本将促进社区协作与创新,降低 AI 编程工具的门槛。AI模型CohereOpenCode开源/仓库编程助手主权AI推荐理由:Cohere 首次开源编程模型,256K 上下文窗口对处理大型代码库的开发者极具吸引力,做 AI 编程工具或需要自主部署模型的团队可以直接下载使用。原文
10:58shao__meng@shao__meng精选76°Cohere 发布了其首个开源编程模型 North Mini Code,采用 MoE 架构(30B 参数,3B 激活),拥有 128 个专家,每 token 激活 8 个。模型支持 256K 输入和 64K 输出上下文,最低可在 1× H100(FP8)上运行。训练采用三阶段后训练方法,包括级联 SFT、可验证奖励强化学习(RLVR)和跨 Harness 泛化,使其在 Agent 编程任务上表现突出。在 SWE-Bench Verified 上 pass@10 达 80.2%,Terminal-Bench v2 pass@10 达 55.1%,并在同量级开源模型中领先。模型原生支持交错思考与工具调用,适合子 Agent 编排、代码审查、终端操作等场景。AI模型开源模型编程模型Agent编程MoE架构Cohere6 个信源在谈推荐理由:Cohere 用 30B 参数实现了超越 120B 模型的 Agent 编程能力,做自动化代码修复和多步软件工程的开发者可以直接用起来,效率提升明显。原文
06:49berryxia@berryxia83°Cohere 将 30B 参数的 MoE 小模型 North Mini Code 以 Apache 2.0 协议开源,仅 3B 活跃参数。该模型在 Artificial Analysis Coding Index 上达到 33.4 分,与同量级模型竞争,但可本地运行、自由修改。其核心优势在于针对 agentic coding 场景优化,让开发者能真正掌控 coding agent,而非依赖云端黑盒。此举打破了开源 coding 模型弱或慢的刻板印象,为社区提供了可自主进化的工具。AI模型开源/仓库编程助手推理模型CohereAgentic Coding推荐理由:Cohere 把 30B MoE 模型压缩到 3B 活跃参数还开源,做 agentic coding 的开发者终于能本地跑、随便改、不用租云端黑盒了,值得一试。原文
13:14Cohere@cohereCohere 宣布与阿斯顿马丁 F1 车队达成合作,共同记录 2026 赛季的首个积分。合作强调在 F1 赛事中,数据准备、数据控制与决策能力是成功的关键。Cohere 将为企业 AI 提供类似 F1 赛车的精准决策支持,帮助企业在复杂环境中做出更优选择。这一合作展示了企业 AI 在体育竞技中的实际应用潜力。行业Cohere阿斯顿马丁F1企业AI数据驱动决策智能推荐理由:F1 赛事对数据实时性和决策精度的要求极高,做企业 AI 或数据分析的团队可以看看 Cohere 如何将赛车策略转化为商业智能方案,值得关注。原文
13:43Cohere@cohereCohere 宣布赞助一场由 Hugging Face 和 Gradio 主办的黑客马拉松,主题是“缩小规模”。活动鼓励开发者构建足够小、运行成本低,但又能真正改变他人生活的 AI 应用。参与者可以创造古怪有趣的 AI 作品,或为身边人解决实际问题。这反映了行业对轻量、实用 AI 模型的关注趋势。行业黑客马拉松CohereHugging FaceGradio轻量模型推荐理由:想用低成本模型做出真正有用的东西?这场黑客马拉松就是为你准备的——Cohere 赞助、Hugging Face 和 Gradio 主办,直接上手做点小而美的 AI 应用,建议关注。原文
13:34Cohere@cohereCohere 宣布其 Command A+ 模型在机器翻译方面取得新突破,性能显著超越开源对手如 Mistral Medium 3.5、DeepSeek 和 OpenAI 的 gpt-oss,甚至优于专业翻译系统 Google Translate。与 RWS 合作开发的系统表现更佳,但 A+ 已拉开明显差距。这标志着 Cohere 在翻译领域的竞争力大幅提升,尤其对需要高质量翻译的企业用户意义重大。AI模型CohereCommand A+机器翻译模型对比企业级AI8 个信源在谈推荐理由:做多语言内容或翻译服务的团队值得关注——Cohere 的 A+ 模型在翻译质量上已经超过主流开源和专有方案,可以直接用于生产环境,省去自研或调优的麻烦。原文
13:33Cohere@cohere精选Cohere 宣布其 Command A+ 模型在多语言翻译基准测试 WMT24++(xCOMET-XL)中,在所有主要欧洲语言上均超越竞争对手。具体表现为法语提升 2.4 分,西班牙语提升 1.9 分,德语提升 0.9 分。更高的翻译质量意味着更少的修正、更强的检索能力和更可靠的多语言智能体。这一进展对需要高质量多语言支持的团队尤为重要。AI模型CohereCommand A+多语言翻译WMT24++智能体推荐理由:做多语言应用或智能体的团队,翻译质量直接决定产品体验——Command A+ 在法语、西语、德语上全面领先,值得关注。原文
02:21Cohere@cohere精选Cohere 发布 Command A+,在非拉丁语系语言测试中表现突出。在韩语、日语、希伯来语、中文和阿拉伯语上均超越 Mistral Medium 3.5。尤其在阿拉伯语上,Command A+ 比 Mistral Medium 3.5 高 5 个百分点,比 DeepSeek V4 Pro Sovereign AI 高 10 个百分点。AI模型Command A+Mistral Medium 3.5DeepSeek V4 ProCohere多语言模型1 个信源在谈推荐理由:非拉丁语表现更优原文
17:50marktechpost@Michal Sutter78°Cohere 发布了 Command A+,一个 218B 参数的稀疏混合专家(MoE)模型,整合了此前四个 Command A 变体。该模型在 W4A4 量化下仅需两张 H100 GPU 即可运行,支持 48 种语言,是 Cohere 首个多模态推理模型,专为智能体工作流设计。其开源特性降低了部署门槛,适合需要高效多模态推理和智能体任务的团队。AI模型CohereCommand A+稀疏 MoE多模态推理智能体工作流推荐理由:Cohere 把 218B 模型压到两张 H100 就能跑,做智能体工作流的团队终于有了高性价比的开源选择——多模态推理和 48 语言支持直接可用,建议试试。原文
14:56Cohere@cohere精选Cohere 发布了新模型 Command A+,该模型针对 NVIDIA Blackwell 架构进行了优化,并使用了 NVIDIA CUDA-X 库进行训练。NVIDIA AI 基础设施团队公开祝贺,强调了双方在 AI 基础设施上的紧密合作。这一合作意味着 Command A+ 将充分利用 NVIDIA 最新硬件的性能,为企业和开发者提供更高效的 AI 推理能力。AI模型CohereCommand A+NVIDIA BlackwellAI 基础设施模型优化推荐理由:Cohere 与 NVIDIA 的深度合作让 Command A+ 在 Blackwell 上跑出最佳性能,做企业级 AI 部署的团队值得关注这个新选择。原文
13:55Cohere@cohere精选Cohere 发布了其最强开源大模型 Command A+,并已在 Hugging Face 上提供 W4A4 量化版本。该量化技术能在几乎不损失性能的情况下大幅降低模型部署的硬件需求,显著减少服务占用空间。开发者可以直接下载使用,适合资源受限的部署场景。AI模型CohereCommand A+W4A4量化开源/仓库模型部署推荐理由:Cohere 把最强模型做到 W4A4 量化还开源了,做推理部署的团队可以直接拿来降成本,值得一试。原文
00:21Cohere@cohereCohere 推出 Compass 平台,专门处理非结构化数据搜索难题。它通过视觉解析模型和增强嵌入技术,能检索手写、打字甚至机密文档。用户可搜索财务报告、邮件等,平台还能连接智能体。该工具解决了传统搜索难以处理复杂文档格式的问题。AI产品Cohere文档搜索非结构化数据视觉解析智能体推荐理由:做文档检索或智能体开发的团队,终于有了能处理手写和机密文件的搜索工具,值得试试 Compass 的实际效果。原文
14:13Cohere@cohere精选Cohere 发布技术报告,指出基于混合专家模型(MoE)的大型语言模型在推测解码(speculative decoding)中表现更优,打破了传统认知。推测解码是一种加速推理的技术,通常认为对密集模型更有效,但 Cohere 的实验表明 MoE 架构能进一步提升其效率。该发现有望降低推理成本,推动 MoE 模型在实时应用中的部署。论文MoE推测解码推理加速Cohere技术报告推荐理由:做 LLM 推理优化的开发者值得关注——MoE 模型在推测解码上的意外优势可能改变成本结构,建议点开报告看具体数据。原文
14:13Cohere@cohereCohere 与德国 AI 公司 Aleph Alpha 宣布建立跨大西洋合作伙伴关系,旨在为全球企业和政府提供主权级、企业级 AI 解决方案。该联盟结合了 Cohere 的全球规模与 Aleph Alpha 的欧洲研发实力,重点强调安全性、隐私性和信任度。合作将推动主权 AI 的发展,确保数据主权和合规性,尤其适合对数据安全有严格要求的欧洲客户。此举标志着 AI 领域国际合作的新模式,旨在平衡技术领先与地缘政治需求。行业主权AI国际合作企业级AI数据安全CohereAleph Alpha推荐理由:主权 AI 是企业和政府数据安全的关键,Cohere 与 Aleph Alpha 的联手为欧洲客户提供了合规的 AI 选项,做企业级部署的团队值得关注。原文
14:13Cohere@cohere精选Cohere 宣布其 W4A8 推理方案已集成到 vLLM 中,通过结合 4 位权重(低内存)和 8 位激活(高计算),在 Hopper 架构上实现了解码和预填充阶段的显著加速。相比 W4A16,TTFT(首 token 生成时间)提升高达 58%,TPOT(每 token 输出时间)提升 45%。这一优化让大模型推理在保持低内存占用的同时大幅提升计算效率,适合生产环境部署。AI模型推理优化vLLMW4A8Cohere模型部署推荐理由:Cohere 的 W4A8 方案解决了大模型推理中内存与速度的权衡问题,做模型部署和推理优化的团队可以直接在 vLLM 中体验,值得关注。原文