全部 AI 动态 · AI 热点

6月26日

20:05

vLLM@vllm_project

精选

Cohere 开源了他们使用 AI 编码智能体维护 vLLM fork 的方法。该方法将维护视为控制循环：每次上游发布后 rebase，运行测试，诊断错误，修复，重复直到通过。原本数周的工作缩短到数天。技能库已开源（cohere-ai/vllm-skills），且修复已回馈上游。

技巧 Cohere vLLM 编码智能体开源

推荐理由：Cohere 开源了用 AI agent 维护 vLLM fork 的实践，把几周工作缩到几天，修复还回馈了上游。

原文

12:33

Cohere@cohere

Cohere CEO Aidan Gomez 在推文中强调，使用 Cohere 服务时不存在分阶段发布或突然禁用的情况。他表示客户拥有完全控制权，Cohere 无法查看或关闭客户的模型。这体现了 Cohere 在企业 AI 信任与安全方面的差异化策略。

行业 Cohere 企业AI AI安全信任与控制

推荐理由：Cohere CEO 亲口说客户完全控场，不能偷看也不能关停，想要企业级安全 AI 的可以看看。

原文

6月19日

12:51

Cohere@cohere

精选

Cohere宣布其首个开源智能体编码模型的4-bit量化版本已可用。该量化版模型体积显著缩小，可在Mac上本地运行。用户可通过链接获取模型权重。此次发布使得开发者能够更便捷地在个人设备上运行智能体编码模型。

AI模型 Cohere 4-bit量化智能体编码模型开源模型

推荐理由：Cohere把自己最新的编程智能体模型压缩到4-bit，Mac上就能跑，本地开发效率直接拉满！

原文

6月18日

12:49

Cohere@cohere

Cohere CEO Aidan Gomez在Fortune杂志评论文章中指出，数字主权核心是用户对数据查看、系统修改和关闭权限的控制权。他认为AI工业革命早期阶段，各国仍危险地依赖少数几家大型科技公司。文章提出需重新思考AI基础设施的自主权。

行业 Cohere Aidan Gomez Fortune AI主权数字主权

推荐理由：Cohere CEO说现在各国AI太依赖几个巨头，该想想数据谁看、系统谁管了，挺实在的观点。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

12:58

Cohere@cohere

Cohere 联合创始人 Nick Frosst 在 MTSlive 上警告，订阅专有 LLM 存在风险，强调技术应归用户所有。Cohere 随后发布了新模型 North Mini Code，旨在让用户拥有和控制模型。此模型针对代码任务优化，支持主权使用。

AI模型 Cohere North Mini Code 开源模型代码模型

推荐理由：Cohere 发了开源代码模型

原文

6月14日

15:38

Sebastian Raschka@rasbt

精选

Cohere 推出了一款新的轻量级 30B 开源模型，基于 Command A+ 的并行 Transformer 架构，层数几乎翻倍。该模型专为智能体编程任务优化，在 Terminal-Bench 和 SWE-Bench 等基准测试中表现优于 Gemma 4。在 Terminal-Bench 中，模型需使用终端、检查环境、运行命令并读取输出；在 SWE-Bench 中，模型需处理真实 GitHub 软件问题，理解仓库、定位文件、生成补丁并通过测试。在 SciCode 和 LiveCodeBench 等传统代码基准上，模型也具备竞争力，但整体性能略低于 Qwen3.6。

AI模型 Cohere Command A+30B 智能体编程助手

推荐理由：Cohere 新 30B 模型专攻智能体编程，比 Gemma 4 强

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

12:09

vLLM@vllm_project

精选

vLLM 宣布对 Cohere 的 North Mini Code 模型提供 Day-0 支持，该模型是一个开源的编码模型，专为智能体工作流设计。模型采用 Mixture-of-Experts 架构，总参数量 30B，活跃参数 3B，支持 256K 上下文和 64K 最大生成长度。它具备推理、工具使用和结构化输出能力，可直接通过最新稳定版 vLLM 部署。这一支持让开发者能快速在 vLLM 上运行该模型，用于构建复杂的智能体应用。

AI产品 vLLM Cohere North Mini Code 编码模型智能体

推荐理由：做智能体工作流和编码应用的开发者，现在可以直接用 vLLM 部署 Cohere 的 North Mini Code 模型，省去适配麻烦，建议试试。

原文

05:29

Cohere@cohere

精选

Cohere 在两天前发布了其首个开源编程模型 North Mini Code。该模型专为代码生成和编程任务设计，可免费使用。开发者已开始利用它构建各种应用，社区反响积极。

AI模型 North Mini Code Cohere 开源模型编程助手

推荐理由：Cohere 出了个免费编程模型

原文

6月11日

16:38

marktechpost@Asif Razzaq

Cohere 推出了其首个面向开发者的编程模型 North Mini Code，采用混合专家架构，总参数量 30B，但每次推理仅激活 3B 参数，可在单张 H100 GPU 上运行。该模型支持 256K 上下文长度，专为智能体编程场景设计，能够高效处理代码生成、调试和自动化任务。作为开源权重模型，它降低了开发者部署高性能编程模型的门槛，尤其适合资源受限的团队。这一发布标志着 Cohere 正式进入 AI 编程助手领域，与 Code Llama、StarCoder 等模型竞争。

AI模型 Cohere North Mini Code 混合专家模型编程助手智能体

推荐理由：Cohere 用 3B 活跃参数实现了 30B 模型的效果，做智能体编程的团队可以在单卡 H100 上直接部署，省成本又高效，建议做代码自动化的开发者试试。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

01:34

elvis@omarsar0

Cohere 发布了其首个开源编程模型 North Mini Code，专为智能体性能设计，小巧高效。该模型旨在本地运行，满足开发者对本地编程代理的需求。社区对此反应积极，认为距离实现本地运行的编程代理已不远。Cohere 团队鼓励社区参与和反馈，推动模型进一步优化。

AI模型开源/仓库编程助手智能体 Cohere North Mini Code

推荐理由：Cohere 开源编程模型 North Mini Code 解决了本地运行编程代理的痛点，适合追求高效、本地化开发的程序员和 AI 智能体开发者，建议立即体验。

原文

6月10日

13:13

Cohere@cohere

精选

Cohere 宣布其首个编程模型 OpenCode North Mini Code 完全开源，并免费提供在 OpenCode 平台上。该模型拥有 256K 上下文窗口，支持长代码理解与生成。此举旨在推动主权 AI 理念，让更多开发者和组织能够自主使用和定制 AI 编程能力。开源版本将促进社区协作与创新，降低 AI 编程工具的门槛。

AI模型 Cohere OpenCode 开源/仓库编程助手主权AI

推荐理由：Cohere 首次开源编程模型，256K 上下文窗口对处理大型代码库的开发者极具吸引力，做 AI 编程工具或需要自主部署模型的团队可以直接下载使用。

原文

10:58

shao__meng@shao__meng

精选76°

Cohere 发布了其首个开源编程模型 North Mini Code，采用 MoE 架构（30B 参数，3B 激活），拥有 128 个专家，每 token 激活 8 个。模型支持 256K 输入和 64K 输出上下文，最低可在 1× H100（FP8）上运行。训练采用三阶段后训练方法，包括级联 SFT、可验证奖励强化学习（RLVR）和跨 Harness 泛化，使其在 Agent 编程任务上表现突出。在 SWE-Bench Verified 上 pass@10 达 80.2%，Terminal-Bench v2 pass@10 达 55.1%，并在同量级开源模型中领先。模型原生支持交错思考与工具调用，适合子 Agent 编排、代码审查、终端操作等场景。

AI模型开源模型编程模型 Agent编程 MoE架构 Cohere

推荐理由：Cohere 用 30B 参数实现了超越 120B 模型的 Agent 编程能力，做自动化代码修复和多步软件工程的开发者可以直接用起来，效率提升明显。

原文

06:49

berryxia@berryxia

83°

Cohere 将 30B 参数的 MoE 小模型 North Mini Code 以 Apache 2.0 协议开源，仅 3B 活跃参数。该模型在 Artificial Analysis Coding Index 上达到 33.4 分，与同量级模型竞争，但可本地运行、自由修改。其核心优势在于针对 agentic coding 场景优化，让开发者能真正掌控 coding agent，而非依赖云端黑盒。此举打破了开源 coding 模型弱或慢的刻板印象，为社区提供了可自主进化的工具。

AI模型开源/仓库编程助手推理模型 Cohere Agentic Coding

推荐理由：Cohere 把 30B MoE 模型压缩到 3B 活跃参数还开源，做 agentic coding 的开发者终于能本地跑、随便改、不用租云端黑盒了，值得一试。

原文

6月9日

13:14

Cohere@cohere

Cohere 宣布与阿斯顿马丁 F1 车队达成合作，共同记录 2026 赛季的首个积分。合作强调在 F1 赛事中，数据准备、数据控制与决策能力是成功的关键。Cohere 将为企业 AI 提供类似 F1 赛车的精准决策支持，帮助企业在复杂环境中做出更优选择。这一合作展示了企业 AI 在体育竞技中的实际应用潜力。

行业 Cohere 阿斯顿马丁F1 企业AI 数据驱动决策智能

推荐理由：F1 赛事对数据实时性和决策精度的要求极高，做企业 AI 或数据分析的团队可以看看 Cohere 如何将赛车策略转化为商业智能方案，值得关注。

原文

6月3日

13:43

Cohere@cohere

Cohere 宣布赞助一场由 Hugging Face 和 Gradio 主办的黑客马拉松，主题是“缩小规模”。活动鼓励开发者构建足够小、运行成本低，但又能真正改变他人生活的 AI 应用。参与者可以创造古怪有趣的 AI 作品，或为身边人解决实际问题。这反映了行业对轻量、实用 AI 模型的关注趋势。

行业黑客马拉松 Cohere Hugging Face Gradio 轻量模型

推荐理由：想用低成本模型做出真正有用的东西？这场黑客马拉松就是为你准备的——Cohere 赞助、Hugging Face 和 Gradio 主办，直接上手做点小而美的 AI 应用，建议关注。

原文

5月30日

13:34

Cohere@cohere

Cohere 宣布其 Command A+ 模型在机器翻译方面取得新突破，性能显著超越开源对手如 Mistral Medium 3.5、DeepSeek 和 OpenAI 的 gpt-oss，甚至优于专业翻译系统 Google Translate。与 RWS 合作开发的系统表现更佳，但 A+ 已拉开明显差距。这标志着 Cohere 在翻译领域的竞争力大幅提升，尤其对需要高质量翻译的企业用户意义重大。

AI模型 Cohere Command A+机器翻译模型对比企业级AI

推荐理由：做多语言内容或翻译服务的团队值得关注——Cohere 的 A+ 模型在翻译质量上已经超过主流开源和专有方案，可以直接用于生产环境，省去自研或调优的麻烦。

原文

13:33

Cohere@cohere

精选

Cohere 宣布其 Command A+ 模型在多语言翻译基准测试 WMT24++（xCOMET-XL）中，在所有主要欧洲语言上均超越竞争对手。具体表现为法语提升 2.4 分，西班牙语提升 1.9 分，德语提升 0.9 分。更高的翻译质量意味着更少的修正、更强的检索能力和更可靠的多语言智能体。这一进展对需要高质量多语言支持的团队尤为重要。

AI模型 Cohere Command A+多语言翻译 WMT24++智能体

推荐理由：做多语言应用或智能体的团队，翻译质量直接决定产品体验——Command A+ 在法语、西语、德语上全面领先，值得关注。

原文

02:21

Cohere@cohere

精选

Cohere 发布 Command A+，在非拉丁语系语言测试中表现突出。在韩语、日语、希伯来语、中文和阿拉伯语上均超越 Mistral Medium 3.5。尤其在阿拉伯语上，Command A+ 比 Mistral Medium 3.5 高 5 个百分点，比 DeepSeek V4 Pro Sovereign AI 高 10 个百分点。

AI模型 Command A+Mistral Medium 3.5 DeepSeek V4 Pro Cohere 多语言模型

推荐理由：非拉丁语表现更优

原文

5月23日

17:50

marktechpost@Michal Sutter

78°

Cohere 发布了 Command A+，一个 218B 参数的稀疏混合专家（MoE）模型，整合了此前四个 Command A 变体。该模型在 W4A4 量化下仅需两张 H100 GPU 即可运行，支持 48 种语言，是 Cohere 首个多模态推理模型，专为智能体工作流设计。其开源特性降低了部署门槛，适合需要高效多模态推理和智能体任务的团队。

AI模型 Cohere Command A+稀疏 MoE 多模态推理智能体工作流

推荐理由：Cohere 把 218B 模型压到两张 H100 就能跑，做智能体工作流的团队终于有了高性价比的开源选择——多模态推理和 48 语言支持直接可用，建议试试。

原文

5月22日

14:56

Cohere@cohere

精选

Cohere 发布了新模型 Command A+，该模型针对 NVIDIA Blackwell 架构进行了优化，并使用了 NVIDIA CUDA-X 库进行训练。NVIDIA AI 基础设施团队公开祝贺，强调了双方在 AI 基础设施上的紧密合作。这一合作意味着 Command A+ 将充分利用 NVIDIA 最新硬件的性能，为企业和开发者提供更高效的 AI 推理能力。

AI模型 Cohere Command A+NVIDIA Blackwell AI 基础设施模型优化

推荐理由：Cohere 与 NVIDIA 的深度合作让 Command A+ 在 Blackwell 上跑出最佳性能，做企业级 AI 部署的团队值得关注这个新选择。

原文

13:55

Cohere@cohere

精选

Cohere 发布了其最强开源大模型 Command A+，并已在 Hugging Face 上提供 W4A4 量化版本。该量化技术能在几乎不损失性能的情况下大幅降低模型部署的硬件需求，显著减少服务占用空间。开发者可以直接下载使用，适合资源受限的部署场景。

AI模型 Cohere Command A+W4A4量化开源/仓库模型部署

推荐理由：Cohere 把最强模型做到 W4A4 量化还开源了，做推理部署的团队可以直接拿来降成本，值得一试。

原文

5月17日

00:21

Cohere@cohere

Cohere 推出 Compass 平台，专门处理非结构化数据搜索难题。它通过视觉解析模型和增强嵌入技术，能检索手写、打字甚至机密文档。用户可搜索财务报告、邮件等，平台还能连接智能体。该工具解决了传统搜索难以处理复杂文档格式的问题。

AI产品 Cohere 文档搜索非结构化数据视觉解析智能体

推荐理由：做文档检索或智能体开发的团队，终于有了能处理手写和机密文件的搜索工具，值得试试 Compass 的实际效果。

原文

5月14日

14:13

Cohere@cohere

精选

Cohere 发布技术报告，指出基于混合专家模型（MoE）的大型语言模型在推测解码（speculative decoding）中表现更优，打破了传统认知。推测解码是一种加速推理的技术，通常认为对密集模型更有效，但 Cohere 的实验表明 MoE 架构能进一步提升其效率。该发现有望降低推理成本，推动 MoE 模型在实时应用中的部署。

论文 MoE 推测解码推理加速 Cohere 技术报告

推荐理由：做 LLM 推理优化的开发者值得关注——MoE 模型在推测解码上的意外优势可能改变成本结构，建议点开报告看具体数据。

原文

14:13

Cohere@cohere

Cohere 与德国 AI 公司 Aleph Alpha 宣布建立跨大西洋合作伙伴关系，旨在为全球企业和政府提供主权级、企业级 AI 解决方案。该联盟结合了 Cohere 的全球规模与 Aleph Alpha 的欧洲研发实力，重点强调安全性、隐私性和信任度。合作将推动主权 AI 的发展，确保数据主权和合规性，尤其适合对数据安全有严格要求的欧洲客户。此举标志着 AI 领域国际合作的新模式，旨在平衡技术领先与地缘政治需求。

行业主权AI 国际合作企业级AI 数据安全 Cohere Aleph Alpha

推荐理由：主权 AI 是企业和政府数据安全的关键，Cohere 与 Aleph Alpha 的联手为欧洲客户提供了合规的 AI 选项，做企业级部署的团队值得关注。

原文

14:13

Cohere@cohere

精选

Cohere 宣布其 W4A8 推理方案已集成到 vLLM 中，通过结合 4 位权重（低内存）和 8 位激活（高计算），在 Hopper 架构上实现了解码和预填充阶段的显著加速。相比 W4A16，TTFT（首 token 生成时间）提升高达 58%，TPOT（每 token 输出时间）提升 45%。这一优化让大模型推理在保持低内存占用的同时大幅提升计算效率，适合生产环境部署。

AI模型推理优化 vLLM W4A8 Cohere 模型部署

推荐理由：Cohere 的 W4A8 方案解决了大模型推理中内存与速度的权衡问题，做模型部署和推理优化的团队可以直接在 vLLM 中体验，值得关注。

原文