全部 AI 动态 · AI 热点

6月28日

05:01

ollama@ollama

精选

Ollama 宣布支持运行 Ornith 1.0 系列模型，包括 9B、31B Dense、35B MoE 和 397B MoE 四个版本。该模型在 SWE-Bench verified 上达到 82.4，Terminal-Bench 2.1 得分 77.5，多语言 SWE-Bench 得分 78.9。它基于 Gemma4 和 Qwen3.5 后训练，采用强化学习联合优化 scaffold 和解决方案。所有模型以 MIT 许可证开源，支持商业和研究用途。

AI模型 Ollama Ornith SWE-Bench 编程助手开源模型

推荐理由：Ollama 现在可以直接跑 Ornith 编程智能体了，从 9B 到 397B 都有，SWE-Bench 拿了 82.4 分，本地搞智能体编码超方便。

原文

6月25日

23:37

berryxia@berryxia

Ornith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源，并提供了 GGUF 版本，可在 Ollama、Unsloth 等工具中直接运行。

AI模型 Ornith-1.0 Terminal-Bench SWE-Bench Ollama 智能体

推荐理由：Ornith-1.0 用 RL 教模型搭执行框架，在 SWE-Bench 上表现顶尖，本地党还有 GGUF 版本可玩。

原文

6月21日

06:55

ollama@ollama

Ollama 转发了 Aaron Levie 的观点，指出开放权重模型在特定任务上已取得 SOTA 结果，并在编码等部分领域接近前沿水平。Levie 强调，开放权重模型与前沿模型之间的边际差距若能保持而非扩大，将创造更多 AI 应用价值。他还提到，使用更便宜或针对特定任务微调的开放模型可优化成本，同时前沿模型仍可用于规划、编排等复杂工作。

行业 Ollama open weights 开源模型 AI成本具体任务微调

推荐理由：Ollama 分享了 Levie 对开放权重模型的乐观看法：这些模型成本更低、表现接近前沿，还能针对性微调，对 AI 应用层是大利好。

原文

6月18日

03:30

ollama@ollama

精选

Ollama 宣布用户可以在 Codex App、CLI 和 SDK 中使用 GLM-5.2 和 Kimi-K2.7-Code 模型。此前 Codex 仅支持 OpenAI 模型，现在扩展至开源模型。使用命令 ollama launch codex 即可启用。这一集成让开发者能用更多模型进行代码生成。

AI产品 Ollama Codex GLM-5.2 Kimi-K2.7-Code 开源模型

推荐理由：Ollama 把 GLM-5.2 和 Kimi-K2.7-Code 也带进 Codex 了，以前只能用 OpenAI 模型，现在敲一行命令就能切换试试。

原文

6月17日

03:49

ollama@ollama

精选

Z.ai 发布 GLM-5.2，支持 1M token 上下文窗口，专为长程编码和智能体任务设计。提供两种推理模式：GLM-5.2 (max) 和 GLM-5.2 (high)，权重以 MIT 许可开源。现已通过 Ollama 云服务在美国 NVIDIA Blackwell GPU 上可用，API 定价与 GLM-5.1 相同。该模型声称是目前最强开源编码模型。

AI模型 GLM-5.2 Z.ai Ollama 开源模型长上下文

推荐理由：Z.ai 开源了 GLM-5.2，有 1M 上下文窗口，适合写长代码和搭智能体，在 Ollama 上直接就能用，MIT 许可随便玩。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

09:12

ollama@ollama

Ollama 现在支持 Cline CLI，允许用户在终端中通过看板功能运行并行任务。Cline 是一个编码代理，可以读取代码仓库、编辑文件、运行命令并显示差异供审查。用户只需运行 'ollama launch cline' 即可开始使用。

AI产品 Ollama Cline CLI 编程助手并行任务

推荐理由：Ollama 和 Cline 联手，让你在终端里用看板跑并行代码任务，效率拉满！

原文

6月13日

11:15

ollama@ollama

Kimi-K2.7-Code 是 Kimi 最新开源的编程模型，现已在 Ollama 云上可用，部署于美国 NVIDIA B300 数据中心 GPU。相比 K2.6，该模型在 Kimi Code Bench v2 上提升 21.8%，在 Program Bench 上提升 11.0%，在 MLS Bench Lite 上提升 31.5%。推理 token 使用量降低 30%，减少过度思考。支持长周期编码任务，指令遵循能力更强。

AI模型 Kimi-K2.7-Code Ollama 编程助手开源模型 NVIDIA B300

推荐理由：Kimi 新编程模型上线 Ollama，性能大涨

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

06:45

ollama@ollama

Ollama 宣布其智能体现在可以连接到 Telegram、Discord、Slack、WhatsApp、Signal 和 Email 等多种消息应用。这意味着用户可以通过一个统一的智能体，在多个平台上共享记忆和交互，实现跨平台的无缝体验。该功能旨在让智能体覆盖用户日常使用的所有通讯表面，提升便捷性和一致性。

AI产品智能体消息应用跨平台 Ollama 集成

推荐理由：对于需要跨平台管理对话和任务的团队或个人，Ollama 的这项更新解决了智能体碎片化问题，值得尝试将你的智能体接入常用消息应用。

原文

06:44

ollama@ollama

Ollama 宣布与 NousResearch 合作，推出 Hermes Desktop 桌面应用，支持 macOS、Windows 和 Linux 平台。该应用集成了多智能体引擎、自我改进技能和消息集成功能，用户可通过一条命令 'ollama launch hermes-desktop' 在本地或云端运行。这标志着 Ollama 从命令行工具向桌面端扩展，降低了 AI 智能体的使用门槛。对于希望本地运行复杂智能体系统的开发者来说，这是一个便捷的新选择。

AI产品 Ollama Hermes Desktop 多智能体桌面应用开源

推荐理由：Ollama 把多智能体引擎搬到了桌面，做本地 AI 实验的开发者一条命令就能跑起来，值得试试。

原文

6月6日

03:05

ollama@ollama

Ollama 宣布 Gemma 4 的量化感知训练（QAT）权重现已可用。这些权重在保持模型质量的同时，显著降低了内存需求。用户可以通过 Ollama 直接运行多个 Gemma 4 变体，包括 e2b、e4b、12B、26B 和 31B 等版本。Google Gemma 团队也在 Hugging Face 上发布了所有 Gemma 4 模型大小及其 drafters 的 QAT 检查点，旨在优化设备端性能。这为在资源受限环境中部署大型语言模型提供了更高效的方案。

AI模型 Gemma 4 量化感知训练 Ollama 模型优化 Hugging Face

推荐理由：QAT 权重让 Gemma 4 在更低内存下运行，适合在本地或边缘设备部署大模型的开发者，可以直接用 Ollama 命令体验。

原文

6月5日

09:36

ollama@ollama

精选

Google 的 Gemma 4 12B 模型已更新至 Ollama，支持所有平台运行。该模型是统一的无编码器多模态模型，专为笔记本电脑设计，在边缘效率与高级推理之间取得平衡，并采用 Apache 2.0 许可。用户可通过 Ollama 在 Claude Code、Hermes Agent、OpenClaw、Codex 等工具中直接调用。

AI模型 Gemma 4 Ollama 多模态模型本地部署开源/仓库

推荐理由：本地运行多模态模型的门槛又降低了——Gemma 4 12B 在 Ollama 上即开即用，做本地 AI 应用或边缘推理的开发者可以直接上手试。

原文

03:03

ollama@ollama

76°

NVIDIA 的 Nemotron 3 Ultra 模型现已可通过 Ollama 云端直接使用。该模型为 550B MoE 架构的开放前沿模型，专为长时间运行的智能体任务设计。相比其他开放前沿模型，推理速度提升 5 倍，复杂智能体任务成本降低最多 30%。用户可通过 Claude Code、Hermes Agent 等工具直接调用，也可用于通用聊天。

AI模型 NVIDIA Nemotron 3 Ultra Ollama MoE 智能体

推荐理由：做智能体开发的团队终于有了一个低成本、高推理速度的开放模型选择，可以直接在 Ollama 上跑，建议试试看。

原文

6月4日

05:12

ollama@ollama

GoogleDeepMind 的 Gemma 4-12B 模型现已可通过 Ollama 直接使用，支持 MLX 框架。用户可通过 `ollama run gemma4:12b-mlx` 命令快速启动聊天，还支持 Hermes Agent、Claude Code 等工具的集成。这为开发者提供了便捷的本地部署和实验途径，尤其适合在 Apple Silicon 设备上高效运行。

AI产品 Ollama Gemma 4 MLX 本地部署 GoogleDeepMind

推荐理由：Ollama 让 Gemma 4-12B 的本地部署门槛降到最低，做模型实验或本地 Agent 开发的团队可以直接跑起来，省去繁琐配置。

原文

6月3日

14:17

ollama@ollama

Nous Research 发布了 Hermes Desktop，这是 Hermes Agent 的桌面原生版本，首次在 Jensen 的 GTC 主题演讲中演示，现已公开预览。该工具允许用户通过 Ollama 使用本地或云端模型，实现智能体功能。这意味着开发者可以在自己的机器上运行 Hermes，无需依赖远程服务器，降低了使用门槛。对于希望探索本地 AI 智能体的用户来说，这是一个值得关注的新选择。

AI产品智能体 Hermes Desktop Ollama 本地模型开源/仓库

推荐理由：Hermes Desktop 让本地 AI 智能体落地更简单，做自动化或智能体开发的团队可以直接通过 Ollama 体验，无需复杂配置。

原文

6月2日

14:19

ollama@ollama

Ollama 宣布与 NVIDIA 合作，为 NVIDIA RTX Spark 超级芯片提供本地 AI 推理支持。RTX Spark 是一款 1 petaflop 的超级芯片，拥有完整的 CUDA 和 RTX 生态系统，并支持 Windows 原生智能体。这一合作将使得个人电脑能够运行更强大的本地 AI 模型，标志着个人计算的新起点。Ollama 用户将能够直接在 RTX Spark 上部署和运行 AI 模型，无需依赖云端。

AI产品 Ollama NVIDIA RTX Spark 本地推理智能体

推荐理由：Ollama 与 NVIDIA 联手，让本地 AI 推理性能跃升到 petaflop 级别，做本地模型部署的开发者可以直接在 RTX Spark 上跑模型，值得关注。

原文

6月1日

11:44

ollama@ollama

精选76°

MiniMax 与 Ollama 合作，将 M3 模型部署在 Ollama Cloud 上，面向美国用户且零数据留存。M3 是首个结合编程、智能体与多模态能力的开源权重模型，在 SWE-Bench Pro 上达到 59.0%，Terminal Bench 2.1 为 66.0%，并支持 100 万 token 上下文。用户可通过 Claude Code、Codex 或直接聊天方式在 Ollama 上使用 M3。模型权重和技术报告将在约 10 天后发布。

AI模型 MiniMax M3 Ollama 编程助手智能体

推荐理由：M3 在编程和智能体任务上表现突出，做自动化开发或智能体应用的团队可以直接在 Ollama Cloud 上免费试，零数据留存也适合对隐私敏感的开发者。

原文

5月30日

04:58

ollama@ollama

OpenJarvis 是一个由斯坦福大学 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI，现已支持通过 Ollama 运行。该项目属于“Intelligence Per Watt”研究的一部分，旨在探索高效的本地AI方案。OpenJarvis 强调在本地设备上运行，无需依赖云端，从而保护用户隐私并降低延迟。对于关注本地AI部署和隐私保护的开发者来说，这是一个值得尝试的新工具。

AI产品本地AI Ollama 个人助手开源/仓库斯坦福

推荐理由：斯坦福团队把本地AI的能效研究落地成了可用的个人助手，做边缘计算或隐私敏感应用的开发者可以直接用Ollama跑起来试试。

原文

5月25日

04:03

Ate-a-Pi@svpino

精选

开发者 Santiago 发现可以用 Ollama 启动 Claude Code 并指定开源模型（如 Gemma 4:26B），但这样会失去使用 Anthropic 官方模型的能力。他询问是否有办法在 Claude Code 中同时使用 Anthropic 模型和开源模型。这反映了开发者对模型灵活性的需求，以及当前工具在模型切换上的限制。

AI产品 Claude Code 开源模型 Ollama 模型切换开发者工具

推荐理由：如果你在用 Claude Code 做开发，又想尝试开源模型，这个痛点值得关注——目前无法同时使用两种模型，但社区可能有解决方案。

原文

5月16日

19:56

ollama@ollama

AI产品 Codex Ollama 编程助手模型推荐工具调用

推荐理由：Ollama 官方给出的 Codex 兼容模型清单，做 AI 编程的开发者可以直接参考选型，省去自己试错的成本。

原文

19:32

ollama@ollama

Ollama 宣布为其云服务大幅增加 NVIDIA Blackwell GPU，以更好地支持 GLM-5.1 模型。同时，Ollama 也在每日为其他模型增加 GPU 资源。用户可通过 Ollama 的 Claude Code、Codex App 和 Hermes Agent 等工具调用 GLM-5.1 模型。该模型可通过命令 `ollama run glm-5.1:cloud` 直接运行。此举旨在提升模型推理性能和可用性。

AI产品 Ollama GLM-5.1 NVIDIA Blackwell GPU 云服务模型部署

推荐理由：Ollama 为 GLM-5.1 加 GPU 意味着推理速度更快、并发更高，做 AI 应用开发或依赖云端大模型的团队值得关注，可以直接用命令体验。

原文