05:01ollama@ollama精选Ollama 宣布支持运行 Ornith 1.0 系列模型,包括 9B、31B Dense、35B MoE 和 397B MoE 四个版本。该模型在 SWE-Bench verified 上达到 82.4,Terminal-Bench 2.1 得分 77.5,多语言 SWE-Bench 得分 78.9。它基于 Gemma4 和 Qwen3.5 后训练,采用强化学习联合优化 scaffold 和解决方案。所有模型以 MIT 许可证开源,支持商业和研究用途。AI模型OllamaOrnithSWE-Bench编程助手开源模型2 个信源在谈推荐理由:Ollama 现在可以直接跑 Ornith 编程智能体了,从 9B 到 397B 都有,SWE-Bench 拿了 82.4 分,本地搞智能体编码超方便。原文
23:37berryxia@berryxiaOrnith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源,并提供了 GGUF 版本,可在 Ollama、Unsloth 等工具中直接运行。AI模型Ornith-1.0Terminal-BenchSWE-BenchOllama智能体推荐理由:Ornith-1.0 用 RL 教模型搭执行框架,在 SWE-Bench 上表现顶尖,本地党还有 GGUF 版本可玩。原文
06:55ollama@ollamaOllama 转发了 Aaron Levie 的观点,指出开放权重模型在特定任务上已取得 SOTA 结果,并在编码等部分领域接近前沿水平。Levie 强调,开放权重模型与前沿模型之间的边际差距若能保持而非扩大,将创造更多 AI 应用价值。他还提到,使用更便宜或针对特定任务微调的开放模型可优化成本,同时前沿模型仍可用于规划、编排等复杂工作。行业Ollamaopen weights开源模型AI成本具体任务微调推荐理由:Ollama 分享了 Levie 对开放权重模型的乐观看法:这些模型成本更低、表现接近前沿,还能针对性微调,对 AI 应用层是大利好。原文
03:30ollama@ollama精选Ollama 宣布用户可以在 Codex App、CLI 和 SDK 中使用 GLM-5.2 和 Kimi-K2.7-Code 模型。此前 Codex 仅支持 OpenAI 模型,现在扩展至开源模型。使用命令 ollama launch codex 即可启用。这一集成让开发者能用更多模型进行代码生成。AI产品OllamaCodexGLM-5.2Kimi-K2.7-Code开源模型10 个信源在谈推荐理由:Ollama 把 GLM-5.2 和 Kimi-K2.7-Code 也带进 Codex 了,以前只能用 OpenAI 模型,现在敲一行命令就能切换试试。原文
03:49ollama@ollama精选Z.ai 发布 GLM-5.2,支持 1M token 上下文窗口,专为长程编码和智能体任务设计。提供两种推理模式:GLM-5.2 (max) 和 GLM-5.2 (high),权重以 MIT 许可开源。现已通过 Ollama 云服务在美国 NVIDIA Blackwell GPU 上可用,API 定价与 GLM-5.1 相同。该模型声称是目前最强开源编码模型。AI模型GLM-5.2Z.aiOllama开源模型长上下文10 个信源在谈推荐理由:Z.ai 开源了 GLM-5.2,有 1M 上下文窗口,适合写长代码和搭智能体,在 Ollama 上直接就能用,MIT 许可随便玩。原文
09:12ollama@ollamaOllama 现在支持 Cline CLI,允许用户在终端中通过看板功能运行并行任务。Cline 是一个编码代理,可以读取代码仓库、编辑文件、运行命令并显示差异供审查。用户只需运行 'ollama launch cline' 即可开始使用。AI产品OllamaClineCLI编程助手并行任务推荐理由:Ollama 和 Cline 联手,让你在终端里用看板跑并行代码任务,效率拉满!原文
11:15ollama@ollamaKimi-K2.7-Code 是 Kimi 最新开源的编程模型,现已在 Ollama 云上可用,部署于美国 NVIDIA B300 数据中心 GPU。相比 K2.6,该模型在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。推理 token 使用量降低 30%,减少过度思考。支持长周期编码任务,指令遵循能力更强。AI模型Kimi-K2.7-CodeOllama编程助手开源模型NVIDIA B30010 个信源在谈推荐理由:Kimi 新编程模型上线 Ollama,性能大涨原文
06:45ollama@ollamaOllama 宣布其智能体现在可以连接到 Telegram、Discord、Slack、WhatsApp、Signal 和 Email 等多种消息应用。这意味着用户可以通过一个统一的智能体,在多个平台上共享记忆和交互,实现跨平台的无缝体验。该功能旨在让智能体覆盖用户日常使用的所有通讯表面,提升便捷性和一致性。AI产品智能体消息应用跨平台Ollama集成4 个信源在谈推荐理由:对于需要跨平台管理对话和任务的团队或个人,Ollama 的这项更新解决了智能体碎片化问题,值得尝试将你的智能体接入常用消息应用。原文
06:44ollama@ollamaOllama 宣布与 NousResearch 合作,推出 Hermes Desktop 桌面应用,支持 macOS、Windows 和 Linux 平台。该应用集成了多智能体引擎、自我改进技能和消息集成功能,用户可通过一条命令 'ollama launch hermes-desktop' 在本地或云端运行。这标志着 Ollama 从命令行工具向桌面端扩展,降低了 AI 智能体的使用门槛。对于希望本地运行复杂智能体系统的开发者来说,这是一个便捷的新选择。AI产品OllamaHermes Desktop多智能体桌面应用开源7 个信源在谈推荐理由:Ollama 把多智能体引擎搬到了桌面,做本地 AI 实验的开发者一条命令就能跑起来,值得试试。原文
03:05ollama@ollamaOllama 宣布 Gemma 4 的量化感知训练(QAT)权重现已可用。这些权重在保持模型质量的同时,显著降低了内存需求。用户可以通过 Ollama 直接运行多个 Gemma 4 变体,包括 e2b、e4b、12B、26B 和 31B 等版本。Google Gemma 团队也在 Hugging Face 上发布了所有 Gemma 4 模型大小及其 drafters 的 QAT 检查点,旨在优化设备端性能。这为在资源受限环境中部署大型语言模型提供了更高效的方案。AI模型Gemma 4量化感知训练Ollama模型优化Hugging Face10 个信源在谈推荐理由:QAT 权重让 Gemma 4 在更低内存下运行,适合在本地或边缘设备部署大模型的开发者,可以直接用 Ollama 命令体验。原文
09:36ollama@ollama精选Google 的 Gemma 4 12B 模型已更新至 Ollama,支持所有平台运行。该模型是统一的无编码器多模态模型,专为笔记本电脑设计,在边缘效率与高级推理之间取得平衡,并采用 Apache 2.0 许可。用户可通过 Ollama 在 Claude Code、Hermes Agent、OpenClaw、Codex 等工具中直接调用。AI模型Gemma 4Ollama多模态模型本地部署开源/仓库10 个信源在谈推荐理由:本地运行多模态模型的门槛又降低了——Gemma 4 12B 在 Ollama 上即开即用,做本地 AI 应用或边缘推理的开发者可以直接上手试。原文
03:03ollama@ollama76°NVIDIA 的 Nemotron 3 Ultra 模型现已可通过 Ollama 云端直接使用。该模型为 550B MoE 架构的开放前沿模型,专为长时间运行的智能体任务设计。相比其他开放前沿模型,推理速度提升 5 倍,复杂智能体任务成本降低最多 30%。用户可通过 Claude Code、Hermes Agent 等工具直接调用,也可用于通用聊天。AI模型NVIDIANemotron 3 UltraOllamaMoE智能体10 个信源在谈推荐理由:做智能体开发的团队终于有了一个低成本、高推理速度的开放模型选择,可以直接在 Ollama 上跑,建议试试看。原文
05:12ollama@ollamaGoogleDeepMind 的 Gemma 4-12B 模型现已可通过 Ollama 直接使用,支持 MLX 框架。用户可通过 `ollama run gemma4:12b-mlx` 命令快速启动聊天,还支持 Hermes Agent、Claude Code 等工具的集成。这为开发者提供了便捷的本地部署和实验途径,尤其适合在 Apple Silicon 设备上高效运行。AI产品OllamaGemma 4MLX本地部署GoogleDeepMind10 个信源在谈推荐理由:Ollama 让 Gemma 4-12B 的本地部署门槛降到最低,做模型实验或本地 Agent 开发的团队可以直接跑起来,省去繁琐配置。原文
14:17ollama@ollamaNous Research 发布了 Hermes Desktop,这是 Hermes Agent 的桌面原生版本,首次在 Jensen 的 GTC 主题演讲中演示,现已公开预览。该工具允许用户通过 Ollama 使用本地或云端模型,实现智能体功能。这意味着开发者可以在自己的机器上运行 Hermes,无需依赖远程服务器,降低了使用门槛。对于希望探索本地 AI 智能体的用户来说,这是一个值得关注的新选择。AI产品智能体Hermes DesktopOllama本地模型开源/仓库1 个信源在谈推荐理由:Hermes Desktop 让本地 AI 智能体落地更简单,做自动化或智能体开发的团队可以直接通过 Ollama 体验,无需复杂配置。原文
14:19ollama@ollamaOllama 宣布与 NVIDIA 合作,为 NVIDIA RTX Spark 超级芯片提供本地 AI 推理支持。RTX Spark 是一款 1 petaflop 的超级芯片,拥有完整的 CUDA 和 RTX 生态系统,并支持 Windows 原生智能体。这一合作将使得个人电脑能够运行更强大的本地 AI 模型,标志着个人计算的新起点。Ollama 用户将能够直接在 RTX Spark 上部署和运行 AI 模型,无需依赖云端。AI产品OllamaNVIDIARTX Spark本地推理智能体10 个信源在谈推荐理由:Ollama 与 NVIDIA 联手,让本地 AI 推理性能跃升到 petaflop 级别,做本地模型部署的开发者可以直接在 RTX Spark 上跑模型,值得关注。原文
11:44ollama@ollama精选76°MiniMax 与 Ollama 合作,将 M3 模型部署在 Ollama Cloud 上,面向美国用户且零数据留存。M3 是首个结合编程、智能体与多模态能力的开源权重模型,在 SWE-Bench Pro 上达到 59.0%,Terminal Bench 2.1 为 66.0%,并支持 100 万 token 上下文。用户可通过 Claude Code、Codex 或直接聊天方式在 Ollama 上使用 M3。模型权重和技术报告将在约 10 天后发布。AI模型MiniMaxM3Ollama编程助手智能体推荐理由:M3 在编程和智能体任务上表现突出,做自动化开发或智能体应用的团队可以直接在 Ollama Cloud 上免费试,零数据留存也适合对隐私敏感的开发者。原文
04:58ollama@ollamaOpenJarvis 是一个由斯坦福大学 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI,现已支持通过 Ollama 运行。该项目属于“Intelligence Per Watt”研究的一部分,旨在探索高效的本地AI方案。OpenJarvis 强调在本地设备上运行,无需依赖云端,从而保护用户隐私并降低延迟。对于关注本地AI部署和隐私保护的开发者来说,这是一个值得尝试的新工具。AI产品本地AIOllama个人助手开源/仓库斯坦福推荐理由:斯坦福团队把本地AI的能效研究落地成了可用的个人助手,做边缘计算或隐私敏感应用的开发者可以直接用Ollama跑起来试试。原文
04:03Ate-a-Pi@svpino精选开发者 Santiago 发现可以用 Ollama 启动 Claude Code 并指定开源模型(如 Gemma 4:26B),但这样会失去使用 Anthropic 官方模型的能力。他询问是否有办法在 Claude Code 中同时使用 Anthropic 模型和开源模型。这反映了开发者对模型灵活性的需求,以及当前工具在模型切换上的限制。AI产品Claude Code开源模型Ollama模型切换开发者工具10 个信源在谈推荐理由:如果你在用 Claude Code 做开发,又想尝试开源模型,这个痛点值得关注——目前无法同时使用两种模型,但社区可能有解决方案。原文
19:56ollama@ollamaOllama 官方推荐了几款适合与 Codex 配合使用的云模型,包括支持视觉的 kimi-k2.6:cloud 和 glm-5.1:cloud。对于没有付费订阅的用户,建议选择支持可靠工具调用的模型,如 nemotron-3-super:cloud、gemma4:31b:cloud 和 qwen3.6。这些模型能更好地与 Codex 的编程和工具调用功能协同工作。AI产品CodexOllama编程助手模型推荐工具调用推荐理由:Ollama 官方给出的 Codex 兼容模型清单,做 AI 编程的开发者可以直接参考选型,省去自己试错的成本。原文
19:32ollama@ollamaOllama 宣布为其云服务大幅增加 NVIDIA Blackwell GPU,以更好地支持 GLM-5.1 模型。同时,Ollama 也在每日为其他模型增加 GPU 资源。用户可通过 Ollama 的 Claude Code、Codex App 和 Hermes Agent 等工具调用 GLM-5.1 模型。该模型可通过命令 `ollama run glm-5.1:cloud` 直接运行。此举旨在提升模型推理性能和可用性。AI产品OllamaGLM-5.1NVIDIA Blackwell GPU云服务模型部署推荐理由:Ollama 为 GLM-5.1 加 GPU 意味着推理速度更快、并发更高,做 AI 应用开发或依赖云端大模型的团队值得关注,可以直接用命令体验。原文