AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:Ollama×
6月28日
05:01
05:01ollama@ollama
精选
Ollama 宣布支持运行 Ornith 1.0 系列模型,包括 9B、31B Dense、35B MoE 和 397B MoE 四个版本。该模型在 SWE-Bench verified 上达到 82.4,Terminal-Bench 2.1 得分 77.5,多语言 SWE-Bench 得分 78.9。它基于 Gemma4 和 Qwen3.5 后训练,采用强化学习联合优化 scaffold 和解决方案。所有模型以 MIT 许可证开源,支持商业和研究用途。
AI模型OllamaOrnithSWE-Bench编程助手开源模型

推荐理由:Ollama 现在可以直接跑 Ornith 编程智能体了,从 9B 到 397B 都有,SWE-Bench 拿了 82.4 分,本地搞智能体编码超方便。
原文
6月25日
23:37
23:37berryxia@berryxia
Ornith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源,并提供了 GGUF 版本,可在 Ollama、Unsloth 等工具中直接运行。
AI模型Ornith-1.0Terminal-BenchSWE-BenchOllama智能体

推荐理由:Ornith-1.0 用 RL 教模型搭执行框架,在 SWE-Bench 上表现顶尖,本地党还有 GGUF 版本可玩。
原文
6月21日
06:55
06:55ollama@ollama
Ollama 转发了 Aaron Levie 的观点,指出开放权重模型在特定任务上已取得 SOTA 结果,并在编码等部分领域接近前沿水平。Levie 强调,开放权重模型与前沿模型之间的边际差距若能保持而非扩大,将创造更多 AI 应用价值。他还提到,使用更便宜或针对特定任务微调的开放模型可优化成本,同时前沿模型仍可用于规划、编排等复杂工作。
行业Ollamaopen weights开源模型AI成本具体任务微调

推荐理由:Ollama 分享了 Levie 对开放权重模型的乐观看法:这些模型成本更低、表现接近前沿,还能针对性微调,对 AI 应用层是大利好。
原文
6月18日
03:30
03:30ollama@ollama
精选
Ollama 宣布用户可以在 Codex App、CLI 和 SDK 中使用 GLM-5.2 和 Kimi-K2.7-Code 模型。此前 Codex 仅支持 OpenAI 模型,现在扩展至开源模型。使用命令 ollama launch codex 即可启用。这一集成让开发者能用更多模型进行代码生成。
AI产品OllamaCodexGLM-5.2Kimi-K2.7-Code开源模型

推荐理由:Ollama 把 GLM-5.2 和 Kimi-K2.7-Code 也带进 Codex 了,以前只能用 OpenAI 模型,现在敲一行命令就能切换试试。
原文
6月17日
03:49
03:49ollama@ollama
精选
Z.ai 发布 GLM-5.2,支持 1M token 上下文窗口,专为长程编码和智能体任务设计。提供两种推理模式:GLM-5.2 (max) 和 GLM-5.2 (high),权重以 MIT 许可开源。现已通过 Ollama 云服务在美国 NVIDIA Blackwell GPU 上可用,API 定价与 GLM-5.1 相同。该模型声称是目前最强开源编码模型。
AI模型GLM-5.2Z.aiOllama开源模型长上下文

推荐理由:Z.ai 开源了 GLM-5.2,有 1M 上下文窗口,适合写长代码和搭智能体,在 Ollama 上直接就能用,MIT 许可随便玩。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
09:12
09:12ollama@ollama
Ollama 现在支持 Cline CLI,允许用户在终端中通过看板功能运行并行任务。Cline 是一个编码代理,可以读取代码仓库、编辑文件、运行命令并显示差异供审查。用户只需运行 'ollama launch cline' 即可开始使用。
AI产品OllamaClineCLI编程助手并行任务

推荐理由:Ollama 和 Cline 联手,让你在终端里用看板跑并行代码任务,效率拉满!
原文
6月13日
11:15
11:15ollama@ollama
Kimi-K2.7-Code 是 Kimi 最新开源的编程模型,现已在 Ollama 云上可用,部署于美国 NVIDIA B300 数据中心 GPU。相比 K2.6,该模型在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。推理 token 使用量降低 30%,减少过度思考。支持长周期编码任务,指令遵循能力更强。
AI模型Kimi-K2.7-CodeOllama编程助手开源模型NVIDIA B300

推荐理由:Kimi 新编程模型上线 Ollama,性能大涨
原文
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月10日
06:45
06:45ollama@ollama
Ollama 宣布其智能体现在可以连接到 Telegram、Discord、Slack、WhatsApp、Signal 和 Email 等多种消息应用。这意味着用户可以通过一个统一的智能体,在多个平台上共享记忆和交互,实现跨平台的无缝体验。该功能旨在让智能体覆盖用户日常使用的所有通讯表面,提升便捷性和一致性。
AI产品智能体消息应用跨平台Ollama集成

推荐理由:对于需要跨平台管理对话和任务的团队或个人,Ollama 的这项更新解决了智能体碎片化问题,值得尝试将你的智能体接入常用消息应用。
原文
06:44
06:44ollama@ollama
Ollama 宣布与 NousResearch 合作,推出 Hermes Desktop 桌面应用,支持 macOS、Windows 和 Linux 平台。该应用集成了多智能体引擎、自我改进技能和消息集成功能,用户可通过一条命令 'ollama launch hermes-desktop' 在本地或云端运行。这标志着 Ollama 从命令行工具向桌面端扩展,降低了 AI 智能体的使用门槛。对于希望本地运行复杂智能体系统的开发者来说,这是一个便捷的新选择。
AI产品OllamaHermes Desktop多智能体桌面应用开源

推荐理由:Ollama 把多智能体引擎搬到了桌面,做本地 AI 实验的开发者一条命令就能跑起来,值得试试。
原文
6月6日
03:05
03:05ollama@ollama
Ollama 宣布 Gemma 4 的量化感知训练(QAT)权重现已可用。这些权重在保持模型质量的同时,显著降低了内存需求。用户可以通过 Ollama 直接运行多个 Gemma 4 变体,包括 e2b、e4b、12B、26B 和 31B 等版本。Google Gemma 团队也在 Hugging Face 上发布了所有 Gemma 4 模型大小及其 drafters 的 QAT 检查点,旨在优化设备端性能。这为在资源受限环境中部署大型语言模型提供了更高效的方案。
AI模型Gemma 4量化感知训练Ollama模型优化Hugging Face

推荐理由:QAT 权重让 Gemma 4 在更低内存下运行,适合在本地或边缘设备部署大模型的开发者,可以直接用 Ollama 命令体验。
原文
6月5日
09:36
09:36ollama@ollama
精选
Google 的 Gemma 4 12B 模型已更新至 Ollama,支持所有平台运行。该模型是统一的无编码器多模态模型,专为笔记本电脑设计,在边缘效率与高级推理之间取得平衡,并采用 Apache 2.0 许可。用户可通过 Ollama 在 Claude Code、Hermes Agent、OpenClaw、Codex 等工具中直接调用。
AI模型Gemma 4Ollama多模态模型本地部署开源/仓库

推荐理由:本地运行多模态模型的门槛又降低了——Gemma 4 12B 在 Ollama 上即开即用,做本地 AI 应用或边缘推理的开发者可以直接上手试。
原文
03:03
03:03ollama@ollama
76°
NVIDIA 的 Nemotron 3 Ultra 模型现已可通过 Ollama 云端直接使用。该模型为 550B MoE 架构的开放前沿模型,专为长时间运行的智能体任务设计。相比其他开放前沿模型,推理速度提升 5 倍,复杂智能体任务成本降低最多 30%。用户可通过 Claude Code、Hermes Agent 等工具直接调用,也可用于通用聊天。
AI模型NVIDIANemotron 3 UltraOllamaMoE智能体

推荐理由:做智能体开发的团队终于有了一个低成本、高推理速度的开放模型选择,可以直接在 Ollama 上跑,建议试试看。
原文
6月4日
05:12
05:12ollama@ollama
GoogleDeepMind 的 Gemma 4-12B 模型现已可通过 Ollama 直接使用,支持 MLX 框架。用户可通过 `ollama run gemma4:12b-mlx` 命令快速启动聊天,还支持 Hermes Agent、Claude Code 等工具的集成。这为开发者提供了便捷的本地部署和实验途径,尤其适合在 Apple Silicon 设备上高效运行。
AI产品OllamaGemma 4MLX本地部署GoogleDeepMind

推荐理由:Ollama 让 Gemma 4-12B 的本地部署门槛降到最低,做模型实验或本地 Agent 开发的团队可以直接跑起来,省去繁琐配置。
原文
6月3日
14:17
14:17ollama@ollama
Nous Research 发布了 Hermes Desktop,这是 Hermes Agent 的桌面原生版本,首次在 Jensen 的 GTC 主题演讲中演示,现已公开预览。该工具允许用户通过 Ollama 使用本地或云端模型,实现智能体功能。这意味着开发者可以在自己的机器上运行 Hermes,无需依赖远程服务器,降低了使用门槛。对于希望探索本地 AI 智能体的用户来说,这是一个值得关注的新选择。
AI产品智能体Hermes DesktopOllama本地模型开源/仓库

推荐理由:Hermes Desktop 让本地 AI 智能体落地更简单,做自动化或智能体开发的团队可以直接通过 Ollama 体验,无需复杂配置。
原文
6月2日
14:19
14:19ollama@ollama
Ollama 宣布与 NVIDIA 合作,为 NVIDIA RTX Spark 超级芯片提供本地 AI 推理支持。RTX Spark 是一款 1 petaflop 的超级芯片,拥有完整的 CUDA 和 RTX 生态系统,并支持 Windows 原生智能体。这一合作将使得个人电脑能够运行更强大的本地 AI 模型,标志着个人计算的新起点。Ollama 用户将能够直接在 RTX Spark 上部署和运行 AI 模型,无需依赖云端。
AI产品OllamaNVIDIARTX Spark本地推理智能体

推荐理由:Ollama 与 NVIDIA 联手,让本地 AI 推理性能跃升到 petaflop 级别,做本地模型部署的开发者可以直接在 RTX Spark 上跑模型,值得关注。
原文
6月1日
11:44
11:44ollama@ollama
精选76°
MiniMax 与 Ollama 合作,将 M3 模型部署在 Ollama Cloud 上,面向美国用户且零数据留存。M3 是首个结合编程、智能体与多模态能力的开源权重模型,在 SWE-Bench Pro 上达到 59.0%,Terminal Bench 2.1 为 66.0%,并支持 100 万 token 上下文。用户可通过 Claude Code、Codex 或直接聊天方式在 Ollama 上使用 M3。模型权重和技术报告将在约 10 天后发布。
AI模型MiniMaxM3Ollama编程助手智能体

推荐理由:M3 在编程和智能体任务上表现突出,做自动化开发或智能体应用的团队可以直接在 Ollama Cloud 上免费试,零数据留存也适合对隐私敏感的开发者。
原文
5月30日
04:58
04:58ollama@ollama
OpenJarvis 是一个由斯坦福大学 HazyResearch 和 Scaling Intelligence 实验室开发的本地优先个人AI,现已支持通过 Ollama 运行。该项目属于“Intelligence Per Watt”研究的一部分,旨在探索高效的本地AI方案。OpenJarvis 强调在本地设备上运行,无需依赖云端,从而保护用户隐私并降低延迟。对于关注本地AI部署和隐私保护的开发者来说,这是一个值得尝试的新工具。
AI产品本地AIOllama个人助手开源/仓库斯坦福

推荐理由:斯坦福团队把本地AI的能效研究落地成了可用的个人助手,做边缘计算或隐私敏感应用的开发者可以直接用Ollama跑起来试试。
原文
5月25日
04:03
04:03Ate-a-Pi@svpino
精选
开发者 Santiago 发现可以用 Ollama 启动 Claude Code 并指定开源模型(如 Gemma 4:26B),但这样会失去使用 Anthropic 官方模型的能力。他询问是否有办法在 Claude Code 中同时使用 Anthropic 模型和开源模型。这反映了开发者对模型灵活性的需求,以及当前工具在模型切换上的限制。
AI产品Claude Code开源模型Ollama模型切换开发者工具

推荐理由:如果你在用 Claude Code 做开发,又想尝试开源模型,这个痛点值得关注——目前无法同时使用两种模型,但社区可能有解决方案。
原文
5月16日
19:56
19:56ollama@ollama
Ollama 官方推荐了几款适合与 Codex 配合使用的云模型,包括支持视觉的 kimi-k2.6:cloud 和 glm-5.1:cloud。对于没有付费订阅的用户,建议选择支持可靠工具调用的模型,如 nemotron-3-super:cloud、gemma4:31b:cloud 和 qwen3.6。这些模型能更好地与 Codex 的编程和工具调用功能协同工作。
AI产品CodexOllama编程助手模型推荐工具调用

推荐理由:Ollama 官方给出的 Codex 兼容模型清单,做 AI 编程的开发者可以直接参考选型,省去自己试错的成本。
原文
19:32
19:32ollama@ollama
Ollama 宣布为其云服务大幅增加 NVIDIA Blackwell GPU,以更好地支持 GLM-5.1 模型。同时,Ollama 也在每日为其他模型增加 GPU 资源。用户可通过 Ollama 的 Claude Code、Codex App 和 Hermes Agent 等工具调用 GLM-5.1 模型。该模型可通过命令 `ollama run glm-5.1:cloud` 直接运行。此举旨在提升模型推理性能和可用性。
AI产品OllamaGLM-5.1NVIDIA Blackwell GPU云服务模型部署

推荐理由:Ollama 为 GLM-5.1 加 GPU 意味着推理速度更快、并发更高,做 AI 应用开发或依赖云端大模型的团队值得关注,可以直接用命令体验。
原文
精选全部日报登录