精选理由
Ornith-1.0 用 RL 教模型搭执行框架,在 SWE-Bench 上表现顶尖,本地党还有 GGUF 版本可玩。
Ornith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源,并提供了 GGUF 版本,可在 Ollama、Unsloth 等工具中直接运行。
AI 翻译 · 中文
Ornith-1.0 模型家族覆盖 9B 到 397B MoE 全尺寸。在 Terminal-Bench、SWE-Bench 等 agent coding 基准上达到当前开源模型顶尖水平。其训练方式使用 RL 同时优化任务脚手架和最终解决方案。模型全系列 MIT 开源,并提供了 GGUF 版本,可在 Ollama、Unsloth 等工具中直接运行。
卧槽!最近开源大模型太卷了啊! 这不又一个专注agentic coding的开源模型家族来了,叫Ornith-1.0。 它覆盖了从9B到397B MoE的全尺寸,在Terminal-Bench、SWE-Bench等agent coding benchmark上达到了当前开源模型里的顶尖水平。 最有意思的是它的训练方式:不是只让模型生成答案,是用RL同时优化“任务脚手架(scaffold)”和最终解决方案,让模型自己学会怎么搭建更好的执行…