Liquid AI LFM2.5-8B-A1B:1.5B活跃参数跑本地Agent,接近4倍参数模型

很多人还在等参数更大的模型才能跑好本地Agent! Liquid AI的LFM2.5-8B-A1B…

精选理由

本地 Agent 开发者终于不用等大模型了——1.5B 活跃参数就能跑出接近 4 倍参数模型的效果,笔记本就能部署,隐私和延迟都解决了,做本地自动化的建议直接试。

AI 摘要

Liquid AI 发布 LFM2.5-8B-A1B 模型,这是一个 8B MoE 模型,但仅需 1.5B 活跃参数即可运行。该模型经过 38T tokens 训练和大规模 RL,支持 128K 上下文,工具调用和多步 Agent 能力接近 4 倍参数模型。单台笔记本即可运行完整本地 Agent 循环,延迟低且全程隐私安全,无需调用 GPT-4o 或 Claude。支持 llama.cpp、MLX、vLLM 等框架,覆盖 Apple、NVIDIA、AMD 硬件,表明本地 Agent 落地比预期更快。

AI 翻译 · 中文

Liquid AI 发布 LFM2.5-8B-A1B 模型,这是一个 8B MoE 模型,但仅需 1.5B 活跃参数即可运行。该模型经过 38T tokens 训练和大规模 RL,支持 128K 上下文,工具调用和多步 Agent 能力接近 4 倍参数模型。单台笔记本即可运行完整本地 Agent 循环,延迟低且全程隐私安全,无需调用 GPT-4o 或 Claude。支持 llama.cpp、MLX、vLLM 等框架,覆盖 Apple、NVIDIA、AMD 硬件,表明本地 Agent 落地比预期更快。

berryxia很多人还在等参数更大的模型才能跑好本地Agent! Liquid AI的LFM2.5-8B-A1B却用1.5B active参数就已经做到了。 这个8B MoE训练了38T tokens加大规模RL,上下文直接128K,工具调用和多步agent能力很强,能接近4倍参数模型的表现。 单台笔记本就能跑完整本地agent loop,延迟低、全程隐私安全,不用调用GPT-4o或Claude。 支持llama.cpp、MLX、vLLM等框架,覆盖