13:01marktechpost@Asif Razzaq精选Liquid AI 发布了 LFM2.5-230M,这是其最小的 230M 参数开源权重模型。该模型在 Galaxy S25 Ultra 上达到 213 tok/s,在 Raspberry Pi 5 上为 42 tok/s。基于 LFM2 架构,它专注于工具使用和数据提取,在指令遵循上击败了 Qwen3.5-0.8B 和 Gemma 3 1B 等更大模型。模型支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 框架。AI模型LFM2.5-230MLiquid AI开源模型设备端推理推理框架1 个信源在谈推荐理由:Liquid AI 出了个超小模型 LFM2.5-230M,手机跑 213 tokens 每秒,树莓派也能跑 42,指令遵循还比 Qwen3.5-0.8B 和 Gemma 3 1B 强。原文
18:36marktechpost@Asif RazzaqLiquid AI推出两个350M参数的多语言检索模型:LFM2.5-Embedding-350M(稠密双编码器)和LFM2.5-ColBERT-350M(后期交互模型),支持11种语言。模型专为边缘设备设计,可快速执行跨语言搜索。其ColBERT架构在保持高精度的同时,能处理句子级交互匹配。AI模型LFM2.5-Embedding-350MLFM2.5-ColBERT-350MLiquid AI多语言搜索边缘检索推荐理由:Liquid AI出了两个轻量模型,350M参数就能做11种语言的搜索,还能装到手机等边缘设备上跑。原文
07:36marktechpost@Asif RazzaqLiquid AI 发布了 LFM2.5-8B-A1B,一款面向端侧设备的混合专家(MoE)模型。该模型总参数量为 8.3B,但每次推理仅激活 1.5B 参数,大幅降低了计算和内存需求。它支持 128K 上下文长度,具备推理和工具调用能力,可在消费级硬件上运行。这标志着端侧 AI 模型在效率与能力之间取得了重要平衡,为移动设备和边缘计算场景提供了新的选择。AI模型端侧模型MoELiquid AI推理模型工具调用推荐理由:端侧部署大模型一直受限于算力和内存,LFM2.5-8B-A1B 用 1.5B 激活参数实现 128K 上下文和工具调用,做移动端 AI 应用或边缘推理的开发者可以直接评估其性能。原文