13:01marktechpost@Asif Razzaq精选Liquid AI 发布了 LFM2.5-230M,这是其最小的 230M 参数开源权重模型。该模型在 Galaxy S25 Ultra 上达到 213 tok/s,在 Raspberry Pi 5 上为 42 tok/s。基于 LFM2 架构,它专注于工具使用和数据提取,在指令遵循上击败了 Qwen3.5-0.8B 和 Gemma 3 1B 等更大模型。模型支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 框架。AI模型LFM2.5-230MLiquid AI开源模型设备端推理推理框架1 个信源在谈推荐理由:Liquid AI 出了个超小模型 LFM2.5-230M,手机跑 213 tokens 每秒,树莓派也能跑 42,指令遵循还比 Qwen3.5-0.8B 和 Gemma 3 1B 强。原文
13:23IT之家(博客/媒体)6月12日,MiniMax 开源了新一代原生多模态旗舰模型 M3。同日,摩尔线程宣布其旗舰级 AI 训推一体智算卡 MTT S5000 已完成对该模型的 Day-0 适配。MTT S5000 凭借硬件级原生 FP8 加速,单卡 AI 算力(稠密)高达 1000 TFLOPS,配备 80GB 显存与 1.6TB/s 带宽,支撑百万 token 级长序列。适配通过原生算子定制提升推理吞吐并降低延迟,同时同步拉起 vLLM 与 SGLang 两大推理框架。AI模型MiniMax M3摩尔线程MTT S5000多模态推理框架7 个信源在谈推荐理由:摩尔线程让国产模型跑得更快原文
09:59arXiv: DeepSeek@Rui Huang, Zekun Jiang, Xingyu Niu, Yuqiang Li, Xinying Gu, Tianhang Zhou精选ChargeBD 是一个面向电池研发的异构智能体推理框架,旨在解决氧化还原液流电池(RFB)多尺度、多目标的研发难题。该框架基于 MBTI 人格理论定义了 16 种认知偏好的智能体,并构建了包含 500 个问题的 ESS-LLM 基准测试。实验使用 DeepSeek-V3-Plus 作为基础模型,通过评估不同人格智能体的表现,构建了能力矩阵和认知优势矩阵。这项工作为科学领域的 LLM 应用提供了更结构化的推理方法,尤其适用于需要跨领域权衡的复杂工程问题。论文电池研发异构智能体MBTI人格推理框架DeepSeek-V3-Plus推荐理由:电池研发团队终于有了一个能处理多目标权衡的 AI 框架——ChargeBD 用 MBTI 人格智能体模拟不同研发角色的认知偏好,做能源材料或系统优化的研究者可以直接参考其方法。原文
02:42Google AI Developers@googleaidevsGoogle AI 开发者团队宣布推出 Gemma 3 模型,该模型兼容 llama.cpp、MLX、LM Studio、vLLM、Ollama、UnslothAI 和 SGLang 等主流推理框架。权重已同步上传至 Kaggle 和 Hugging Face 平台,开发者可自由下载使用。这一发布意味着 Gemma 3 能无缝融入现有 AI 工具链,降低部署门槛。AI模型Gemma 3Google推理框架开源/仓库模型部署推荐理由:Google 终于把 Gemma 3 的兼容性做全了——主流推理框架全覆盖,做本地部署或模型微调的开发者可以直接去 Hugging Face 下载权重,省去适配烦恼。原文