13:01marktechpost@Asif Razzaq精选Liquid AI 发布了 LFM2.5-230M,这是其最小的 230M 参数开源权重模型。该模型在 Galaxy S25 Ultra 上达到 213 tok/s,在 Raspberry Pi 5 上为 42 tok/s。基于 LFM2 架构,它专注于工具使用和数据提取,在指令遵循上击败了 Qwen3.5-0.8B 和 Gemma 3 1B 等更大模型。模型支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 框架。AI模型LFM2.5-230MLiquid AI开源模型设备端推理推理框架1 个信源在谈推荐理由:Liquid AI 出了个超小模型 LFM2.5-230M,手机跑 213 tokens 每秒,树莓派也能跑 42,指令遵循还比 Qwen3.5-0.8B 和 Gemma 3 1B 强。原文
09:59arXiv: DeepSeek@Rui Huang, Zekun Jiang, Xingyu Niu, Yuqiang Li, Xinying Gu, Tianhang Zhou精选ChargeBD 是一个面向电池研发的异构智能体推理框架,旨在解决氧化还原液流电池(RFB)多尺度、多目标的研发难题。该框架基于 MBTI 人格理论定义了 16 种认知偏好的智能体,并构建了包含 500 个问题的 ESS-LLM 基准测试。实验使用 DeepSeek-V3-Plus 作为基础模型,通过评估不同人格智能体的表现,构建了能力矩阵和认知优势矩阵。这项工作为科学领域的 LLM 应用提供了更结构化的推理方法,尤其适用于需要跨领域权衡的复杂工程问题。论文电池研发异构智能体MBTI人格推理框架DeepSeek-V3-Plus推荐理由:电池研发团队终于有了一个能处理多目标权衡的 AI 框架——ChargeBD 用 MBTI 人格智能体模拟不同研发角色的认知偏好,做能源材料或系统优化的研究者可以直接参考其方法。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……