AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:轻量模型×
6月26日
21:48
21:48berryxia@berryxia
精选77°
PaddleOCR 发布 PP-OCRv6 系列,提供 Tiny、Small、Medium 三种尺寸,分别适配移动端、CPU 文档系统和高并发 API。在 A100 GPU 上单张推理仅需 0.13 秒,Intel CPU 上相比 v5 提速 3.9 至 5.2 倍,Apple M4 配合 ONNX Runtime 可达到 0.35 秒。官方强调轻量架构与高质量训练数据比单纯扩大参数规模更实用。
AI模型PaddleOCRPP-OCRv6部署优化轻量模型OCR

推荐理由:PaddleOCR 把 v6 的部署数据拉得很细,A100 0.13 秒、M4 0.35 秒,还有三种尺寸选,想在生产环境搭 OCR 的直接抄作业。
原文
02:16
02:16vLLM@vllm_project
精选
vLLM 宣布 Day-0 支持 Liquid AI 的 LFM2.5-230M 小模型。该模型仅 230M 参数,预训练于 19T tokens 且支持 32K 上下文。专为手机、机器人、家庭自动化和网络设备上的 agent 任务设计。可运行于 CPU、NPU 和 GPU 等硬件。
AI模型LFM2.5-230MvLLMLiquid AI智能体轻量模型

推荐理由:vLLM 第一时间给 Liquid AI 的 LFM2.5 小模型做了适配,230M 参数跑 agent 任务,手机、机器人上都能用。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
09:46
09:46arXiv: DeepSeek@Xu-Jing Ye, Yuan-Gen Wang, Ruping Wang
L-VARC是一种新框架,通过语言引导的LUPI分支增强视觉推理,解决ARC任务中纯语言模型参数大、纯视觉模型过拟合的问题。它利用DeepSeek-V3压缩语义,用CLIP对齐视觉与语义特征,训练后丢弃语言分支,仅保留18M参数的轻量模型。实验表明,L-VARC在ARC任务上超越现有最佳方法,代码已开源。
论文视觉推理ARCLUPIDeepSeek-V3轻量模型

推荐理由:ARC是AGI的关键测试,L-VARC用语言引导视觉推理,18M参数就能超越SOTA,做视觉推理或小模型研究的开发者值得一试。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月3日
13:43
13:43Cohere@cohere
Cohere 宣布赞助一场由 Hugging Face 和 Gradio 主办的黑客马拉松,主题是“缩小规模”。活动鼓励开发者构建足够小、运行成本低,但又能真正改变他人生活的 AI 应用。参与者可以创造古怪有趣的 AI 作品,或为身边人解决实际问题。这反映了行业对轻量、实用 AI 模型的关注趋势。
行业黑客马拉松CohereHugging FaceGradio轻量模型

推荐理由:想用低成本模型做出真正有用的东西?这场黑客马拉松就是为你准备的——Cohere 赞助、Hugging Face 和 Gradio 主办,直接上手做点小而美的 AI 应用,建议关注。
原文
精选全部日报登录