全部 AI 动态 · AI 热点

6月26日

21:48

21:48

berryxia@berryxia

精选77°

PaddleOCR 发布 PP-OCRv6 系列，提供 Tiny、Small、Medium 三种尺寸，分别适配移动端、CPU 文档系统和高并发 API。在 A100 GPU 上单张推理仅需 0.13 秒，Intel CPU 上相比 v5 提速 3.9 至 5.2 倍，Apple M4 配合 ONNX Runtime 可达到 0.35 秒。官方强调轻量架构与高质量训练数据比单纯扩大参数规模更实用。

AI模型 PaddleOCR PP-OCRv6 部署优化轻量模型 OCR

推荐理由：PaddleOCR 把 v6 的部署数据拉得很细，A100 0.13 秒、M4 0.35 秒，还有三种尺寸选，想在生产环境搭 OCR 的直接抄作业。

02:16

02:16

vLLM@vllm_project

精选

vLLM 宣布 Day-0 支持 Liquid AI 的 LFM2.5-230M 小模型。该模型仅 230M 参数，预训练于 19T tokens 且支持 32K 上下文。专为手机、机器人、家庭自动化和网络设备上的 agent 任务设计。可运行于 CPU、NPU 和 GPU 等硬件。

AI模型 LFM2.5-230M vLLM Liquid AI 智能体轻量模型

推荐理由：vLLM 第一时间给 Liquid AI 的 LFM2.5 小模型做了适配，230M 参数跑 agent 任务，手机、机器人上都能用。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

09:46

09:46

arXiv: DeepSeek@Xu-Jing Ye, Yuan-Gen Wang, Ruping Wang

L-VARC是一种新框架，通过语言引导的LUPI分支增强视觉推理，解决ARC任务中纯语言模型参数大、纯视觉模型过拟合的问题。它利用DeepSeek-V3压缩语义，用CLIP对齐视觉与语义特征，训练后丢弃语言分支，仅保留18M参数的轻量模型。实验表明，L-VARC在ARC任务上超越现有最佳方法，代码已开源。

论文视觉推理 ARC LUPI DeepSeek-V3 轻量模型

推荐理由：ARC是AGI的关键测试，L-VARC用语言引导视觉推理，18M参数就能超越SOTA，做视觉推理或小模型研究的开发者值得一试。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

13:43

13:43

Cohere@cohere

Cohere 宣布赞助一场由 Hugging Face 和 Gradio 主办的黑客马拉松，主题是“缩小规模”。活动鼓励开发者构建足够小、运行成本低，但又能真正改变他人生活的 AI 应用。参与者可以创造古怪有趣的 AI 作品，或为身边人解决实际问题。这反映了行业对轻量、实用 AI 模型的关注趋势。

行业黑客马拉松 Cohere Hugging Face Gradio 轻量模型

推荐理由：想用低成本模型做出真正有用的东西？这场黑客马拉松就是为你准备的——Cohere 赞助、Hugging Face 和 Gradio 主办，直接上手做点小而美的 AI 应用，建议关注。