全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月2日

11:07

11:07

arXiv cs.AI@Kaidi Zhang, Guanxu Zhu

精选

本文提出一种基于可微多平面图像（MPI）的新视角合成方法，旨在平衡渲染速度、模型大小和稀疏视图下的性能。该方法利用视觉基础模型预测的点图进行几何初始化，并通过可微优化调整MPI层。为解决稀疏初始化导致的空洞和伪影问题，引入了一步扩散模型，同时参与MPI优化和渲染后处理。与基于3D高斯泼溅的代表性方法相比，该方法在正面视图场景下速度提升30.7%，模型大小仅为其14.8%，同时保持竞争性的合成质量。

论文新视角合成多平面图像可微优化稀疏视图轻量级模型

推荐理由：对于需要在新视角合成中兼顾速度、模型大小和稀疏视图性能的开发者，该方法提供了一个轻量级替代方案，比3DGS快30%且模型小85%，值得在移动端或资源受限场景下尝试。

5月22日

16:08

16:08

pandaily@contact@pandaily.com (Pandaily)

76°

字节跳动开源了Lance，一个仅3B激活参数的原生统一多模态AI模型。Lance能在一个系统中同时处理图像理解、图像生成和视频任务，无需多个模型拼接。该模型采用原生多模态架构，而非传统的视觉编码器+语言模型组合，实现了更高效的跨模态交互。Lance的开源发布为多模态AI研究提供了轻量级基线，尤其适合资源受限场景下的部署。

AI模型多模态模型开源/仓库字节跳动 Lance 轻量级模型

推荐理由：Lance用3B参数实现了图像理解+生成+视频的统一处理，做多模态应用或边缘部署的团队可以直接拿来用，省去多模型集成的麻烦。