全部 AI 动态 · AI 热点

6月19日

09:54

09:54

arXiv cs.LG@Ali Asaria, Tony Salomone, Deep Gandhi

该论文提出了一种去偏见的、跨模型的VLM-as-3D-Judge协议，用于可靠地评估单图像到3D网格质量，弥补了传统几何和CLIP代理的不足。研究者将该评分器用于优化开源生成模型TRELLIS在特定资产类别（家具）上的表现，无需人工标注。他们使用训练评委（Qwen2.5-VL-7B）和评估评委（InternVL3-8B）分离以避免循环，并修复了图像过载、几何隐藏渲染和无参考评分等三种失败模式。实验表明，在轻度参数高效适应下，该方法与强基线持平（胜率0.50），但无法超过65%的胜率目标，且发现干净输入会饱和评委。

论文 TRELLIS Qwen2.5-VL-7B InternVL3-8B 单图像3D生成 VLM-as-judge

推荐理由：这篇论文介绍了一种让AI自动评判并优化3D生成质量的方法，不用人工打标签。它把VLM评委从打分变成训练的一部分，在特定类别（家具）上达到了和强基线持平的效果，但说明了简单微调还不够。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？