全部 AI 动态 · AI 热点

AITOP

6月25日

18:27

量子位@鹭羽

一家3D生成公司发布新模型，能在4秒内生成百万面网格，精度达到千万面级别。该模型支持12K高清贴图，渲染质量显著提升。相比传统建模流程，生成效率提升数十倍。该公司此前已获得数亿元融资。

AI模型 3D生成百万面高精度 12K贴图实时生成

推荐理由：这个模型4秒就能出百万面，精度千万还能做12K贴图，做游戏和影视的3D内容能省很多时间。

原文

6月24日

12:14

arXiv cs.AI@Haorui Ji, Weizhe Liu, Hongdong Li, Hengkai Guo

FLUX3D 提出了一种从单张图像生成高保真 3D 高斯泼溅（3DGS）的新方法。它通过设计 Diffusion-Aligned Structured Latents (DA-SLAT) 改进稀疏体素表示，并用 Sparse-structure Multimodal Diffusion Transformer (SMDiT) 和 Modal-Aware Rotary Positional Embedding (MARoPE) 解决二维图像令牌与三维体素潜在的对齐问题。在多个基准测试中，FLUX3D 在外观保真度上显著优于现有最先进方法，生成的 3DGS 资产质量更高。

AI模型 FLUX3D 3D生成高斯泼溅扩散模型稀疏表示

推荐理由：想从单张图生成高质量3D模型？FLUX3D用扩散对齐稀疏表示解决了细节丢失问题，效果比现有方法好一截，值得搞3D生成的看看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

13:55

歸藏(guizang.ai)@op7418

76°

MiMo 推出了 V2.5 Pro UltraSpeed 模型，实现每秒输出超过 1000 Token，成为全球首个达到此速度的万亿参数模型。博主归藏进行了三项测试，包括复杂 3D 游戏和官网动画生成，峰值速度达 1426 Token/s，首次响应最快仅 0.83 秒。该模型在保持高速度的同时未出现能力下降，优于此前 Groq 等方案。这种超高速推理在 Agent 场景下能显著提升效率，尤其适合并发 Sub-Agent 任务。MiMo 主要面向对效率要求极高的 To B 客户，未来有望优化成本惠及普通用户。

AI模型 MiMo 超高速推理万亿参数模型 Agent效率 3D生成

推荐理由：MiMo 把万亿参数模型的推理速度拉到 1000+ Token/s，做 Agent 和实时交互的开发者值得关注——速度提升直接缩短任务等待时间，并发场景下体验翻倍。

原文

6月7日

07:27

AI Will@FinanceYF5

精选

VIGA将Blender转化为反馈环境，用于训练3D资产的行为属性，如门开合、铰链旋转、抽屉拉动。Articraft3D则把3D生成定义为写测试驱动的程序，确保模型不仅外观逼真，物理交互也正确。两项工作都聚焦于3D资产的功能性验证，超越传统渲染静态图。

AI模型 VIGA Articraft3D Blender 3D生成测试驱动

推荐理由：3D生成要行为正确，试试它们

原文

6月4日

10:57

arXiv cs.AI@Josef Bengtson, Yaroslava Lochman, Fredrik Kahl

现有多视图图像编辑方法大多局限于刚性或外观编辑，无法处理改变场景几何的非刚性编辑。GeM-NR 提出了一种无需训练的快速方法，通过深度图对齐、视角投影和条件细化，实现多视图一致的几何与外观编辑。该方法兼容 FLUX、Qwen、BrushNet 等主流编辑器，支持从两视图扩展到多视图，显著提升了编辑质量和几何光度一致性。实验表明，GeM-NR 在非刚性编辑任务上达到当前最优水平，甚至能生成编辑后的 3D 表示。

论文多视图编辑非刚性编辑几何感知 3D生成无需训练

推荐理由：做 3D 内容生成或多视图编辑的开发者，终于有了能处理大幅几何变形的工具——GeM-NR 无需训练即可与主流编辑器配合，建议试试看能否解决你场景中的非刚性编辑痛点。

原文

5月28日

23:04

AK@_akhaliq

精选

PhysX-Omni是一个统一的仿真就绪物理3D生成框架。它支持刚体、可变形体和铰接物体三种类型的生成。生成的3D模型可直接用于物理仿真环境。该框架无需后处理即可产出仿真兼容的几何与物理属性。

AI模型 PhysX-Omni 3D生成物理仿真刚体铰接物体

推荐理由：统一生成三类物理物体

原文

11:29

arXiv cs.AI@Yiheng Zhu, Kangle Deng, Jean-Philippe Fauconnier, Inaki Navarro, Daiqing Li, Ava Pun, Yinan Zhang, Peiye Zhuang, Xiaoxia Sun, Maneesh Agrawala, Kiran Bhat, Tinghui Zhou

精选

CubePart 是一个新型生成框架，能够根据用户定义的部件名称列表（如“轮子”“门”），生成语义一致、可组装的3D网格部件。它解决了现有3D生成模型输出单一网格或任意部件分解、无法满足游戏和仿真中特定部件需求的问题。框架包含一个大规模开放词汇部件标注数据集构建流程，以及两阶段生成架构（全局形状合成+部件级解码）。生成的3D资产可直接导入游戏引擎，无需手动后处理即可支持动画和脚本行为。

论文 3D生成部件可控开放词汇游戏/仿真 CubePart

推荐理由：游戏和仿真开发者终于有了能按需生成语义部件的3D工具——CubePart 让部件结构成为显式控制信号，生成的资产可直接驱动动画和脚本，省去大量手动拆解工作，做交互式3D内容的团队值得一试。

原文

5月25日

17:37

小互@imxiaohu

76°

Hyper3D 推出 Rodin Gen-2.5，号称最强 3D 生成模型，能在 4 秒内生成百万面模型，并支持千万面级输出。模型细节可还原毛孔、皮肤微结构，原生贴图纹理与几何严格对齐，支持 PBR 材质。提供从极低到极高五种思考模式，最快 4 秒出稿，极高模式 80 秒生成专业级资产。支持 Faithful 和 Creative 两种模式，可并行跑 10 个模型，背后团队影眸科技曾获 SIGGRAPH 2025 最佳论文奖。

AI产品 3D生成 Rodin Gen-2.5 Hyper3D 贴图纹理 SIGGRAPH

推荐理由：3D 内容创作者终于有了能兼顾速度与细节的工具——Rodin Gen-2.5 4 秒出百万面模型，连毛孔和衣料纹理都能还原，做游戏资产或影视道具的团队可以直接上手试。

原文

5月24日

16:28

rohanpaul_ai@rohanpaul_ai

李飞飞在a16z视频中定义机器人不是按人形或汽车等形态，而是按功能：任何必须在物理3D空间中感知、理解并行动的“具身机器”。她提出“空间智能”是机器人的统一原则，使机器人能执行任务并与人类协作。她指出人类一直局限于单一物理地球3D世界，但结合3D生成与重建的新技术正在打破这一限制，创造出无限数字宇宙，可用于训练机器人、激发创造力、旅行和叙事。

论文机器人空间智能 3D生成具身智能 a16z

推荐理由：李飞飞讲机器人本质，清晰又启发

原文

5月21日

08:00

向阳乔木@vista8

前字节员工分享使用 Rodin Gen-2.5 的体验：只需一张图片即可生成高精度 3D 模型，支持 obj、fbx、glb 等格式导出，可直接导入 3D 软件编辑。该模型号称全球首款实现千万级面数的 3D 生成模型，采用原生 3D 贴图算法，纹理超精细。相比传统流程需要协调建模师、绑骨师、贴图师等多角色，Rodin Gen-2.5 大幅降低了 3D 内容制作门槛，对游戏、动画、影视行业是真正的生产力工具。

AI产品 3D生成 Rodin Gen-2.5 游戏开发动画制作生产力工具

推荐理由：做游戏、动画或影视的团队，终于可以告别协调建模师、绑骨师、贴图师的崩溃流程——一张图生成千万级面数 3D 资产，直接导出 obj/fbx/glb 进软件编辑，建议立刻试一下。

原文

5月16日

17:01

Justine Moore@venturetwins

该项目利用World Labs从输入图片生成3D世界，自动识别并提取应转为3D物体的元素，通过NB或GPT Image移除原图背景，再用Hunyuan 3D渲染为立体对象，最后由ElevenLabs添加音效和环境音。整个流程实现了从单张图片到沉浸式3D场景的自动化构建，展示了多模型协作的潜力。

AI产品 3D生成 World Labs Hunyuan 3D ElevenLabs 多模型协作

推荐理由：做3D内容生成或游戏资产制作的开发者可以看看这个多模型协作的流水线，从图片到3D世界一步到位，值得尝试复现。

原文

5月14日

10:10

Geek@geekbb

精选

清华与腾讯ARC Lab的SIGGRAPH 2026论文提出新方法，从单张图片生成像素级对齐的3D模型。该方法在多个基准测试中达到SOTA，无需多视角输入即可实现高精度纹理映射。代码已开源在GitHub仓库PHjont/Wallpap。

论文清华腾讯 ARC Lab SIGGRAPH2026 3D生成单张图片

推荐理由：单图变3D，像素级对齐

原文

5月12日

17:35

AK@_akhaliq

Pixal3D是一个新的3D生成方法，能够从单张或多张图像生成像素对齐的3D模型。该方法利用像素对齐的表示方式，提高了生成3D模型的几何和纹理精度。相关论文和代码已发布，为3D内容创作提供了更高效的工具。该技术有望推动AR/VR、游戏和影视领域的3D资产自动化生成。

论文 3D生成像素对齐多模态论文

推荐理由：Pixal3D通过像素对齐提升3D生成质量，对于自动化3D建模和数字内容创作具有实际应用价值，值得关注。

原文

5月11日

22:18

岚叔@lufzzliz

用户使用GPT image 2和Gemini 3.1 pro联合生成3D生物结构展示页面，效果惊艳。该页面可用于AI教育，作者表示将复刻该项目。展示了多模态AI在科学可视化领域的应用潜力。

AI产品 GPT image 2 Gemini 3.1 pro 3D生成 AI教育多模态

推荐理由：该案例展示了GPT image 2与Gemini 3.1 pro在3D生物结构生成上的协同能力，为AI教育提供了低成本、高视觉质量的实践路径，值得关注。

原文

22:18

岚叔@lufzzliz

作者复刻了DilumSanjaya的3D细胞可视化项目，并分享了完整教程和开源代码。过程包括用Coex复刻网站基础结构，用Three.js做初步3D展示，然后通过GPT image 2生成细胞多视角图，再用Tripo图生3D模型替换为真3D文件。目前完成前两个3D效果，后面部分待更新。该项目展示了AI辅助3D内容生成的实用工作流。

AI产品 3D生成 Coex Tripo GPT image 2 开源/仓库

推荐理由：该教程展示了结合Coex、GPT image 2和Tripo进行3D内容复刻的完整流程，对AI模型与3D工具协同工作有参考价值，适合关注AI生成3D应用的开发者。

原文