Ethan He 访谈：模型进步靠迭代，GPT Image 思考比生成慢

精选理由

Ethan He 把模型训练和交互设计的底层逻辑讲透了，做模型训练或产品设计的开发者看完会有启发，特别是关于迭代速度和交互未来的观点值得反复琢磨。

AI 摘要

Laten Space 访谈了 Ethan He，分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度，质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注，GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层，在脑机接口普及前，最自然的交互方式是用户说话、AI 用生成式画面回应。

AI 翻译 · 中文

向阳乔木果然做过的人的分享就是不一样，Laten Space 访谈了 Ethan He，罗列一些观点： 1. 模型进步速度，来自于团队迭代速度。 2. 模型质量提升，往往不来自新算法，而是来自修数据和训练流程里的BUG（最近好多研究员播客访谈都提到类似观点） 3. 视频模型训练需要文本视频对标注，画面描述要详细到让盲人听完文字，能在脑海中重建这段视频。 4. GPT Image 生成一张图要几分钟，大部分时间不是在生成像素，而是在"思…

查看原推