Ethan He 访谈:模型进步靠迭代,GPT Image 思考比生成慢

果然做过的人的分享就是不一样,Laten Space 访谈了 Ethan He,罗列一些观点: 1. 模型进步速度,来自于团队迭代速度。 2. 模型质量提升,往往不来自新算法,而是来自修数据和训练...

精选理由

Ethan He 把模型训练和交互设计的底层逻辑讲透了,做模型训练或产品设计的开发者看完会有启发,特别是关于迭代速度和交互未来的观点值得反复琢磨。

AI 摘要

Laten Space 访谈了 Ethan He,分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度,质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注,GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层,在脑机接口普及前,最自然的交互方式是用户说话、AI 用生成式画面回应。

AI 翻译 · 中文

Laten Space 访谈了 Ethan He,分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度,质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注,GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层,在脑机接口普及前,最自然的交互方式是用户说话、AI 用生成式画面回应。

向阳乔木果然做过的人的分享就是不一样,Laten Space 访谈了 Ethan He,罗列一些观点: 1. 模型进步速度,来自于团队迭代速度。 2. 模型质量提升,往往不来自新算法,而是来自修数据和训练流程里的BUG(最近好多研究员播客访谈都提到类似观点) 3. 视频模型训练需要文本视频对标注,画面描述要详细到让盲人听完文字,能在脑海中重建这段视频。 4. GPT Image 生成一张图要几分钟,大部分时间不是在生成像素,而是在"思