精选理由
Ethan He 把模型训练和交互设计的底层逻辑讲透了,做模型训练或产品设计的开发者看完会有启发,特别是关于迭代速度和交互未来的观点值得反复琢磨。
Laten Space 访谈了 Ethan He,分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度,质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注,GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层,在脑机接口普及前,最自然的交互方式是用户说话、AI 用生成式画面回应。
AI 翻译 · 中文
Laten Space 访谈了 Ethan He,分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度,质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注,GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层,在脑机接口普及前,最自然的交互方式是用户说话、AI 用生成式画面回应。
果然做过的人的分享就是不一样,Laten Space 访谈了 Ethan He,罗列一些观点: 1. 模型进步速度,来自于团队迭代速度。 2. 模型质量提升,往往不来自新算法,而是来自修数据和训练流程里的BUG(最近好多研究员播客访谈都提到类似观点) 3. 视频模型训练需要文本视频对标注,画面描述要详细到让盲人听完文字,能在脑海中重建这段视频。 4. GPT Image 生成一张图要几分钟,大部分时间不是在生成像素,而是在"思…