论文精选

Utility-Aware多模态对比学习:生成更卖货的商品图

Utility-Aware Multimodal Contrastive Learning for Product Image Generation

精选理由

电商团队和AI产品经理终于有了直接优化销量的图像生成方案——不用再猜哪张图更卖货,模型自己学会了。做商品图生成的开发者建议直接看论文里的损失函数设计。

AI 摘要

现有AI生成商品图虽能匹配文本描述,但未直接优化电商转化率。本文提出Utility-Aware InfoNCE损失函数,将消费者需求纳入对比学习,引导模型生成既语义一致又能提升需求的图像。在Amazon和Airbnb数据集上,该方法在提升需求、保持图像保真度和文本一致性方面均优于现有模型。人类实验验证了其商业有效性,且该框架可灵活嵌入新兴生成模型。

AI 翻译 · 中文

现有AI生成商品图虽能匹配文本描述,但未直接优化电商转化率。本文提出Utility-Aware InfoNCE损失函数,将消费者需求纳入对比学习,引导模型生成既语义一致又能提升需求的图像。在Amazon和Airbnb数据集上,该方法在提升需求、保持图像保真度和文本一致性方面均优于现有模型。人类实验验证了其商业有效性,且该框架可灵活嵌入新兴生成模型。

arXiv cs.AIProduct images strongly influence consumer decision-making in online marketplaces. Empowered by multimodal contrastive learning, generative AI can output images that closely align with text prompts. Yet existing generati