精选理由
做设计、营销或内容创作的团队终于有了开源可部署的高质量生图模型——Ideogram 4.0 的文字绘制和布局控制能力直接对标商用产品,建议下载权重试试。
Ideogram 发布 4.0 开放权重文生图模型,9.3B 参数,采用单流 DiT 架构,文本与图像 tokens 共享注意力序列。该模型在文字绘制上表现突出,能准确呈现长文本,适合海报、商品图等场景。通过边界框和结构化 JSON 训练,用户可精确控制版式和元素位置。在 DesignArena 人类评价榜单中排名全球第 4,超越 Nano Banana Pro,成为最强开源生图模型。
AI 翻译 · 中文
Ideogram 发布 4.0 开放权重文生图模型,9.3B 参数,采用单流 DiT 架构,文本与图像 tokens 共享注意力序列。该模型在文字绘制上表现突出,能准确呈现长文本,适合海报、商品图等场景。通过边界框和结构化 JSON 训练,用户可精确控制版式和元素位置。在 DesignArena 人类评价榜单中排名全球第 4,超越 Nano Banana Pro,成为最强开源生图模型。
IT之家 6 月 4 日消息,Ideogram 昨日(6 月 3 日)发布博文,宣布推出 Ideogram 4.0 开放权重文文生图模型, 基于跑分数据是全球最佳开源生图 AI 模型。 该模型核心规模为 9.3B 参数,延续近期开源模型的单流架构路线,让文本 tokens 与图像 tokens 共享同 1 个自注意力序列,并把设计控制放在训练和推理格式的中心。 架构方面,该模型包括 Qwen3-VL-8B-Instruct 文本编码器、…