全部 AI 动态 · AI 热点

5月18日

12:05

12:05

Paul Couvert@itsPaulAi

HiDream-O1-Image 是一款开源图像生成模型，在多数使用场景下表现出色，足以替代闭源替代品。它在照片级真实感、长文本渲染、图像编辑（添加/替换/移除元素）以及提示词遵循度方面均有优异表现。其 8B 变体在所有开源基线中领先，性能与 Nano Banana 相当，而 200B 版本则达到当前最优水平。该模型为开发者提供了高性价比的闭源替代选择。

AI模型图像生成开源模型 HiDream-O1-Image 照片级真实感图像编辑

推荐理由：做图像生成和编辑的开发者终于有了一个能打的开源模型——HiDream-O1-Image 在多数场景下可替代闭源方案，8B 版本性能媲美 Nano Banana，建议直接上手试试。

12:05

12:05

Paul Couvert@itsPaulAi

72°

HiDream AI 与 Vivago AI 联合开源了 HiDream 图像生成模型，该模型在性能上可与闭源商业模型竞争。模型权重、技术报告和在线试用空间均已发布在 Hugging Face 和 GitHub 上。开源社区对此反应热烈，认为这是开源图像模型的重要里程碑。用户可以直接下载模型或在线体验，无需等待。

AI模型 HiDream 图像生成开源/仓库 Hugging Face AI模型

推荐理由：开源图像模型终于有了能打闭源方案的选手，做图像生成或 AI 绘画的开发者可以直接下载模型或在线试用，值得立刻体验。

5月16日

20:04

20:04

OpenRouter@OpenRouterAI

Recraft AI 在 OpenRouter 上发布了 V4.1 系列六款新图像生成模型，包括主打高美学的 V4.1 和 V4.1 Pro、专为 SVG 插画设计的 V4.1 Vector 和 V4.1 Pro Vector，以及面向产品图像的 V4.1 Utility 和 V4.1 Utility Pro。新模型在照片真实感、渐变平滑度和短提示命中率上均有显著提升，用户无需过多提示工程即可获得高质量结果。这一更新为设计师和开发者提供了更多专业选择，可直接通过 OpenRouter API 调用。

AI产品图像生成 Recraft OpenRouter SVG 产品设计

推荐理由：Recraft V4.1 系列覆盖了从高美学到矢量插画、产品图等多个细分场景，做设计或 AI 应用的团队可以直接在 OpenRouter 上试用，短提示效果提升明显，值得一试。

19:31

19:31

Recraft@recraftai

Recraft AI 在 X 上发布了其 V4.1 模型与 Midjourney V8.1 的对比评测。使用完全相同的提示词，两个模型在构图、情绪、纹理和细节上展现出截然不同的创意选择。该对比展示了当前顶级 AI 图像生成模型在风格和美学上的差异，帮助用户理解不同模型的擅长领域。更多与其他模型的对比结果可在 Recraft 的博客中查看。

AI产品 Recraft V4.1 Midjourney V8.1 图像生成模型对比创意设计

推荐理由：做 AI 视觉设计或内容创作的团队，可以通过这个对比快速判断哪个模型更符合自己的审美偏好，值得点开看看差异。

19:03

19:03

Guillermo Rauch@rauchg

Vercel CEO 展示新工具 ai-cli，允许用户在终端中直接渲染图片，例如通过 `npx ai-cli image 'a vercel ai sdk diagram'` 命令。该工具安装简单（`npm i -g ai-cli`），并可通过 Vercel AI Gateway 即时访问所有图像、视频和文本模型。这一功能将终端变为多模态交互界面，简化了开发者的工作流。

AI产品 Vercel AI CLI 终端工具图像生成 AI Gateway

推荐理由：终端直接渲染图片解决了开发者频繁切换工具查看 AI 生成内容的痛点，做 AI 应用或 CLI 工具的团队值得一试，安装即用。

5月14日

14:51

14:51

Midjourney@midjourney

73°

Midjourney 宣布开始测试其 V8 模型的早期版本，面向社区开放。新模型在提示跟随能力上大幅提升，生成速度提高了 5 倍，并支持原生 2K 分辨率模式。此外，文本渲染得到改进，个性化、风格参考和情绪板功能也达到最佳性能。这标志着 Midjourney 在图像生成质量和效率上的重要升级。

AI产品 Midjourney V8模型图像生成 2K分辨率文本渲染

推荐理由：Midjourney V8 的 5 倍速度和原生 2K 模式对设计师和创意工作者是直接利好，提示跟随的改进能减少反复调参的烦恼，建议有 AI 绘图需求的用户第一时间体验。

13:36

13:36

xAI@xai

xAI 宣布其 API 上线了图像生成质量模式（Image Generation Quality Mode），该模型已在 Grok 上驱动超过 3 亿张图像的生成。新模式提升了图像的真实感、文本渲染能力以及创意控制，特别面向商业专业人士。这意味着开发者现在可以通过 API 调用更高质量的图像生成能力，用于营销、设计等场景。

AI产品 xAI 图像生成 API 质量模式商业应用

推荐理由：xAI 把 Grok 上验证过的图像生成能力开放给 API 用户，做商业设计或内容生成的团队可以直接集成，提升出图质量和可控性。

5月12日

21:55

21:55

AK@_akhaliq

阿里发布Qwen-Image-2.0技术报告，介绍了新一代多模态图像生成模型。该模型在文本到图像生成、图像编辑和风格迁移等任务上表现出色，支持高分辨率输出和细粒度控制。报告详细阐述了模型架构、训练方法和性能评估，表明其在多项基准测试中达到领先水平。这对于推动多模态AI发展和实际应用具有重要意义。

论文多模态图像生成 Qwen 技术报告

推荐理由：Qwen-Image-2.0的发布展示了阿里在多模态生成领域的持续进步，为图像生成任务提供了新的基准和工具，值得相关从业者关注。

17:19

17:19

歸藏(guizang.ai)@op7418

OpenAI 推出了GPT-image-2.0图像生成模型，同时Seedance 2.0也发布了更新。GPT-image-2.0在图像生成质量、多样性和控制能力上有了显著提升，支持更精细的文本到图像生成。Seedance 2.0则侧重于视频生成领域的改进。这两个模型的发布进一步推动了AI多模态生成技术的发展，为创意行业和内容生产提供了更强大的工具。

AI模型图像生成视频生成 GPT-image-2.0 Seedance 2.0 多模态

推荐理由：对于AI生成领域从业者，GPT-image-2.0和Seedance 2.0的发布代表了图像和视频生成技术的最新进展，值得关注其在实际应用中的表现和潜在影响。