全部 AI 动态 · AI 热点

6月17日

00:10

00:10

Justine Moore@venturetwins

Ideogram 发布了名为 Ideogram 2.0 的开源权重图像模型，宣称在开放权重类别中排名第一。该模型体积足够小，可在消费级 GPU 上运行，但在设计任务上与 Nano Banana 和 GPT Image 竞争。研究团队由 @mo_norouzi 领导，分享了技术细节和观点。

AI模型 Ideogram 开源模型图像生成消费级GPU GPT Image

推荐理由：Ideogram 这个开源权重图像模型能在普通显卡上跑，还能和 GPT Image 掰手腕，适合不想烧钱又想要好效果的人。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

16:51

16:51

向阳乔木@vista8

Laten Space 访谈了 Ethan He，分享了一系列关于 AI 模型训练与交互的深刻观点。他指出模型进步速度取决于团队迭代速度，质量提升更多来自修数据和训练流程中的 bug 而非新算法。视频模型训练需要极其详细的文本标注，GPT Image 生成图片时大部分时间在思考重写提示词。他还认为扩散模型将成为人机交互的前端层，在脑机接口普及前，最自然的交互方式是用户说话、AI 用生成式画面回应。

行业模型训练迭代速度 GPT Image 扩散模型人机交互

推荐理由：Ethan He 把模型训练和交互设计的底层逻辑讲透了，做模型训练或产品设计的开发者看完会有启发，特别是关于迭代速度和交互未来的观点值得反复琢磨。

5月16日

14:54

14:54

Ate-a-Pi@svpino

72°

一位开发者提出了一个多模型架构模式，该模式将用户提示分解为子任务，并路由到最适合的模型执行：推理任务交给 Opus 4.7，视频生成用 Seedance，图像生成用 GPT Image。这种系统还包含三层记忆，使得上下文能在会话间累积，而不是每次重置。该模式有望取代单一模型工具，通过组合多个专长模型实现更高效、更精准的任务处理。

AI产品多模型架构路由系统 Opus 4.7 Seedance GPT Image

推荐理由：这个多模型路由架构解决了单一模型能力不足的问题，做 AI 应用开发的团队可以直接参考这种设计，让不同模型各展所长，值得关注。