全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

17:01

17:01IT之家（博客/媒体）

商汤科技开源了 SenseNova U1 系列新成员 U1-8B-MoT-Interleaved 模型，专为图文交错创作场景优化。该模型解决了多轮生成中角色形象飘移、画风断裂、图文脱节等痛点，支持绘本、故事书、多页 PPT 等连续内容创作。核心升级包括叙事连贯性与角色一致性提升、图文语义对齐增强、视觉质量改善，以及新增多页 PPT 自动生成能力。模型已在 Hugging Face 开源，适合需要高质量图文内容生成的创作者和开发者。

AI模型商汤 SenseNova U1 图文交错生成开源/仓库多模态模型

推荐理由：做绘本、PPT 或教程的创作者终于不用反复修图了——这个模型能保持角色和画风从头到尾一致，直接生成多页内容，建议试试。

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月21日

00:14

00:14

rohanpaul_ai@rohanpaul_ai

76°

中国 AI 实验室商汤开源了 SenseNova U1，这是一个统一的多模态模型，能在单一模型中理解、推理并生成图像和文本。其架构去除了传统的视觉编码器和变分自编码器，在共享表示空间中处理图像和语言，减少了模块间切换和信息损失，提升了生成一致性。该模型在生成信息图、指南、海报、漫画等密集视觉内容时表现出色，据客户基准测试，生成信息图的速度约为 Qwen-Image-2.0 / Seedream-4.5 的两倍，且质量相当。

AI模型商汤 SenseNova U1 多模态模型开源/仓库图像生成

推荐理由：商汤的架构创新解决了多模态模型常见的模块间信息丢失问题，做视觉内容生成或信息图设计的团队可以直接用这个开源模型，生成效率翻倍值得一试。

5月20日

14:27

14:27

rohanpaul_ai@rohanpaul_ai

76°

中国AI实验室商汤科技在HuggingFace上发布了SenseNova U1模型，采用原生多模态建模和MoT架构（38B激活3B MoE）。该模型将多模态生成视为一个统一的建模问题，而非分离的视觉、语言和图像模块链，从而减少了模块间的信息损失，提升了生成内容的一致性。SenseNova U1特别擅长生成可读、结构化、一致的图文输出，如信息图、指南、海报、漫画等。它支持ComfyUI，推理速度快（A3B），为密集视觉内容创作提供了高效工具。

AI模型 SenseNova U1 多模态模型 MoT架构 MoE 开源/仓库

推荐理由：SenseNova U1解决了多模态生成中模块切换导致的信息丢失问题，做信息图、海报、漫画等密集视觉内容的创作者可以直接用ComfyUI体验，效果惊艳。