11:54World Labs (李飞飞)@theworldlabsMagnific 推出3D Scenes功能,基于Marble技术将单张图片转化为可控3D环境。设计师无需依赖提示词,可直接通过镜头、光照、构图和空间等传统视觉语言进行创作。该功能为创意团队提供了对广告视觉的一致性和控制力,降低了3D场景制作的门槛。案例研究展示了其在品牌营销中的实际应用。AI产品3D场景创意工具设计师Magnific可控生成推荐理由:设计师终于不用写提示词了——Magnific 3D Scenes让创意团队用熟悉的镜头语言控制3D场景,做广告视觉或品牌内容的可以直接上手试试。原文
17:17IT之家(博客/媒体)76°小米大模型应用团队开源了 ControlFoley,一个统一的可控视频音效生成框架,解决了视频配音中“按意图控制声音”的难题。该模型支持三类任务:文本引导视频配音、文本控制视频配音(当文本与画面冲突时优先遵循文本)、以及参考音频控制视频配音(保持音色风格同时同步动作)。ControlFoley 采用时空音视频编码器 CAV-MAE-ST 增强音画同步理解,并通过时间-音色解耦策略避免参考音频干扰节奏。在多个基准测试上,ControlFoley 达到开源 SOTA,甚至在某些指标上超越商业闭源系统 Kling-Foley。代码、模型权重、在线 Demo 均已开放。AI模型小米ControlFoley视频音效生成可控生成开源模型推荐理由:做视频创作或音效生成的开发者终于有了可控的配音工具——ControlFoley 让声音按文本或参考音频来,而不是被画面牵着走。建议直接试在线 Demo,看看它如何解决“画面是A但想要B声音”的痛点。原文
01:38Justine Moore@venturetwinsBlack Forest Labs 推出 FLUX Erase 功能,允许用户通过简单的擦除遮罩精确移除图像中的物体或文字,仅重新生成被遮罩区域,其余部分保持不变。该功能在模型层面将擦除和重建作为统一任务训练,能自动处理阴影等细节,保持图像一致性和自然感。目前可通过 BFL 官网 demo 和 API 使用,为图像编辑提供了更精准、可控的工具。AI产品图像编辑FLUXBlack Forest Labs擦除工具可控生成推荐理由:做图像编辑或内容创作的团队终于有了一个不破坏背景的擦除工具——FLUX Erase 能精准移除物体并自动补全阴影,设计师和开发者可以直接在 demo 或 API 里试试。原文