21:43Decoder@Jonathan Kemper精选72°字节跳动Seed团队研究发现,通过提问方式训练7B参数的多模态大模型(LMM),在处理长文档(尤其是图像密集型文档)时,其可靠性甚至超过更大规模的模型。该模型能处理比训练时见过的文档长四倍的内容,且无需逐页转录文本,而是通过自主寻找相关段落来回答问题。这一方法显著提升了长文档问答的效率与准确性,为多模态模型在复杂文档理解任务中的应用提供了新思路。论文字节跳动多模态模型长文档理解训练方法问答推荐理由:做文档理解或长文本AI应用的团队值得关注——字节跳动用提问替代转录,让7B模型在长文档任务上超越大模型,直接降低了计算成本,建议点开看看具体方法。原文
16:08pandaily@contact@pandaily.com (Pandaily)76°字节跳动开源了Lance,一个仅3B激活参数的原生统一多模态AI模型。Lance能在一个系统中同时处理图像理解、图像生成和视频任务,无需多个模型拼接。该模型采用原生多模态架构,而非传统的视觉编码器+语言模型组合,实现了更高效的跨模态交互。Lance的开源发布为多模态AI研究提供了轻量级基线,尤其适合资源受限场景下的部署。AI模型多模态模型开源/仓库字节跳动Lance轻量级模型推荐理由:Lance用3B参数实现了图像理解+生成+视频的统一处理,做多模态应用或边缘部署的团队可以直接拿来用,省去多模型集成的麻烦。原文
13:58IT之家(博客/媒体)精选83°字节跳动开源了名为Lance的多模态AI模型,激活参数量仅3B,却能原生统一处理图像理解、视频理解、图像生成、视频生成和跨模态编辑等任务。与常见将理解与生成拆分为多个模块的方案不同,Lance从训练起就采用共享上下文与能力解耦的双流专家架构,兼顾高层语义特征与低层连续表示。在多项基准测试中,Lance在图像生成、视频生成、图像编辑和视频理解上均取得领先成绩,例如GenEval总分0.90、VBench总分85.11。模型采用Apache 2.0许可开源,权重已在Hugging Face提供,推理需至少40GB显存。AI模型多模态模型开源/仓库字节跳动Lance统一模型推荐理由:Lance用3B参数实现了多模态理解与生成的统一,解决了传统方案模块拼接效率低、能力割裂的问题。做多模态AI研究或应用开发的团队可以直接下载权重试试,尤其适合资源有限但想探索统一模型的场景。原文
08:05IT之家(博客/媒体)字节跳动再度加码实体医疗赛道,计划在上海开设“小荷门诊部”。此前字节已在北京开设首家小荷门诊,后并入美中宜和。上海小荷门诊有限公司已于今年2月完成注册,由字节小荷健康业务核心负责人吴海锋出任法人与经理。字节在医疗健康领域布局已久,从2020年确立“小荷”品牌,到收购松果门诊、美中宜和,再到今年上线AI医疗助手App,持续深化线上线下医疗生态。此举显示字节在实体医疗领域的投入决心,可能进一步整合AI与线下诊疗资源。行业字节跳动小荷门诊实体医疗AI医疗医疗健康推荐理由:字节跳动从线上AI医疗助手到线下门诊的闭环布局值得关注,做医疗健康领域投资或创业的人可以看看字节的实体医疗打法。原文
15:19IT之家(博客/媒体)字节火山引擎正式发布一站式 AIGC 短剧创作平台火山剧创 1.0,深度适配 Seedance、Seedream 等模型,实现导演级控片能力。该平台基于多智能体架构,提供从剧本解析、资产设定、分镜生成到成片预览的端到端解决方案,制作周期缩短 80% 以上。平台支持提示词编辑、多模态参考、IP 资产库和团队协作,每个核心节点向用户开放编辑权限,确保创作者对作品的绝对控制。火山方舟提供充足算力支撑,旨在降低短剧创作门槛并提升效率。AI产品火山剧创AIGC短剧创作多智能体字节跳动推荐理由:短剧创作者和团队终于有了专业的一站式 AIGC 工具——火山剧创 1.0 把制作周期砍掉 80% 以上,还保留了导演级控片权限,做短剧的建议直接上手试试。原文
18:33IT之家(博客/媒体)76°字节跳动旗下火山引擎的 AI 视频生成模型 Seedance 2.0 在戛纳电影节亮相,展示了其与多家国际企业的合作进展。由该模型生成的全球首部 95 分钟 AI 长片《HELLGRIND》将在电影节首映,该片由 15 人团队在 14 天内完成,成本不到 50 万美元,仅为传统影片的 1%。此外,知名导演吕克·贝松联合创立的 SEEN 工作室宣布将基于 Seedance 2.0 打造首部 AI 动画电影《THE FURIOUS FIVE》,并由他亲自执导。这标志着 AI 在影视制作领域的重大突破,大幅降低了制作成本和时间。AI产品AI 视频生成Seedance 2.0字节跳动AI 电影戛纳电影节推荐理由:AI 长片从概念走向现实,字节跳动 Seedance 2.0 让 15 人团队 14 天拍出 95 分钟电影,成本仅为传统 1%。影视创作者和 AI 从业者值得关注——这可能是电影工业变革的开端。原文
11:53pandaily@contact@pandaily.com (Pandaily)72°字节跳动(TikTok母公司)即将推出其AI视频生成模型Seedance 2.1版本,据称质量提升20%。该模型在视频生成领域进一步优化,旨在提升生成视频的逼真度和流畅性。此次更新可能加强字节跳动在AI视频生成赛道的竞争力,与OpenAI的Sora等产品展开竞争。Seedance 2.1的发布预计将吸引内容创作者和视频制作团队的关注。AI模型视频生成Seedance字节跳动AI模型内容创作9 个信源在谈推荐理由:视频生成质量提升20%意味着更逼真的AI视频,做短视频或内容创作的团队可以直接关注,看看能否替代现有工具。原文
09:32IT之家(博客/媒体)72°字节跳动即将发布Seedance 2.1模型,相比2.0版本生成质量提升20%,主要改进在时间一致性和物理模拟。该模型已占据AI视频生成市场超80%的算力消耗份额,远超可灵和万相。字节计划将Seedance 2.1整合到剪映等创作工具中。谷歌也在I/O大会上发布了Gemini Omni模型,加入视频生成竞争。AI产品字节跳动SeedanceAI视频生成剪映Gemini Omni推荐理由:AI视频生成赛道格局已定,Seedance以绝对算力优势领先,做视频创作或内容工具的团队值得关注其2.1版本的实际表现。原文