08:05HeyGen@HeyGen_OfficialHeyGen 的 Hyperframes 多模态 AI 产品将于 6 月 24 日(周三)在东京涩谷举办首次线下活动。活动内容包括 HyperFrames 的现场演示、Q&A 环节,以及与多模态 AI 前沿开发者的交流。现场提供 AI 翻译服务,参会者无需担心语言障碍。AI产品HyperframesHeyGen东京多模态AIAI翻译推荐理由:HeyGen 把 Hyperframes 带到东京了,6月24日涩谷能现场体验、跟开发者聊天,还有 AI 翻译,别错过。原文
12:07AI Will@FinanceYF5Google 展示了其 Gemini Omni 模型的新能力,允许用户通过自然语言指令改变视频中的摄像机角度、调整视角或修改光照效果,同时保持物理规律和角色一致性。演示中,用户输入“把场景改成沙漠(其他不变)”,视频即被重新渲染。这一技术突破了传统视频编辑的局限,为内容创作者提供了前所未有的灵活性和控制力。它标志着多模态 AI 在视频理解和生成方面的重要进展,有望简化影视制作、广告和社交媒体内容创作流程。AI产品Gemini Omni视频编辑多模态AI内容创作Google推荐理由:视频创作者和后期团队终于可以像改文字一样改视频了——Gemini Omni 让你一句话调整视角和光照,还保持物理和角色一致,做内容生产的建议点开看看怎么用。原文
08:00Qdrant@qdrant_engineQdrant 宣布将于6月11日在旧金山 The Midway 举办 Vector Space Day 技术大会。会议邀请了来自 AWS、Google DeepMind、Adobe、Qualcomm 等公司的技术专家,围绕向量搜索、AI 记忆、上下文工程和检索基础设施等主题进行演讲。大会将深入探讨生产环境中的智能体与记忆、从云到边缘的检索以及多模态 AI。早鸟票正在发售,即将截止,适合 AI 构建者和开发者参加。行业向量搜索AI记忆智能体检索基础设施多模态AI推荐理由:向量搜索和 AI 记忆是构建生产级智能体的关键基础设施,做 RAG 或智能体应用的团队值得关注这场大会,早鸟票快截止了,建议尽早决定。原文
15:19腾讯混元 Tencent Hunyuan@TencentCloud腾讯云宣布与Stream合作,其TencentRTC成为VisionAgents的官方传输插件。该插件拥有3200多个全球节点,延迟低于300毫秒,并在中国及亚洲地区提供可靠性能。这一合作旨在简化多模态AI应用的全球构建与扩展。开发者可以更轻松地构建和扩展实时多模态AI应用。AI产品多模态AI实时传输腾讯云StreamVisionAgents推荐理由:实时多模态AI智能体开发者终于有了低延迟、全球覆盖的传输方案,腾讯云与Stream的合作直接解决了跨区域部署的痛点,做AI应用的团队值得关注。原文