AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:实时交互×
6月17日
23:23
23:23IT之家(博客/媒体)
阿里云6月17日发布HappyOyster 1.0(快乐生蚝1.0),支持一句话生成可实时交互的数字世界。该产品基于原生多模态架构,能推演物理因果链并保持人物与环境长程一致性。不同于传统“写prompt等渲染”的流程,用户可实时输入指令,画面即时响应。目前官网开放“实时导演”和“世界探索”两种玩法,支持虚拟男友互动、短剧剧情改写、开放世界移动等功能。2025年4月16日起开放内测,至7月17日官网可领取体验积分。
AI产品HappyOyster阿里云快乐生蚝世界模型实时交互

推荐理由:阿里云搞了个好玩的:一句话就能生成能边玩边改的动态世界,像游戏一样探索,还能和虚拟男友实时互动,快去体验。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月6日
19:15
19:15Decoder@Jonathan Kemper
78°
一款名为 Audio Interaction 的新型开源语音模型发布,它能够持续监听音频流,并每 0.4 秒决定是否说话或保持沉默,无需等待录音结束。该模型支持翻译、转录、聊天以及识别日常噪音(如咳嗽),实现了真正的实时交互。与 GPT-4o 或 Qwen3.5-Omni 不同,它在一个流中处理所有任务。代码、模型权重和下载说明已在 GitHub 上以 Apache 2.0 开源许可证发布,训练数据也将随后提供。
AI模型开源/仓库语音模型实时交互Audio InteractionApache 2.0

推荐理由:这款模型解决了实时语音交互中“等待录音结束”的痛点,做语音助手或实时翻译的开发者可以直接在 GitHub 上试玩,体验每 0.4 秒的决策能力。
原文
精选全部日报登录