全部 AI 动态 · AI 热点

6月17日

23:23

23:23IT之家（博客/媒体）

阿里云6月17日发布HappyOyster 1.0（快乐生蚝1.0），支持一句话生成可实时交互的数字世界。该产品基于原生多模态架构，能推演物理因果链并保持人物与环境长程一致性。不同于传统“写prompt等渲染”的流程，用户可实时输入指令，画面即时响应。目前官网开放“实时导演”和“世界探索”两种玩法，支持虚拟男友互动、短剧剧情改写、开放世界移动等功能。2025年4月16日起开放内测，至7月17日官网可领取体验积分。

AI产品 HappyOyster 阿里云快乐生蚝世界模型实时交互

推荐理由：阿里云搞了个好玩的：一句话就能生成能边玩边改的动态世界，像游戏一样探索，还能和虚拟男友实时互动，快去体验。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月6日

19:15

19:15

Decoder@Jonathan Kemper

78°

一款名为 Audio Interaction 的新型开源语音模型发布，它能够持续监听音频流，并每 0.4 秒决定是否说话或保持沉默，无需等待录音结束。该模型支持翻译、转录、聊天以及识别日常噪音（如咳嗽），实现了真正的实时交互。与 GPT-4o 或 Qwen3.5-Omni 不同，它在一个流中处理所有任务。代码、模型权重和下载说明已在 GitHub 上以 Apache 2.0 开源许可证发布，训练数据也将随后提供。

AI模型开源/仓库语音模型实时交互 Audio Interaction Apache 2.0

推荐理由：这款模型解决了实时语音交互中“等待录音结束”的痛点，做语音助手或实时翻译的开发者可以直接在 GitHub 上试玩，体验每 0.4 秒的决策能力。