AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:交互模型×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
12:30
12:30Mira Murati (TML)@miramurati
精选
OpenAI 宣布正在开发一种全新的交互模型,该模型从零开始训练,原生支持实时交互,而非像传统模型那样将实时功能附加到回合制模型上。这意味着模型可以更自然地处理对话中的打断、停顿和同时发言,提升交互流畅度。这一方向可能改变语音助手、客服机器人等实时对话场景的体验。目前该工作仍处于研究阶段,具体发布时间未定。
AI模型实时交互OpenAI语音助手对话模型交互模型

推荐理由:做语音交互或实时对话产品的团队值得关注——原生实时模型能解决当前 AI 对话中“等说完才能回应”的痛点,直接提升用户体验。
原文
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月8日
14:48
14:48AI Will@FinanceYF5
76°
前 OpenAI CTO Mira Murati 在 Bloomberg Tech Live 上指出,当前 AI 模型是回合制交互——用户说完后模型才思考,思考期间对外界“又聋又盲”。她认为未来人机协作需要时间基交互,模型能持续接收音频、文本、视频并实时输出,捕捉打断、同时说话等细微信号,实现高带宽互动。这一观点挑战了现有对话式 AI 的设计范式,强调更自然、更丰富的人机协作体验。
AI产品人机协作实时交互Mira Murati对话式AI交互模型

推荐理由:Mira Murati 点出了当前 AI 交互的根本局限——思考时“失聪失明”,做对话产品、语音助手或实时协作工具的团队,看完会重新思考产品架构。
原文
6月6日
05:51
05:51a16z@a16z
72°
Mira Murati 在 Bloomberg Tech Live 上指出,当前 AI 模型基于回合制交互(你讲完它再想),思考时如同“又聋又瞎”,无法感知用户沉默、打断等细微信号。她提出下一代交互模型应是“基于时间”的连续流式交互,能同时处理音频、文本、视频并实时输出,从而捕捉打断和同时说话等丰富信息。这标志着人机协作从“轮流发言”向“高带宽对话”的范式转变,可能重塑 AI 助手、语音交互和协作工具的设计逻辑。
AI产品人机协作交互模型实时对话Mira Murati语音交互

推荐理由:Murati 点破了当前 AI 交互的硬伤——思考时无法感知用户,做语音助手或实时协作产品的团队值得关注这个方向,它直接决定了下一代交互体验的边界。
原文
5月12日
17:19
17:19歸藏(guizang.ai)@op7418
75°
前 OpenAI CTO Mira 创立的公司 Thinking Machines 发布了一款名为“交互模型”的创新 AI。该模型能原生处理音频、视频、文本等多种模态,并且实时思考、响应和行动。区别于传统的 Agent 架构将不同模型串联,它将所有模态统一在一个模型中,实现任意模态下的实时交互,用户可以随时打断、补充,AI 会持续关注用户状态并输出结果。模型由前台交互模型(每200毫秒处理输入并输出)和后台推理模型(处理复杂推理和长任务)两部分组成,最终提供实时交互和重度任务处理的能力。
AI模型多模态交互模型Thinking Machines实时

推荐理由:该模型打破了传统 AI 交互的固定对话模式,实现了真正的多模态实时交互,可能重新定义人机交互的标准。对于从事 AI 产品和交互设计的从业者而言,这是一个值得关注的技术方向。
原文
精选全部日报登录