12:44John Schulman@johnschulman2精选Thinky 团队分享了全双工多模态模型的研究成果,该模型支持实时、自然的交互,同时不牺牲智能水平。创始人 John Schulman 指出,人机协作能力在 AI 领域常被低估,因为其评估难度高于智能或自主性。他们认为未来每个 AI 系统都将以交互模型作为面向用户的外层,持续了解用户意图并保持信息同步。这项技术有望推动 AI 从单向输出转向双向对话式协作。AI模型全双工多模态模型实时交互人机协作Thinky推荐理由:全双工交互解决了 AI 对话中“你说我听”的延迟感,做实时语音/视频助手或协作工具的团队可以直接参考——Thinky 把自然交互和智能水平平衡好了。原文
12:30Mira Murati (TML)@miramurati精选OpenAI 宣布正在开发一种全新的交互模型,该模型从零开始训练,原生支持实时交互,而非像传统模型那样将实时功能附加到回合制模型上。这意味着模型可以更自然地处理对话中的打断、停顿和同时发言,提升交互流畅度。这一方向可能改变语音助手、客服机器人等实时对话场景的体验。目前该工作仍处于研究阶段,具体发布时间未定。AI模型实时交互OpenAI语音助手对话模型交互模型8 个信源在谈推荐理由:做语音交互或实时对话产品的团队值得关注——原生实时模型能解决当前 AI 对话中“等说完才能回应”的痛点,直接提升用户体验。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……
08:05LangChain@LangChainAI精选LangChain 发布新的流式协议,旨在解决 Agent 流式输出中工具、状态、子代理、媒体、中断和重连等复杂场景的解析难题。传统流式方案依赖原始事件流,开发者需手动解析大量日志,效率低下。新协议将 Agent 运行转化为类型化投影,应用可直接订阅,大幅降低开发复杂度。该协议特别适合需要实时渲染多模态 Agent 输出的应用场景。AI产品LangChain流式协议Agent开发者工具实时交互推荐理由:Agent 流式输出一直是个痛点,LangChain 的新协议让开发者不再需要手动解析原始事件流,做 Agent 应用或实时交互界面的团队可以直接用,省去大量底层工作。原文