11:09Simon Willison@simonw开发者Simon Willison因不满OpenAI迟迟未将gpt-realtime-2语音模型集成到ChatGPT,自行升级了OpenAI-WebRTC playground工具。新工具支持gpt-realtime-2实时语音对话,并允许用户粘贴文档进行讨论。该工具在GitHub上开源,已获得2次转发和3次点赞。AI产品gpt-realtime-2OpenAIWebRTC语音对话开源工具10 个信源在谈推荐理由:自己动手用gpt-realtime-2做语音对话原文
18:00Ethan Mollick@emollickOpenAI推出了gpt-realtime-2语音模型,该模型原生处理语音而非转录为文本,因此模型本身的智能水平至关重要。旧版语音模型相当于GPT-4o水平,而新版被形容为“更聪明”,但OpenAI未提供任何基准测试数据。此举意味着语音交互体验将显著提升,但缺乏具体指标也引发了对透明度的讨论。AI模型语音模型gpt-realtime-2OpenAI实时交互2 个信源在谈推荐理由:gpt-realtime-2的发布表明OpenAI在语音AI领域持续迭代,直接提升交互体验。但由于缺乏基准对比,开发者需自行评估其实际性能。原文