13:01LangChain@LangChainAI精选SierraPlatform的ZackRW在Max Agency播客中分享了一个关键洞察:在真实对话中,决定何时说话所需的脑力与决定说什么相当。传统语音代理并未以此方式构建。Sierra的突破是并行处理思考、倾听和说话,模拟人类对话的自然方式。这一理念来自Sierra的语音代理产品设计。行业LangChainSierraPlatform语音代理智能体推荐理由:Sierra的语音代理模仿人类并行处理对话,不是简单轮流说话,值得做语音产品的朋友看看。原文
04:55Y Combinator@ycombinatorCoval 为企业提供模拟和可观测性平台,用于测试、监控和评估 AI 语音代理,每月处理数千万通电话。客户包括 Perplexity 和 Deepgram。公司刚完成 2820 万美元 A 轮融资。CEO Brooke Hopkins 此前在 Waymo 领导评估基础设施,发现经验可迁移至语音代理。她将广泛评估想法聚焦为企业平台,曾有客户在未写代码前就愿付费。行业CovalPerplexityDeepgram语音代理A轮融资1 个信源在谈推荐理由:Coval 刚拿了 2820 万美元,帮企业测语音代理,客户有 Perplexity 和 Deepgram,创始人从 Waymo 的经验移植过来,值得一看。原文
01:09AWS Machine Learning Blog@Bojan JakimovskiLoka 利用 Amazon Nova 2 Sonic 模型打造了自然且低延迟的语音代理,解决了传统机器人式助手导致客户挂断的问题。该架构将响应延迟优化至接近人类对话水平,显著降低用户等待时长。Loka 的方案减少了客服流失率并提升了品牌口碑。技巧LokaAmazon Nova 2 Sonic语音代理低延迟推荐理由:Loka 用 Amazon Nova 2 Sonic 做出了几乎没延迟的语音代理,客户不挂电话,客服成本也降了。原文
18:38Together AI@togethercomputeDecagonAI 通过与 Together AI 合作,将语音代理每轮对话成本降低近6倍,同时保持实时语音所需的低延迟。他们从闭源模型迁移到微调的开源模型,实现 p95 模型延迟低于400ms。采用自定义投机解码和提示缓存技术,并在 NVIDIA Blackwell 上优化服务部署。模型更新频率达到每周甚至每日,体现了从封闭 API 到开放模型的转变。行业DecagonAITogether AINVIDIA Blackwell语音代理开源模型6 个信源在谈推荐理由:DecagonAI 把语音成本砍到原来的1/6,延迟还压到400ms以下,实时语音项目可以参考他们迁移开源模型的做法。原文
03:23xAI@xai76°xAI 发布了 Grok Voice,声称在语音交互中实现了人性化的时机、语气和温暖感,性能达到业界顶尖水平,但价格远低于竞争对手。同时,ServiceNow AI Research 的 EVA-Bench 评估显示,Grok Voice Think Fast 1.0 在准确率和用户体验的帕累托前沿上表现最优,没有其他系统能在不牺牲体验的情况下超越其准确性,反之亦然。这意味着 Grok Voice 在语音代理领域树立了新的性价比标杆,尤其适合需要高质量语音交互但预算有限的开发者和企业。AI产品语音代理Grok VoicexAIEVA-Bench性价比1 个信源在谈推荐理由:Grok Voice 以极低价格提供了顶尖的语音交互体验,做语音代理或客服系统的团队可以直接用,性价比远超竞品,值得立即尝试。原文
04:32Hugging Face: Blog(博客/媒体)ServiceNow AI 发布了一项针对前沿自动语音识别(ASR)模型在代码切换语音上的基准测试。代码切换指说话者在同一句话中混合使用两种语言,这在多语言用户中很常见。测试发现,当前最先进的ASR模型在处理这种混合语言时表现不佳,错误率显著高于单语言场景。该研究强调了构建能理解双语用户的语音代理的挑战,并提供了公开基准供开发者评估和改进模型。这对于开发面向多语言市场的语音助手和客服系统至关重要。论文语音代理ASR代码切换多语言基准测试1 个信源在谈推荐理由:做语音助手或客服系统的团队会发现,当前ASR模型在双语用户面前漏洞百出——代码切换场景的错误率远高于单语言,这个基准测试直接暴露了痛点,建议点开看看你的模型能否过关。原文
22:23ElevenLabs@elevenlabsio波兰旗舰航空公司 LOT 与 ElevenLabs 达成合作,将 AI 语音代理引入其客户服务流程。该技术旨在提升客服效率,减少用户等待时间,并支持多语言交互。LOT 拥有百年历史,此次合作标志着传统航空业在客户体验上的 AI 转型。ElevenLabs 的语音代理以其自然度和低延迟著称,有望为旅客提供更流畅的咨询与预订服务。AI产品语音代理客服自动化ElevenLabs航空业AI 落地推荐理由:传统航空客服的痛点——等待长、语言障碍——终于有了 AI 解法,做客服系统或航空业数字化的团队值得关注,可以直接参考这个落地案例。原文
10:41ElevenLabs@elevenlabsioElevenLabs 在华沙峰会上预览了其最新、最具表现力的 AI 语音模型,并现场演示了语音代理在客户体验中的应用。该模型旨在实现自然、类人交流,被视为解锁 AI 商业价值的关键。演示展示了语音代理如何更流畅地处理客户对话,提升交互真实感。这标志着 AI 语音技术向更自然、更实用方向迈出重要一步。AI产品ElevenLabs语音模型语音代理客户体验AI 峰会推荐理由:做客服系统或语音交互产品的团队,可以直接关注 ElevenLabs 这次演示——更自然的语音代理意味着更低的用户抵触和更高的转化率,值得点开看 demo 效果。原文
09:33Notion@NotionHQSnoopy AI 在 Notion 举办的比赛中获得第二名,它是一个面向小企业的语音代理平台。该平台以 Notion 数据库作为后端,结合自定义代理和工人来保持上下文连贯并链式调用工具。其演示案例是干洗店处理订单变更,并将特殊请求回拨给店主。这展示了 Notion 作为轻量级后端在 AI 语音代理中的实际应用潜力。AI产品语音代理Notion小企业后端工具链2 个信源在谈推荐理由:小企业主和 Notion 重度用户值得关注——Snoopy AI 把 Notion 变成了可落地的语音客服后端,干洗店这类场景可以直接抄作业。原文
09:32Notion@NotionHQ在Notion举办的AI竞赛中,@temnco 的 Cerebro 获得第三名。Cerebro 是一个AI大脑,能整合Slack、邮件和每日简报信息,通过一组Notion Workers将碎片化信息转化为长期记忆,帮助用户更高效地工作。项目还展示了语音代理demo,体现了AI在信息管理和记忆增强方面的应用潜力。AI产品AI大脑信息管理长期记忆Notion Workers语音代理3 个信源在谈推荐理由:对于每天被Slack、邮件轰炸的团队和个人,Cerebro 提供了一种将信息转化为长期记忆的自动化方案,值得关注Notion生态的开发者尝试。原文
12:33Together AI@togethercomputeTogether AI 宣布在其平台上新增 600 多种声音,并集成了 MiniMax Speech 2.8 Turbo 企业级 TTS 模型。该模型专为实时、富有表现力的语音代理设计,支持 AI 原生开发者在其专用基础设施上部署。用户可以直接在语音查找器中试听这些声音。这一更新显著扩展了 Together AI 的语音能力,为构建语音交互应用提供了更多选择。AI产品TTS语音代理MiniMaxTogether AI企业级模型推荐理由:做语音代理或实时对话应用的开发者,现在有 600+ 声音可选,且能直接在企业级基础设施上部署 MiniMax 模型,值得试试语音查找器里的新声音。原文
07:06Together AI@togethercomputeTogether AI 宣布在其平台上推出 Rime Mist v3,这是一系列面向生产环境的文本转语音(TTS)模型。该模型专注于确定性发音和可控语音输出,解决了语音合成中常见的不一致问题。AI 原生开发者现在可以在 Together AI 的专用基础设施上部署 Mist v3,用于需要大规模一致语音输出的企业级语音代理。这为构建可靠、可定制的语音交互系统提供了新的选择。AI产品文本转语音TTS语音代理Together AIRime Mist v3推荐理由:做语音代理和 TTS 应用的团队终于有了一个能保证发音一致性的生产级模型,直接在 Together AI 上就能部署,省去自己调教的麻烦,值得试试。原文