AI模型精选

Raven 3.5 专精客服,小模型击败 GPT-5 和 Claude Sonnet

Can a smaller model purpose-built for one domain b…

精选理由

客服团队和语音 AI 开发者可以亲眼看到:小模型专精化路线在延迟和效果上碾压通用大模型,PolyAI 的新工具让 10 分钟部署语音代理成为现实,值得立即关注。

AI 摘要

PolyAI 发布 Raven 3.5,一个专为客服场景设计的小型语音 AI 模型,在四个客服基准测试中全面超越 GPT-5 和 Claude Sonnet 4.6,且延迟低于 300 毫秒。该研究证明了领域专用模型在特定任务上可以大幅超越百倍规模的通用模型。同时,PolyAI 推出两款新产品:ADK(代码优先的智能体开发工具包)和 PolyPhone(10 分钟将网站转为语音 AI 代理),推动企业语音 AI 从呼叫中心项目走向快速部署的基础设施。

AI 翻译 · 中文

PolyAI 发布 Raven 3.5,一个专为客服场景设计的小型语音 AI 模型,在四个客服基准测试中全面超越 GPT-5 和 Claude Sonnet 4.6,且延迟低于 300 毫秒。该研究证明了领域专用模型在特定任务上可以大幅超越百倍规模的通用模型。同时,PolyAI 推出两款新产品:ADK(代码优先的智能体开发工具包)和 PolyPhone(10 分钟将网站转为语音 AI 代理),推动企业语音 AI 从呼叫中心项目走向快速部署的基础设施。

rohanpaul_aiCan a smaller model purpose-built for one domain beat a frontier general model that's 100× its size? A recent paper showed yes — and not by a small margin. Raven 3.5 from PolyAI shows that a smaller specialist model can