TAHOE 解决了 Text-to-SQL 从原型到生产部署的痛点——无需微调模型即可大幅提升 SQL 生成准确率,做数据库应用或数据分析的开发者可以直接用这套方法优化现有 LLM 管线。
TAHOE 是一个新型 Text-to-SQL 系统,通过将提示优化视为动态数据管理问题来提升 LLM 的 SQL 生成质量。它利用错误驱动的提示学习管道,在开发和部署阶段将调试痕迹整合到结构化的提示库中,包括语法提示和语义提示。TAHOE 还引入策略层来建模冲突的用户意图,并通过逻辑规划和 SQL 合成指导推理。在 Spider 2.0-Snow 基准测试中,TAHOE 将 GPT-5.5 的通过率从 61.95% 提升至 79.42%,并实现了 100% 的 Snowflake 语法通过率。该提示库还可迁移到更弱的模型,如 Doubao-2.0-lite 上获得 19.7 个百分点的通过率提升。
TAHOE 是一个新型 Text-to-SQL 系统,通过将提示优化视为动态数据管理问题来提升 LLM 的 SQL 生成质量。它利用错误驱动的提示学习管道,在开发和部署阶段将调试痕迹整合到结构化的提示库中,包括语法提示和语义提示。TAHOE 还引入策略层来建模冲突的用户意图,并通过逻辑规划和 SQL 合成指导推理。在 Spider 2.0-Snow 基准测试中,TAHOE 将 GPT-5.5 的通过率从 61.95% 提升至 79.42%,并实现了 100% 的 Snowflake 语法通过率。该提示库还可迁移到更弱的模型,如 Doubao-2.0-lite 上获得 19.7 个百分点的通过率提升。
Large Language Models (LLMs) have democratized database access through Text-to-SQL, but moving from prototypes to production remains difficult. Real deployments must handle strict SQL dialects, massive schemas, and evolv…