TAHOE：通过经验自动优化提示的Text-to-SQL系统

精选理由

TAHOE 解决了 Text-to-SQL 从原型到生产部署的痛点——无需微调模型即可大幅提升 SQL 生成准确率，做数据库应用或数据分析的开发者可以直接用这套方法优化现有 LLM 管线。

AI 摘要

TAHOE 是一个新型 Text-to-SQL 系统，通过将提示优化视为动态数据管理问题来提升 LLM 的 SQL 生成质量。它利用错误驱动的提示学习管道，在开发和部署阶段将调试痕迹整合到结构化的提示库中，包括语法提示和语义提示。TAHOE 还引入策略层来建模冲突的用户意图，并通过逻辑规划和 SQL 合成指导推理。在 Spider 2.0-Snow 基准测试中，TAHOE 将 GPT-5.5 的通过率从 61.95% 提升至 79.42%，并实现了 100% 的 Snowflake 语法通过率。该提示库还可迁移到更弱的模型，如 Doubao-2.0-lite 上获得 19.7 个百分点的通过率提升。

AI 翻译 · 中文

arXiv cs.AILarge Language Models (LLMs) have democratized database access through Text-to-SQL, but moving from prototypes to production remains difficult. Real deployments must handle strict SQL dialects, massive schemas, and evolv…

阅读原文