近期关于 Prompt 的讨论聚焦于从“如何写”到“如何系统化”的演进。一方面,研究者发现高频、简单的语言比“拽高级词汇”更有效,因为低频 token 在预训练中可能“退化”,导致模型输出不准确(别给AI拽高级词汇!FaceMind实验证明高频表达更有效)。同时,大模型“叫不出人名”也归因于低频 token 退化,FaceMind 提出 SLoW 方法缓解此问题(大模型“叫不出人名”背后:低频token退化与FaceMind的SLoW方法)。
在应用层面,Prompt 不再只是单轮指令,而是被整合进 Agent、RAG 和视频生成等场景。例如,Lyft 用 LangChain 让非技术团队也能通过编写 Prompt 来部署 Agent(Lyft 用 LangChain 让非技术团队也能写 Prompt 和部署 Agent);Codex 团队则利用 Prompt 让模型回顾历史,自动沉淀 Skills 和 Subagent(Codex 团队分享:用 Prompt 让 AI 回顾历史,自动沉淀 Skills 和 Subagent)。在视频领域,有方法用 5 个 Prompt 控制 Gemini Omni 的分镜(把 Gemini Omni 当视频导演:5 个 Prompt 方法控制分镜),而 Kling AI 展示了 20 部原生 4K AI 短片(Kling AI 在 AI on the Lot 社区日展示 20 部原生 4K AI 短片)。
当前焦点在于:Prompt 设计正从“艺术”转向“工程”,强调简洁性和系统性。未来需观察 Prompt 如何与 Agent 框架、多模态模型深度融合,以及 Token 退化问题是否推动模型预训练策略的改变。