AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:提示词优化×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
06:12
06:12marktechpost@Sana Hassan
本文详细介绍了微软SkillOpt的编码实现,包括仓库搭建、OpenAI兼容模型接入、优化器与目标模型配置。通过完整的优化循环(回滚、反思、聚合、选择、更新、验证门控),评估了原始种子技能作为基线,并运行了真实优化。最后通过训练历史、准确率、编辑预算行为和Token使用可视化,对比了进化后的技能与基线性能。
AI产品微软SkillOpt提示词优化技能进化基线对比

推荐理由:做提示词工程和自动化优化的开发者可以直接参考这套端到端实现,SkillOpt的验证门控机制能有效提升技能进化质量,值得动手试一下。
原文
6月4日
23:52
23:52LangChain@LangChainAI
LangChain 推出 LangSmith Engine,允许开发者审查 Agent 的追踪记录,从而发现提示词和代码中的 Bug 及改进点。Agent 能在运行间隔中回顾对话、从实际使用中学习,并自动更新 Context Hub 文件。这有助于提升 Agent 的可靠性和性能,减少人工调试工作量。
AI产品LangSmith EngineAgent 追踪调试工具提示词优化LangChain

推荐理由:做 Agent 开发的团队终于有了自动化的调试工具——LangSmith Engine 能直接从追踪中学习并优化提示词和代码,建议正在维护复杂 Agent 的开发者试试。
原文
6月3日
01:16
01:16Philipp Schmid@_philschmid
开发者Phil Schmid分享了一种使用GEPA自动优化任何CLI Agent提示词的方法。GEPA接受任何`(str) -> str`的可调用对象,兼容自定义CLI、本地模型或API Agent。只需将Agent封装在Python函数中,即可让其自我优化提示词。该方法可显著提升Agent的响应质量和效率,减少手动调优的工作量。
AI产品GEPA提示词优化CLI Agent自动化开源/仓库

推荐理由:做Agent开发的团队终于有了自动化提示词优化的工具——GEPA支持任何CLI Agent,封装成函数就能自优化,省去反复手动调参的麻烦,建议试试。
原文
5月21日
08:01
08:01LangChain@LangChainAI
LangChain 的 Palash Shah 分享了一种针对长时运行 AI Agent 的评估方法。核心思路是将复杂的评估任务拆解成更小、更易处理的子任务,这样不仅便于人类理解,也更容易让 LLM 自身进行评估。他举例说明,对于运行超过 30 分钟的 Agent,通过从追踪中提取推理过程,找出特定行为的根本原因,然后重建简化版的评估场景。这种方法可以快速测试提示词调整的效果,而无需每次都运行完整的长时间评估。
AI产品LangChainAI Agent评估方法提示词优化长时任务

推荐理由:做长时 AI Agent 评估的开发者终于有了实用技巧——拆解任务后评估效率大幅提升,建议直接参考这个流程优化你的评估策略。
原文
5月20日
10:51
10:51arXiv: DeepSeek@Ali Mohammadi Esfahani, Nafiseh Kahani, Samuel A. Ajila
精选
研究人员提出一个基于强化学习的框架,将提示词优化建模为序列决策问题。PPO代理通过混合动作空间(直接生成、遗传变异、语义重写)迭代改进提示词,并利用单元测试反馈的奖励信号驱动优化。在MBPP+、HumanEval+和APPS基准上,使用CodeT5+、CodeLLaMA和DeepSeek-Coder作为冻结代码生成器,PPO代理在MBPP+的500任务测试集上分别达到57.58%、64.80%和85.50%的严格Pass@1,优于EPiC、Reflexion和随机混合方法。软Pass@1分别达到67.90%、73.10%和88.20%。结果表明,带形状奖励的强化学习能显著提升LLM代码生成的功能正确性。
论文提示词优化强化学习代码生成PPOLLM

推荐理由:做LLM代码生成或提示词工程的开发者,这个框架直接解决了提示词敏感性问题——用RL自动优化提示词,比手动调参高效得多,建议关注其混合动作空间和奖励设计。
原文
5月19日
10:00
10:00arXiv cs.AI@Zheqin Yin, Yupei Ren, Yadong Zhang, Yujiang Lu, Man Lan
精选
现有研究在通过提示词准确理解和评估议论文方面存在不足。本文提出TIDE框架,通过引入“试验与辩论”机制,优化基于标准的提示词优化过程,减少噪声训练数据的影响并提升优化稳定性。在自动作文评分、论证成分检测和论证关系识别三个核心任务上,TIDE均提升了性能。该工作展示了结合提示词方法与辩论机制在高级论证理解中的潜力。
论文议论文理解提示词优化辩论机制自动作文评分TIDE

推荐理由:做教育AI或文本评估的团队,TIDE用辩论机制解决了提示词优化中的噪声和稳定性问题,值得在议论文分析场景中尝试。
原文
5月11日
22:17
22:17歸藏(guizang.ai)@op7418
抖音上流行的“法天象地”效果(将户外照片转化为奇幻场景)最近非常火爆。用户@op7418 发现,直接生成视频比图片效果更佳。他通过优化提示词,使用 GPT-Image-2.0 和 C-Down 3.0 模型组合,实现了高质量的视频生成。提示词已附在视频后。这一方法展示了多模型协作在创意视频生成中的潜力。
AI产品视频生成GPT-Image-2.0C-Down 3.0提示词优化

推荐理由:该案例提供了生成式AI在短视频特效中的应用思路,适合内容创作者和AI视频工具爱好者参考,展示了模型组合的实用价值。
原文
精选全部日报登录