论文精选

自动化SKILL.md生成:论文提出三阶段流水线从GUI轨迹提取技能

// Automating SKILL.md Generation // Increasingly, mining sessions is one of the best ways to impro...

精选理由

这篇论文用OpenAI Codex的思路做智能体技能提取,八个聚类五个纯度超0.95,但GRPO只提了2个点,分析很实在。

AI 摘要

论文提出三阶段流水线,从GUI轨迹中分段、聚类候选技能并训练技能感知策略。八个聚类中五个纯度≥0.95。但GRPO仅将技能步准确率从18.5%提升至20.5%,低于频率先验。作者指出弱边界检测器、无序段表示和离线奖励模型是三大原因。

AI 翻译 · 中文

论文提出三阶段流水线,从GUI轨迹中分段、聚类候选技能并训练技能感知策略。八个聚类中五个纯度≥0.95。但GRPO仅将技能步准确率从18.5%提升至20.5%,低于频率先验。作者指出弱边界检测器、无序段表示和离线奖励模型是三大原因。

elvis// Automating SKILL.md Generation // Increasingly, mining sessions is one of the best ways to improve your agents. OpenAI released something similar yesterday that lets Codex package skills from interactions. (bookmark i