10:34arXiv cs.AI@Prannay Hebbar, Yogendra Manawat, Samuel Verboomen, Alesia Ivanova, Selvam Palanimalai, Kunal Bhatia, Vignesh Baskaran精选72°SIA提出了一种自改进循环,让一个语言模型智能体(反馈智能体)同时更新任务特定智能体的框架(工具、提示、重试逻辑等)和模型权重。传统方法中,框架更新和权重更新是分开研究的,而SIA将两者结合。在三个不同领域(中国法律罪名分类、GPU内核优化、单细胞RNA去噪)的测试中,SIA相比仅迭代框架分别提升了56.6%、91.9%和502%。框架更新让模型更智能地搜索和行动,权重更新则构建了提示或框架无法灌输的领域直觉。论文自改进AI框架更新权重更新智能体论文推荐理由:SIA解决了AI自改进中框架与权重更新割裂的问题,做AI智能体或自监督学习的开发者可以直接参考其方法,在复杂任务上看到显著提升。原文