论文精选72°

SIA:同时更新框架与权重的自改进AI

SIA: Self Improving AI with Harness & Weight Updates

精选理由

SIA解决了AI自改进中框架与权重更新割裂的问题,做AI智能体或自监督学习的开发者可以直接参考其方法,在复杂任务上看到显著提升。

AI 摘要

SIA提出了一种自改进循环,让一个语言模型智能体(反馈智能体)同时更新任务特定智能体的框架(工具、提示、重试逻辑等)和模型权重。传统方法中,框架更新和权重更新是分开研究的,而SIA将两者结合。在三个不同领域(中国法律罪名分类、GPU内核优化、单细胞RNA去噪)的测试中,SIA相比仅迭代框架分别提升了56.6%、91.9%和502%。框架更新让模型更智能地搜索和行动,权重更新则构建了提示或框架无法灌输的领域直觉。

AI 翻译 · 中文

SIA提出了一种自改进循环,让一个语言模型智能体(反馈智能体)同时更新任务特定智能体的框架(工具、提示、重试逻辑等)和模型权重。传统方法中,框架更新和权重更新是分开研究的,而SIA将两者结合。在三个不同领域(中国法律罪名分类、GPU内核优化、单细胞RNA去噪)的测试中,SIA相比仅迭代框架分别提升了56.6%、91.9%和502%。框架更新让模型更智能地搜索和行动,权重更新则构建了提示或框架无法灌输的领域直觉。

arXiv cs.AIHumans are the bottleneck in building and improving AI. Both the models and the agents that wrap them are written, tuned, and corrected by people. The long-horizon goal of an AI that can figure out how to improve itself