精选理由
这是 AI 自主编程能力的里程碑——模型不再只是写代码,而是能像资深工程师一样分析、调优、迭代。做 AI 系统优化或关注模型自主性的开发者,值得仔细看看这个案例。
阿里巴巴 Qwen 团队展示了一项令人瞩目的成果:模型在约 35 小时的连续自主执行中,独立完成了 432 次内核评估和 1158 次工具调用。它自行编写、编译、分析并迭代优化了 Extend Attention Kernel,最终在多个工作负载上实现了相对于 Triton 参考实现的 10.0 倍几何平均加速。这标志着模型具备了真正的自主编程与优化能力,无需人类干预即可完成复杂系统级任务。
AI 翻译 · 中文
阿里巴巴 Qwen 团队展示了一项令人瞩目的成果:模型在约 35 小时的连续自主执行中,独立完成了 432 次内核评估和 1158 次工具调用。它自行编写、编译、分析并迭代优化了 Extend Attention Kernel,最终在多个工作负载上实现了相对于 Triton 参考实现的 10.0 倍几何平均加速。这标志着模型具备了真正的自主编程与优化能力,无需人类干预即可完成复杂系统级任务。
Self-Evolving in the Wild:Over the course of ~35 hours of continuous autonomous execution, the model performed 432 kernel evaluations across 1,158 tool calls. It wrote, compiled, profiled, and iteratively improved the Ex…