Qwen 模型自主进化:35 小时独立优化内核,10 倍加速

Self-Evolving in the Wild:Over the course of ~35 hours of continuous autonomous execution, the model...

精选理由

这是 AI 自主编程能力的里程碑——模型不再只是写代码,而是能像资深工程师一样分析、调优、迭代。做 AI 系统优化或关注模型自主性的开发者,值得仔细看看这个案例。

AI 摘要

阿里巴巴 Qwen 团队展示了一项令人瞩目的成果:模型在约 35 小时的连续自主执行中,独立完成了 432 次内核评估和 1158 次工具调用。它自行编写、编译、分析并迭代优化了 Extend Attention Kernel,最终在多个工作负载上实现了相对于 Triton 参考实现的 10.0 倍几何平均加速。这标志着模型具备了真正的自主编程与优化能力,无需人类干预即可完成复杂系统级任务。

AI 翻译 · 中文

阿里巴巴 Qwen 团队展示了一项令人瞩目的成果:模型在约 35 小时的连续自主执行中,独立完成了 432 次内核评估和 1158 次工具调用。它自行编写、编译、分析并迭代优化了 Extend Attention Kernel,最终在多个工作负载上实现了相对于 Triton 参考实现的 10.0 倍几何平均加速。这标志着模型具备了真正的自主编程与优化能力,无需人类干预即可完成复杂系统级任务。

阿里通义 QwenSelf-Evolving in the Wild:Over the course of ~35 hours of continuous autonomous execution, the model performed 432 kernel evaluations across 1,158 tool calls. It wrote, compiled, profiled, and iteratively improved the Ex