Agentic AI生成并行Julia代码的可扩展性研究

精选理由

这篇论文测试了GPT-5.5、Claude Opus 4.7和Qwen3-Coder-Next用智能体写并行Julia代码，在超算上跑192核，发现小规模还行，大规模容易死锁或OOM，开源模型最差。做HPC或Julia并行开发的人值得看。

AI 摘要

一项新研究使用基于OpenCode的智能体扩展Julia文档MCP服务器，评估了OpenAI GPT-5.5、Anthropic Claude Opus 4.7和开源Qwen3-Coder-Next在三个并行问题（π近似、分块矩阵乘、分块Cholesky分解）上生成Dagger.jl代码的能力。实验在共享内存192核和分布式两节点上进行，与Base.Threads和MPI.jl基线对比。结果显示智能体能生成小规模可执行代码，但在大规模下因死锁、过订阅或内存溢出失败，其中开源模型受影响最严重。商业模型在Base.Threads和MPI.jl上可扩展性相当，但Dagger.jl实现存在任务依赖、粒度和调度方面的反复弱点。

AI 翻译 · 中文

arXiv: AnthropicJulia is increasingly used in hpc as a single-language alternative to combining high-level scripting with low-level systems languages, but achieving scalable performance still requires expertise in parallel programming. …

lmarena.ai06-13 13:47原文
宝玉06-16 23:30原文
elvis06-16 19:32原文
Claude Code: GitHub Releases06-15 21:35原文
Simon Willison’s Weblog06-16 05:20原文
Decoder06-16 09:44原文
IT之家06-17 06:16原文
marktechpost06-13 17:27原文
shao__meng06-14 12:38原文
Geek06-15 11:19原文

阅读原文