这篇论文测试了GPT-5.5、Claude Opus 4.7和Qwen3-Coder-Next用智能体写并行Julia代码,在超算上跑192核,发现小规模还行,大规模容易死锁或OOM,开源模型最差。做HPC或Julia并行开发的人值得看。
一项新研究使用基于OpenCode的智能体扩展Julia文档MCP服务器,评估了OpenAI GPT-5.5、Anthropic Claude Opus 4.7和开源Qwen3-Coder-Next在三个并行问题(π近似、分块矩阵乘、分块Cholesky分解)上生成Dagger.jl代码的能力。实验在共享内存192核和分布式两节点上进行,与Base.Threads和MPI.jl基线对比。结果显示智能体能生成小规模可执行代码,但在大规模下因死锁、过订阅或内存溢出失败,其中开源模型受影响最严重。商业模型在Base.Threads和MPI.jl上可扩展性相当,但Dagger.jl实现存在任务依赖、粒度和调度方面的反复弱点。
一项新研究使用基于OpenCode的智能体扩展Julia文档MCP服务器,评估了OpenAI GPT-5.5、Anthropic Claude Opus 4.7和开源Qwen3-Coder-Next在三个并行问题(π近似、分块矩阵乘、分块Cholesky分解)上生成Dagger.jl代码的能力。实验在共享内存192核和分布式两节点上进行,与Base.Threads和MPI.jl基线对比。结果显示智能体能生成小规模可执行代码,但在大规模下因死锁、过订阅或内存溢出失败,其中开源模型受影响最严重。商业模型在Base.Threads和MPI.jl上可扩展性相当,但Dagger.jl实现存在任务依赖、粒度和调度方面的反复弱点。
Julia is increasingly used in hpc as a single-language alternative to combining high-level scripting with low-level systems languages, but achieving scalable performance still requires expertise in parallel programming. …