21:50Decoder@Maximilian Schreiner基准测试平台 Artificial Analysis 显示,Nvidia 的 Nemotron 3 Ultra 是目前美国最强大的开源 AI 模型,在多项指标上超越此前领先的 Llama 3 等模型。然而,该模型在整体性能上仍落后于中国开源模型如 DeepSeek 和 Qwen,表明中国在开源 AI 领域的领先地位依然稳固。这一进展凸显了美国在开源模型竞争中的追赶态势,但中国模型在推理、多模态等关键能力上仍保持优势。AI模型NvidiaNemotron 3 Ultra开源模型模型对比中国领先10 个信源在谈推荐理由:Nvidia 终于拿出了美国最强的开源模型,但中国开源模型依然领先,做模型选型和对比的开发者值得关注这一格局变化。原文
10:49Simon Willison’s Weblog(博客/媒体)精选Simon Willison 在 PyCon US 2026 上用五分钟闪电演讲总结了 LLM 领域过去六个月的发展。他重点介绍了 2025 年 11 月的“拐点”,当时最佳模型在三大提供商间易手五次,最终 Claude Opus 4.5 胜出。更关键的是,编码代理从“偶尔可用”跨越到“日常可用”,显著减少了人工修复错误的时间。他还分享了个人项目 micro-javascript,一个用 Python 实现的 JavaScript 解释器,展示了多语言嵌套运行的技术趣味。演讲通过“鹈鹕骑自行车”SVG 测试直观对比模型能力,强调编码代理的进步是最大亮点。行业LLM编码代理模型对比PyConSimon Willison推荐理由:Simon 用五分钟讲清了 LLM 过去半年的关键转折——编码代理从玩具变成生产力工具,做 AI 开发或重度使用编程助手的团队值得花五分钟了解这个趋势,看完会对模型选择和工具策略有更清晰的判断。原文