arXiv cs.AI@Peng Ding, Rick Stevens精选67一项实证研究通过zerodep项目,用LLM辅助开发了40多个仅依赖Python标准库的模块,替代流行的第三方库。基准测试显示,大多数情况下stdlib实现性能与第三方库持平(2倍以内),但在C扩展支持的计算任务(如图像处理、二进制序列化)中性能差距明显。有趣的是,许多第三方库因架构开销反而比stdlib实现慢5-115倍。该研究揭示了stdlib的能力边界,并探讨了LLM在严格约束下生成正确、高效代码的可行性。论文Python标准库第三方库LLM辅助开发性能基准推荐理由:Python开发者面临依赖管理痛点,这项研究用数据告诉你哪些第三方库可以用stdlib替代,哪些不行。做轻量级部署或减少供应链风险的团队,值得参考zerodep的实践。
arXiv cs.AI@Mohamed Almukhtar, Anwar Ghammam, Hua Ming精选58一项针对 AI 代理生成的 Python 重构 Pull Request 的实证研究发现,平均 22.5% 的变更提升了代码质量属性,其中可用性提升最频繁(36.5%)。但 24.17% 的修改文件引入了新的 Pylint 问题(主要是约定违规如长行),4.7% 引入了新的 Bandit 安全发现。尽管存在这些问题,73.5% 的 PR 被合并,包括那些引入新问题但同时也移除了旧问题的案例。研究还归纳了 24 种常见变更操作及其与 lint/安全发现的关系,强调了在 AI 驱动开发中加强质量与安全门控的必要性。论文AI 编程代码质量安全重构Python推荐理由:AI 写代码到底靠不靠谱?这篇论文用数据说话——重构 PR 质量有提升也有隐患,做 AI 编程工具或代码审查的团队值得看看,能帮你设计更好的质量门控。