10:36arXiv cs.LG@Muhammad Bilal, Ali Hassaan Mughal该论文分析了一个生产级租赁搜索助手,其自动化测试套件在六周内增长到1,553个测试用例。尽管套件持续通过,用户可见缺陷仍不断进入生产环境。研究检查了项目中所有252个bug修复提交,发现约44%的修复属于四个无法被组件级单元测试观察的接缝:实时浏览器运行时、非默认市场、端到端流程和全系统级别。一个缺陷因缺少接缝防护而两次发布。论文提出了四接缝框架和实测缺陷分布。论文LLM多市场Web应用软件测试缺陷分析推荐理由:这篇论文用252个真实bug数据,告诉你怎么测试全绿依然出bug,给所有做LLM应用的人敲响警钟。原文
20:24Guillermo Rauch@rauchgVercel CEO Rauchg在X上发文指出,Agent(智能体)正在激励众多健康的软件工程习惯,包括开放API、文档(技能)、测试(评估)、Unix命令行界面、支付与商业协议,甚至广泛采用Accept头(支持markdown/json/html)。他认为这是万维网原始愿景在眼前的实现。该帖获得113个点赞和3420次浏览。行业智能体开放APICLI软件测试开发实践推荐理由:Rauchg总结了Agent如何驱动开放API、文档、测试等好习惯,做软件的值得一看。原文