10:21arXiv: OpenAI@Antonio J. Costa, Caterina Doglioni, Christian Gütschow, Andrew D. Pilkington, Sukanya Sinha粒子物理对撞机实验依赖Rivet例程来比较新理论模型与测量数据,但目前仅有39%的测量有公开例程。AgentRivet是一个基于大语言模型的自动化工作流,能从期刊论文中提取物理分析信息并生成缺失的Rivet例程。系统包含多步骤流程,中间有代码和物理审查作为质量控制。测试使用OpenAI、Anthropic和Google的商业模型,针对ATLAS和CMS实验的两项最新测量,生成了语法错误少、物理保真度合理的例程。主要问题源于论文中模糊的定义,部分模型在实现复杂观测量时仍有困难。论文粒子物理Rivet例程大语言模型自动化工作流AgentRivet10 个信源在谈推荐理由:粒子物理学家和蒙特卡洛生成器开发者终于有了自动化工具来填补Rivet例程缺口,建议做高能物理分析或模型验证的团队关注,能大幅节省手动编写例程的时间。原文
12:49arXiv: OpenAI@Varun Aggarwal, Kay Kobak, John Howarter精选普渡大学暑期本科研究项目(SURF)每年收到数千份申请,传统人工评审耗时数周。研究人员开发了基于GPT-4o、GPT-5-mini和GPT-5.2的LLM工具,对1200份个人陈述进行结构化评分(六项子标准,0-3分)。GPT-5.2处理全部申请仅需4.6小时,平均每份14秒,且评分一致性最高。项目协调员结合LLM输出的分数和理由,在4小时内完成终审,而此前需要数周协调。该工具在低分申请上评分分歧较大,但整体显著缩短了评审周期。AI产品LLM应用教育/评审GPT-5.2自动化工作流普渡大学推荐理由:高校行政人员或科研项目管理者终于有了可落地的AI用例——LLM自动评分+理由输出,把数周评审压缩到几小时,做大规模申请筛选的团队可以直接参考这套工作流。原文