12:49arXiv: OpenAI@Varun Aggarwal, Kay Kobak, John Howarter精选普渡大学暑期本科研究项目(SURF)每年收到数千份申请,传统人工评审耗时数周。研究人员开发了基于GPT-4o、GPT-5-mini和GPT-5.2的LLM工具,对1200份个人陈述进行结构化评分(六项子标准,0-3分)。GPT-5.2处理全部申请仅需4.6小时,平均每份14秒,且评分一致性最高。项目协调员结合LLM输出的分数和理由,在4小时内完成终审,而此前需要数周协调。该工具在低分申请上评分分歧较大,但整体显著缩短了评审周期。AI产品LLM应用教育/评审GPT-5.2自动化工作流普渡大学推荐理由:高校行政人员或科研项目管理者终于有了可落地的AI用例——LLM自动评分+理由输出,把数周评审压缩到几小时,做大规模申请筛选的团队可以直接参考这套工作流。原文