12:49arXiv: OpenAI@Varun Aggarwal, Kay Kobak, John Howarter精选普渡大学暑期本科研究项目(SURF)每年收到数千份申请,传统人工评审耗时数周。研究人员开发了基于GPT-4o、GPT-5-mini和GPT-5.2的LLM工具,对1200份个人陈述进行结构化评分(六项子标准,0-3分)。GPT-5.2处理全部申请仅需4.6小时,平均每份14秒,且评分一致性最高。项目协调员结合LLM输出的分数和理由,在4小时内完成终审,而此前需要数周协调。该工具在低分申请上评分分歧较大,但整体显著缩短了评审周期。AI产品LLM应用教育/评审GPT-5.2自动化工作流普渡大学推荐理由:高校行政人员或科研项目管理者终于有了可落地的AI用例——LLM自动评分+理由输出,把数周评审压缩到几小时,做大规模申请筛选的团队可以直接参考这套工作流。原文
16:14shao__meng@shao__meng精选场外衍生品市场名义价值 846 万亿美元,45% 的保证金追缴存在争议,其中过半源于双方对同一份 CSA 合同的理解不同。该系统将流程拆为四层:ADE 按专用 Schema 提取字段并绑定源页码;三个 Claude Agent 并行归一化抵押品描述、时区和货币条款,纯规则验证 Agent 预审矛盾项;五步骤纯 Python 计算器执行确定性运算,零 LLM 调用;最终生成带追溯、推理链和可独立运行脚本的审计包。核心洞察是争议根源在合同解读而非数学,LLM 负责模糊语义判断,规则负责一致性算术,两者接口显式化。该分离原则适用于保险理赔、监管报告等一切文档解释驱动确定性计算的高风险场景。AI产品智能体金融科技LLM应用可审计性架构设计推荐理由:金融衍生品团队终于有了解决保证金争议的架构方案——把 LLM 的模糊判断和规则的确定性计算分离,做 OTC 清算、合规或风控的开发者可以直接参考这套可审计设计。原文