全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

10:21

10:21

arXiv: OpenAI@Antonio J. Costa, Caterina Doglioni, Christian Gütschow, Andrew D. Pilkington, Sukanya Sinha

粒子物理对撞机实验依赖Rivet例程来比较新理论模型与测量数据，但目前仅有39%的测量有公开例程。AgentRivet是一个基于大语言模型的自动化工作流，能从期刊论文中提取物理分析信息并生成缺失的Rivet例程。系统包含多步骤流程，中间有代码和物理审查作为质量控制。测试使用OpenAI、Anthropic和Google的商业模型，针对ATLAS和CMS实验的两项最新测量，生成了语法错误少、物理保真度合理的例程。主要问题源于论文中模糊的定义，部分模型在实现复杂观测量时仍有困难。

论文粒子物理 Rivet例程大语言模型自动化工作流 AgentRivet

推荐理由：粒子物理学家和蒙特卡洛生成器开发者终于有了自动化工具来填补Rivet例程缺口，建议做高能物理分析或模型验证的团队关注，能大幅节省手动编写例程的时间。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月5日

12:49

12:49

arXiv: OpenAI@Varun Aggarwal, Kay Kobak, John Howarter

精选

普渡大学暑期本科研究项目（SURF）每年收到数千份申请，传统人工评审耗时数周。研究人员开发了基于GPT-4o、GPT-5-mini和GPT-5.2的LLM工具，对1200份个人陈述进行结构化评分（六项子标准，0-3分）。GPT-5.2处理全部申请仅需4.6小时，平均每份14秒，且评分一致性最高。项目协调员结合LLM输出的分数和理由，在4小时内完成终审，而此前需要数周协调。该工具在低分申请上评分分歧较大，但整体显著缩短了评审周期。

AI产品 LLM应用教育/评审 GPT-5.2 自动化工作流普渡大学

推荐理由：高校行政人员或科研项目管理者终于有了可落地的AI用例——LLM自动评分+理由输出，把数周评审压缩到几小时，做大规模申请筛选的团队可以直接参考这套工作流。