近期,AI 研究论文密集聚焦于智能体的代码化能力、上下文效率优化及系统级扩展,同时 LLM 的幻觉根源与多轮训练陷阱成为争议焦点。
当前焦点集中于:LLM 幻觉源于概率重构而非训练数据(Gary Marcus:LLM 的幻觉源于概率重构,非训练数据),以及多轮强化学习中 token 重编码导致的梯度错误问题(多轮RL训练智能体LLM的陷阱:Token重编码导致梯度错误)。未来值得观察 CMU 提出的 LLM“睡眠”机制是否真能提升复杂推理(CMU研究:LLM“睡眠”机制提升复杂推理性能),以及 YC 的 Paper Club 能否促进研究向产业转化(YC 举办首届 Paper Club,聚焦 AI 研究与生产落地)。