15:16arXiv cs.LG@Nico Daheim, Iryna GurevycharXiv 论文提出基于贝叶斯决策理论和风险规避规则的几种不确定性感知算法,用于大语言模型在辅导和自动同行评审中的决策。在生成导师回复或评审时,将策略与分数的不确定性纳入考量,并用共形预测对策略和分数提供统计保证。实验表明,贝叶斯方法在高模糊性下优于风险规避规则,后者可能因追求通用输出而降低效用。论文LLM贝叶斯决策共形预测不确定性量化自动评审推荐理由:这篇论文教大模型在不确定时怎么选策略,辅导学生或写评审都管用,贝叶斯方法比保守方法更聪明。原文