AITOP6月11日 15:28
精选
过去 24 小时,从 1009 条中筛出 58 条
6月11日
15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
15:07
AITOP6月11日 15:07
6月2日
11:06
11:06
arXiv cs.AI@Ieva Raminta Staliūnaitė, James Bishop, Andreas Vlachos
精选
推荐理由:这篇论文解决了LLM错误预测中一个被忽视的关键问题——输入模糊性会干扰UQ指标的有效性。做模型可靠性评估或安全部署的团队,建议看看他们如何用模糊性标签提升预测精度,直接可用。
6月1日
00:09
AITOP6月1日 00:09
5月29日
5月28日
11:30
11:30
arXiv cs.AI@Bushi Xiao, Sarvesh Soni, Daisy Zhe Wang
精选
推荐理由:临床AI部署中,模型能否准确表达不确定性直接关系到患者安全——Reverse Probing让token级不确定性量化首次在临床摘要场景落地,做医疗NLP或AI安全的研究者值得关注。
5月26日
12:24
12:24
arXiv cs.LG@Bipin Tiwari, Omer San
精选
推荐理由:做 CFD 逆设计或不确定性量化的研究者终于有了一个计算可行的方案——神经算子加速后,贝叶斯推断从小时级降到秒级,建议直接复现论文中的喷管案例。
11:48
11:48
arXiv cs.AI@Federico Torrielli, Peter Schneider-Kamp, Lukas Galke Poech
精选
推荐理由:做模型可解释性研究的团队终于有了可靠的置信度评估方法——bootstrap模式频率比传统log-prob校准误差低近5倍,建议做LLM内部机制分析的开发者直接参考论文代码。
11:47
11:47
arXiv cs.AI@Waleed Razzaq, Yun-Bo Zhao
精选
推荐理由:这篇论文为需要可靠不确定性估计的连续时间序列建模场景提供了新思路,做概率机器学习或自动驾驶感知的团队可以关注其神经元级可解释性带来的调试优势。
5月21日
10:22
10:22
arXiv cs.LG@Yinsong Chen, Samson S. Yu, Zhong Li, Chee Peng Lim
精选
推荐理由:该框架解决了XAI方法缺乏不确定性量化的问题,做可解释AI或电力系统故障诊断的研究者可以直接参考其理论证明和实验设计。
5月20日
10:13
10:13
arXiv cs.AI@Yuxuan Gao, Megan Wang, Yi Ling Yu
精选
推荐理由:做AI智能体评估或排行榜的团队终于有了统计严谨的不确定性量化工具——无需分布假设即可保证覆盖,还能处理多智能体管道和排名稳定性问题,建议做评估基准的开发者直接看论文和代码。
5月19日
11:18
11:18
arXiv cs.LG@Seyed Mohamad Moghadas, Esther Rodrigo Bonet, Bruno Cornelis, Adrian Munteanu
精选
推荐理由:做时空序列预测的团队终于有了一个能同时处理空间相关性和误差时间累积的通用模块——Teger直接插入现有自回归模型就能提升长程预测可靠性,值得在电力、交通等场景试试。
5月18日
10:39
10:39
arXiv cs.LG@Paulo C. Marques F., Helton Graziadei
精选
推荐理由:做回归预测且需要不确定性量化的团队,这篇论文提供了一种能自适应数据偏态的新方法,比传统共形预测区间更高效,值得关注。
