全部 AI 动态 · AI 热点

6月26日

10:59

arXiv cs.AI@Alina Bazarova, Johann Fredrik Jadebeck, Henrik Zunker, Carolina J. Klett-Tammen, Torben Heinsohn, Wolfgang Wiechert, Katharina Noeh, Stefan Kesselheim

该研究将基于模拟推理（SBI）的神经后验估计用于SECIR流行病学模型的贝叶斯校准，并使用2020年德国COVID-19 ICU入住数据。在31天推断窗口中，SBI恢复的后验分布与MCMC高度一致，准确再现ICU轨迹。在更具挑战的201天重构问题中，SBI保留了主要后验结构，尽管不确定性增加。SBI在单GPU上完成31天推断仅需60-70秒，而MCMC需要约1000秒；201天任务中SBI平均157秒，MCMC超过19000秒。结果表明SBI为快速近实时疫情分析提供了高效框架。

论文 SBI MCMC COVID-19 流行病学模型贝叶斯推断

推荐理由：这篇论文用COVID-19数据实测，SBI比MCMC快几十倍，精度不输，适合需要快速迭代的流行病学建模场景。

原文

10:20

arXiv cs.LG@Graham Gibson, John Tipton, Kellin Rumsey, Natalie Klein

Ribbon是一种针对Dirichlet重加权bootstrap的可扩展近似方法，通过单次拟合模型后的影响函数线性化替代重复重拟合。该方法仅需事后线性代数运算即可保持贝叶斯bootstrap的一阶数据重加权结构，并可通过验证数据调整不确定性尺度。在合成回归、MNIST分类和California Housing基准测试中，Ribbon在避免重复模型训练的同时提供了有竞争力的预测性能和改进的校准效果。

论文 Ribbon 不确定性量化贝叶斯推断近似推断

推荐理由：Ribbon用一种巧妙的线性化技巧，让你不用反复训练就能估算模型的不确定性，而且结果和更复杂的bootstrap差不多。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

13:05

arXiv cs.AI@Yanan Long

论文 LiveBench Open LLM Leaderboard 贝叶斯推断 AI评估审计

推荐理由：这篇论文用贝叶斯方法检查了LiveBench等公共AI评估档案，发现很多宣称有问题，帮你判断哪些基准成绩可信。

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？