全部 AI 动态 · AI 热点

6月24日

11:50

arXiv cs.LG@Giorgio Corani, Stefano Damato, Dario Azzimonti, Lorenzo Zambon

该论文探讨了在多个时间序列数据集上，使用适当评分规则（如平均分、中位分、平均排名）进行概率模型选择时出现的冲突问题。研究发现，这些统计量产生冲突决策的原因是评分分布的偏态性。随着每个时间序列测试集增大，不同模型选择标准会逐渐收敛到相同结论；但对于短测试集，只有平均分能正确识别真实模型。论文基于间歇性时间序列（包括M5竞赛数据集）进行了实验验证，强调了大规模测试集的重要性。

论文 M5 competition 适当评分规则时间序列模型选择概率模型

推荐理由：这篇论文用M5竞赛数据测试了不同模型选择标准，发现短测试集时只有平均分靠谱。搞时间序列模型的人可以参考。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

11:12

arXiv cs.LG@Ines Nolasco, Jules Cauzinille, Marius Miron, Gagan Narula, Milad Alizadeh, Emmanuel Fernandez, Matthieu Geist, Ellen Gilsenan-McMahon, Olivier Pietquin, Emmanuel Chemla, Sara Keen

本研究使用88个eGeMAPS特征，对六个分类群的生物声学嵌入进行线性与非线性回归探针，揭示模型编码的语音特征。结果显示没有单一模型能覆盖全部特征空间，拼接嵌入性能最佳。Loudness特征编码最好（R²=0.76），F0最难恢复（R²=0.33）。通过交叉引用可恢复性与特征显著性（NMI），为模型选择提供数据驱动指导。

论文 bioacoustics eGeMAPS 语音特征模型选择可解释性

推荐理由：选模型？看这个研究

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？