11:12
11:12
arXiv cs.LG@Ines Nolasco, Jules Cauzinille, Marius Miron, Gagan Narula, Milad Alizadeh, Emmanuel Fernandez, Matthieu Geist, Ellen Gilsenan-McMahon, Olivier Pietquin, Emmanuel Chemla, Sara Keen 本研究使用88个eGeMAPS特征,对六个分类群的生物声学嵌入进行线性与非线性回归探针,揭示模型编码的语音特征。结果显示没有单一模型能覆盖全部特征空间,拼接嵌入性能最佳。Loudness特征编码最好(R²=0.76),F0最难恢复(R²=0.33)。通过交叉引用可恢复性与特征显著性(NMI),为模型选择提供数据驱动指导。
推荐理由:选模型?看这个研究
11:12
11:12
arXiv cs.AI@Jan Batzner, Sree Harsha Nelaturu, Anastassia Kornilova, Jon Crall, Tommaso Cerruti, Yanan Long, Yifan Mai, Sanchit Ahuja, Asaf Yehudai, Marek Šuppa, John P. Lalor, Oluwagbemike Olowe, Jatin Ganhotra, Brian H. Hu, Eliya Habba, Andrew M. Bean, Chang Liu, Sander Land, Steven Dillmann, Aniketh Garikaparthi, Elron Bandel, Saki Imai, James Edgell, Wm. Matthew Kennedy, Jenny Chim, Patrick Meusling, Asteria Kaeberlein, Venkata Ramachandra Karthik Chundi, Manasi Patwardhan, Martin Ku, Austin Meek, Leon Knauer, Brian Wingenroth, Srishti Yadav, Usman Gohar, Felix Friedrich, Michelle Lin, Jennifer Mickel, Arman Cohan, Stella Biderman, Irene Solaiman, Zeerak Talat, Anka Reuel, Mubashara Akhtar, Gjergji Kasneci, Avijit Ghosh, Leshem Choshen 论文提出Every Eval Ever,首个共享元数据模式和社区众包仓库,用于标准化AI评估结果。该模式将评估表示统一为单一JSON文档,支持从评价工具、论文等多种来源导入,并可存储每个实例的输出以进行细粒度分析。当前社区数据库已包含22,235个模型、2,273个独特基准和31种评估格式。论文还提供了自动转换器,从流行格式和评价工具转换到统一模式。
推荐理由:统一了AI评估结果格式
仅展示最近 2000 条内容。更早的内容请查阅 AI 日报存档(侧边栏 → AI 日报 → 顶部「往期日报」)。