11:12
11:12
arXiv cs.LG@Ines Nolasco, Jules Cauzinille, Marius Miron, Gagan Narula, Milad Alizadeh, Emmanuel Fernandez, Matthieu Geist, Ellen Gilsenan-McMahon, Olivier Pietquin, Emmanuel Chemla, Sara Keen 本研究使用88个eGeMAPS特征,对六个分类群的生物声学嵌入进行线性与非线性回归探针,揭示模型编码的语音特征。结果显示没有单一模型能覆盖全部特征空间,拼接嵌入性能最佳。Loudness特征编码最好(R²=0.76),F0最难恢复(R²=0.33)。通过交叉引用可恢复性与特征显著性(NMI),为模型选择提供数据驱动指导。
推荐理由:选模型?看这个研究