精选理由
语音MRI研究者终于有了一个利用语音信号本身来提升成像质量的新思路——SIREM把音频作为先验,解决了传统rtMRI在分辨率与速度间的权衡问题,做语音科学或临床评估的团队可以直接用开源代码试试。
SIREM是一种新型的语音引导MRI重建框架,通过同步语音作为跨模态先验来改善实时语音MRI(rtMRI)的图像质量。该方法将每帧图像建模为音频驱动和MRI驱动成分的融合,利用语音预测发音器结构,同时从k空间数据重建互补内容。SIREM还引入了可学习的螺旋臂软加权机制,实现k空间采样与语音信息融合的差异化研究。在USC语音rtMRI基准上,SIREM在保持解剖学合理性的同时,显著优于传统方法(如网格化、小波压缩感知和全变分),实现了更高吞吐量的重建。代码已开源。
AI 翻译 · 中文
SIREM是一种新型的语音引导MRI重建框架,通过同步语音作为跨模态先验来改善实时语音MRI(rtMRI)的图像质量。该方法将每帧图像建模为音频驱动和MRI驱动成分的融合,利用语音预测发音器结构,同时从k空间数据重建互补内容。SIREM还引入了可学习的螺旋臂软加权机制,实现k空间采样与语音信息融合的差异化研究。在USC语音rtMRI基准上,SIREM在保持解剖学合理性的同时,显著优于传统方法(如网格化、小波压缩感知和全变分),实现了更高吞吐量的重建。代码已开源。
Real-time magnetic resonance imaging (rtMRI) of speech production enables non-invasive visualization of dynamic vocal-tract motion and is valuable for speech science and clinical assessment. However, rtMRI is fundamental…