SIREM：利用同步语音作为先验的MRI重建框架

精选理由

语音MRI研究者终于有了一个利用语音信号本身来提升成像质量的新思路——SIREM把音频作为先验，解决了传统rtMRI在分辨率与速度间的权衡问题，做语音科学或临床评估的团队可以直接用开源代码试试。

AI 摘要

SIREM是一种新型的语音引导MRI重建框架，通过同步语音作为跨模态先验来改善实时语音MRI（rtMRI）的图像质量。该方法将每帧图像建模为音频驱动和MRI驱动成分的融合，利用语音预测发音器结构，同时从k空间数据重建互补内容。SIREM还引入了可学习的螺旋臂软加权机制，实现k空间采样与语音信息融合的差异化研究。在USC语音rtMRI基准上，SIREM在保持解剖学合理性的同时，显著优于传统方法（如网格化、小波压缩感知和全变分），实现了更高吞吐量的重建。代码已开源。

AI 翻译 · 中文

arXiv cs.LGReal-time magnetic resonance imaging (rtMRI) of speech production enables non-invasive visualization of dynamic vocal-tract motion and is valuable for speech science and clinical assessment. However, rtMRI is fundamental…

阅读原文