显微镜下的数据流形:用于几何估计的基准测试框架

The Data Manifold under the Microscope

精选理由

这篇论文给了一个实用的基准测试工具,帮你检验数据流形几何估计方法的准确性,还能用来验证理论假设。

AI 摘要

论文提出了一个基准测试框架manifold-microscope,用于研究数据流形的几何特性。它扩展了dSprites和COIL-20数据集,引入额外的变换维度和密集轴对齐采样,并搭配有限差分估计器。该框架能以接近真实值的精度恢复曲率、reach和体积,而通用估计器在这些场景中不可靠。两个应用研究展示了该框架的用途:评估Genovese et al.和Fefferman et al.理论边界的缩放行为,以及跟踪β-VAE的逐层几何变化。

AI 翻译 · 中文

论文提出了一个基准测试框架manifold-microscope,用于研究数据流形的几何特性。它扩展了dSprites和COIL-20数据集,引入额外的变换维度和密集轴对齐采样,并搭配有限差分估计器。该框架能以接近真实值的精度恢复曲率、reach和体积,而通用估计器在这些场景中不可靠。两个应用研究展示了该框架的用途:评估Genovese et al.和Fefferman et al.理论边界的缩放行为,以及跟踪β-VAE的逐层几何变化。

arXiv cs.LGA significant gap exists between theory and practice in deep learning. Generalization and approximation error bounds are often derived for simplified models or are too loose to be informative. Many rely on the manifold h