Prediction

§ 01综述

Prediction是人工智能系统的核心能力，指基于历史数据或模型推断未知状态或未来事件的过程。在机器学习领域，预测任务涵盖分类、回归、序列生成等，近期研究尤其关注如何提升预测的可靠性、效率与泛化能力。

Prediction近期进展

共形预测用于不确定性量化：Localized Conformal Prediction改进了VLM图像分类的置信度校准，通过局部化覆盖集为每个样本提供更精确的预测区间。原文标题

下一潜在预测加速推理：Next-Latent Prediction方法让Transformer学习预测隐状态而非直接预测token，在多个任务上实现3.3倍推理加速。原文标题

多token预测提升本地模型速度：llama.cpp加入MTP（Multi-Token Prediction）支持，使本地模型token生成速度提升78%；Qwen在Atomic Chat中通过MTP实现2.5倍加速。原文标题1 原文标题2

时序分段模型用于预测与控制：OpenAI提出时序分段模型，将预测与规划解耦，在长时域任务中表现出更好的可控性。原文标题

当前焦点与观察点

当前Prediction技术正从显式输出预测转向隐状态空间预测（如Next-Latent Prediction），以降低计算开销并提升推理速度；同时，不确定性量化方法（如共形预测）被广泛用于提升预测的可靠性，尤其在安全关键应用。多token预测（MTP）通过并行预测多个未来token，在本地部署场景中显著降低了延迟。这些趋势表明，Prediction技术正朝着更高效、更鲁棒的方向演进，且越来越关注资源受限环境下的实用化。

§ 02相关报道09 条在档

§ 03邻近话题