小鹏发布X-Mind技术框架，让自动驾驶具备预测性世界模型

精选理由

小鹏在自动驾驶上搞了一个新招：X-Mind能用96个Token推演未来12帧，比传统模型更准更快，还能跑在车规芯片上。

AI 摘要

小鹏集团正式发布X-Mind技术框架，通过内嵌预测性世界模型，将12帧未来世界推演压缩至仅96个Token。相比传统VLA模型，X-Mind在复杂长尾场景下轨迹预测误差（ADE）显著降低。该框架通过深度压缩自编码器（DC-AE）和循环块扩散机制，在车规级芯片上实现低推理延迟。小鹏宣称X-Mind赋予自动驾驶“预见未来”的能力，可实现防御性驾驶。

AI 翻译 · 中文

IT之家IT之家 6 月 29 日消息，小鹏汽车官方今日宣布，面对让模型主动思考、拉高预见能力的上限的难题，小鹏集团近日正式发布 X-Mind 技术框架，通过内嵌预测性世界模型，赋予车载智能体高效的视觉思维链，攻克了认知推理与实时计算之间的矛盾，宣称让自动驾驶拥有“预见未来”的大脑。据介绍，X-Mind 的整体架构是让预测世界模型无缝嵌入在大型驾驶模型中。通过使用循环块扩散机制，网络在单次前向传播中，在其不同的内部层上执行渐进式去噪步骤，…

阅读原文