精选理由
小鹏在自动驾驶上搞了一个新招:X-Mind能用96个Token推演未来12帧,比传统模型更准更快,还能跑在车规芯片上。
小鹏集团正式发布X-Mind技术框架,通过内嵌预测性世界模型,将12帧未来世界推演压缩至仅96个Token。相比传统VLA模型,X-Mind在复杂长尾场景下轨迹预测误差(ADE)显著降低。该框架通过深度压缩自编码器(DC-AE)和循环块扩散机制,在车规级芯片上实现低推理延迟。小鹏宣称X-Mind赋予自动驾驶“预见未来”的能力,可实现防御性驾驶。
AI 翻译 · 中文
小鹏集团正式发布X-Mind技术框架,通过内嵌预测性世界模型,将12帧未来世界推演压缩至仅96个Token。相比传统VLA模型,X-Mind在复杂长尾场景下轨迹预测误差(ADE)显著降低。该框架通过深度压缩自编码器(DC-AE)和循环块扩散机制,在车规级芯片上实现低推理延迟。小鹏宣称X-Mind赋予自动驾驶“预见未来”的能力,可实现防御性驾驶。
IT之家 6 月 29 日消息,小鹏汽车官方今日宣布,面对让模型主动思考、拉高预见能力的上限的难题, 小鹏集团近日正式发布 X-Mind 技术框架 ,通过内嵌预测性世界模型,赋予车载智能体高效的视觉思维链,攻克了认知推理与实时计算之间的矛盾,宣称让自动驾驶拥有“预见未来”的大脑。 据介绍,X-Mind 的整体架构是让预测世界模型无缝嵌入在大型驾驶模型中。通过使用循环块扩散机制,网络在单次前向传播中,在其不同的内部层上执行渐进式去噪步骤,…