近期“Atlas”一词同时指向两个截然不同的科技前沿:波士顿动力的Atlas人形机器人与谷歌DeepMind的Gemini 3.5 Flash模型(内部代号曾为“Atlas”? 不,这里指的是另一个同名研究论文)。
机器人领域:Atlas转向重体力劳动
波士顿动力Atlas展示了从表演性动作向实用搬运的跨越。最新视频中,Atlas通过强化学习成功搬运超过100磅的冰箱,完成下蹲、扛起、180度转身等连贯动作。这标志着人形机器人从“跳舞”进入真正工业场景的尝试。IT之家及AI Will等报道均强调其从“花哨”到“干重活”的转变(IT之家)。
AI领域:Gemini 3.5 Flash性能爆发
谷歌在I/O大会上发布Gemini 3.5 Flash,自称“最强编程与智能体模型”(Jeff Dean推特)。该模型在多项基准测试中不仅超越自家前代3.1 Pro,甚至与顶级模型Opus 4.7相比,性能持平或领先,而成本仅为其零头(AI Breakfast报道)。开发者演示显示,用其生成递归树动画仅需77秒,并支持免费体验(ZenMux)。
学术新概念:ATLAS——统一智能体与视觉推理
arXiv最新论文提出“ATLAS”框架,旨在以单个词实现智能体行为与潜在视觉推理的统一,为多模态AI提供新思路。
当前焦点:机器人领域关注人形机器人的实用化成本与可靠性;AI领域则在追求更高性能与更低成本的平衡。未来需观察Atlas能否真正进入工厂,以及Gemini 3.5 Flash如何重塑模型定价与竞争格局。