近期,Ethan Mollick 在 AI 领域持续发布多项实验与观察,成为理解前沿模型能力与应用瓶颈的关键声音。背景上,AI 发展正从单纯追求参数规模转向优化推理效率与多模态能力。
- 主要进展包括:
- GPT-5.5 Pro 事实核查能力提升:Greg Brockman 展示整章投喂后精准定位引用,验证新模型在长文本与引用可靠性上的突破 (GPT-5.5 Pro 事实核查)。
- Gemini Omni 多模态演示:Mollick 展示从1896火车到子弹头的原生视频编辑,凸显多模态实时处理潜力 (Gemini Omni 演示)。
- Gary Marcus 承认误判:此前质疑 GPT-5.5 推理能力的 Marcus 公开承认其可复现 Erdos 效果,体现模型推理的实质进展 (Marcus 承认误判)。
- 算力短缺成为瓶颈:Mollick 指出复杂智能体工作流将因算力不足而昂贵,对大规模部署形成制约 (AI算力短缺)。
- Codex 界面局限:Mollick 批评当前编码 AI 仍面向开发者,非程序员被边缘化,需重新设计交互 (Codex 界面问题)。
当前焦点集中在模型能力提升与实际可用性之间的张力:虽然 GPT-5.5 等新模型在事实核查、数学推理上进步明显,但算力成本与交互设计缺陷可能限制其普及。未来需观察多模态与智能体工作流能否在资源约束下实现普惠,以及各方如何推动更包容的 AI 界面。