Challenge

§ 01综述

Challenge 是指以竞赛或悬赏形式推动技术突破的开放问题，在 AI 领域常通过 Benchmarks 评测模型能力。近期多个 Challenge 聚焦于 AI 智能体的自主性和效率提升，揭示出当前系统在复杂任务中的优势与局限。

Challenge 近期进展

Hugging Face Gemma Challenge：2025 年 6 月，一项竞赛证明 AI Agent 与人类协作可将 Gemma 4 的推理速度提升 5 倍，展示了人机协同的潜力。原文链接

维苏威挑战赛：悬赏数十万美元，用 AI 读取 2000 年前碳化卷轴，目标复原古罗马文献，体现 Challenge 在文化遗产领域的应用。原文链接

Meta-Agent Challenge：2025 年 6 月的评测显示，当前 AI 智能体在自主构建更优智能体时表现堪忧，Gary Marcus 援引此 Challenge 驳斥 Anthropic 接近 RSI 的说法。原文链接

当前焦点与观察点

Challenge 正从单纯性能竞赛转向评估 AI 的自主性和协作能力。Gemma Challenge 强调人机协作，而 Meta-Agent Challenge 暴露了智能体自我改进的瓶颈。此外，LeHome Challenge 2026 叠衣方案（线上第一、线下第二）和 7-Day Voice AI Builder Challenge 均显示实际部署与实验室效果的差距。英伟达开源 TwoTower 模型（保留 98.7% 质量，提速 2.42 倍）则表明底层效率提升仍是关键。这些 Challenge 共同推动 AI 向更务实、可解释的方向发展。

§ 02相关报道10 条在档

§ 03邻近话题