AI 领域近期围绕“指数(Index)”一词出现了多项与模型能力、企业采用率相关的进展,核心关注点在于如何量化 AI 性能提升以及企业部署趋势。
Anthropic 计划推出 AI 熟练度评分卡,旨在通过基准测试为用户提供模型能力的分级指引,引导更高效的 AI 使用方式。与此同时,Qwen 发布的 Qwen3.7-Max 模型以百万 token 上下文窗口和推理智能体能力为亮点,其 AI 指数据称跃升 4.8 分,反映出模型在复杂任务处理上的显著进步。此外,Google DeepMind 的 Gemini 3.5 Flash 在提升智能与速度的同时价格翻倍,显示出性能与成本之间的权衡。
在企业采用层面,Anthropic 的企业采用率首次超越 OpenAI,达到 34.4%,表明市场竞争格局正在变化。LlamaIndex 的 LlamaParse 自动化贷款承销流水线则展示了 AI 在行业流程中的实际落地。
当前焦点集中在两个方向:一是如何通过标准化指数衡量 AI 模型的真实进步,避免纯粹依赖参数或测试集;二是企业级 AI 的采用趋势,尤其是新兴模型如何挑战现有市场领导者。未来需观察评分卡等工具的普及是否会重塑用户选择,以及企业迁移成本对竞争格局的长期影响。