Index

§ 01综述

Index在AI领域是一个多义词，既可以指代数据索引与检索系统（如LlamaIndex），也可以作为模型能力评估的基准指标（如Epoch Capabilities Index），近期多项相关进展展示了Index在代理检索、能力评测和无监督学习中的关键作用。

Index 在代理检索与数据管道中的近期进展

LlamaIndex发布Index v2：作为面向代理检索的持久化数据管道，Index v2旨在简化AI agent对结构化/非结构化数据的访问，提升检索效率与可靠性。详见LlamaIndex发布Index v2：面向代理检索的持久化数据管道。

Zilliz推出Vector Lakebase：湖原生架构统一在线与批量处理，为Index系统提供底层向量存储与检索能力，进一步降低数据管道的复杂度。详见Zilliz 发布 Vector Lakebase 公开预览，湖原生架构统一在线与批量处理。

LangChain构建SmithDB：专为agent traces设计的数据库，本质上也是一种优化过的Index，用于高效存储和查询代理运行轨迹，提升调试与评估体验。详见LangChain技术博客：如何构建SmithDB——专为agent traces设计的数据库。

当前焦点与观察点

Index 在AI agent中的核心地位：随着AI agent完成自由职业工作的比例从2.5%跃升至16%（来源：AI agent 完成16%自由职业工作达专业质量，较8个月前提升6倍），高效的Index系统成为支撑其检索和决策的关键。LlamaIndex v2和Vector Lakebase等产品的快速迭代，反映了行业对持久化、高性能Index的迫切需求。

评测指标的Index化：Epoch Capabilities Index显示GPT-4领先352天（来源：GPT-4 在Epoch Capabilities Index领先352天，远超其他模型），这种综合评估Index成为衡量模型能力演变的重要工具。同时，新提出的Centroid Index（CI）用真实标签评估聚类效果（来源：如何用真实标签评估聚类效果？推荐Centroid Index (CI)），体现了Index在无监督学习评估中的精细化方向。

隐藏涨价与评估透明性：Claude Sonnet 5被指通过增加Token消耗隐藏涨价（来源：Claude Sonnet 5 被指通过增加Token消耗隐藏涨价），这凸显了使用客观Index（如成本-效率比）进行模型评估的重要性，避免用户被表面价格误导。

§ 02相关报道10 条在档

§ 03邻近话题