Exa CEO 谈检索如何解决 Token 危机:小模型+检索可省 20 倍成本

Exa CEO Will Bryk explains why retrieval can help solve the tokenpocalypse: "We should not be using...

精选理由

做 AI 应用或代理的团队,如果被 token 成本压得喘不过气,这个思路值得一试——用检索让小模型干大模型的活,省 20 倍成本不是梦。

AI 摘要

Exa CEO Will Bryk 在 a16z 的访谈中提出,不应为所有任务使用巨型模型,而应通过检索增强让小模型表现如大模型。他称,大模型负责决策,向小模型分配任务,小模型借助检索可更准确可靠。Exa 通过高效筛选网络信息,能为客户节省高达 20 倍的成本。Andrej Karpathy 也评论认为,模型大小竞争正逆向发展,未来会出现极小的、能“思考”的模型,但前提是先用大模型帮助生成理想训练数据。

AI 翻译 · 中文

Exa CEO Will Bryk 在 a16z 的访谈中提出,不应为所有任务使用巨型模型,而应通过检索增强让小模型表现如大模型。他称,大模型负责决策,向小模型分配任务,小模型借助检索可更准确可靠。Exa 通过高效筛选网络信息,能为客户节省高达 20 倍的成本。Andrej Karpathy 也评论认为,模型大小竞争正逆向发展,未来会出现极小的、能“思考”的模型,但前提是先用大模型帮助生成理想训练数据。

a16zExa CEO Will Bryk explains why retrieval can help solve the tokenpocalypse: "We should not be using gigantic models for every task." "You should use a family of models of different sizes. The big model dec