GLM vs Opus成本对比:GLM token消耗是Opus 2倍?

Snowflake CEO @RamaswmySridhar 做了一个深度实验,对比 GLM vs Opus 成本,发现 GLM token 消耗是 Opus 的 2 倍? 先看看实验设计 · 任务...

精选理由

Snowflake CEO用103个真实任务实测GLM和Opus,发现调整缓存后GLM成本不到Opus一半,适合注重预算的团队。

AI 摘要

Snowflake CEO使用103个dbt任务对GLM和Opus进行3轮测试。GLM原始token消耗860M,Opus 439M,差距约2倍。差距源于GLM平均轮次99次(Opus 80次)、工具调用为原子化(Opus批量化)、缓存命中率53%(Opus 96%)。尾部失败案例主导均值:少数任务中GLM陷入400+次调用。归一化到90%缓存率后,GLM成本$1.12/session,Opus $2.14/session,GLM便宜48%。

AI 翻译 · 中文

Snowflake CEO使用103个dbt任务对GLM和Opus进行3轮测试。GLM原始token消耗860M,Opus 439M,差距约2倍。差距源于GLM平均轮次99次(Opus 80次)、工具调用为原子化(Opus批量化)、缓存命中率53%(Opus 96%)。尾部失败案例主导均值:少数任务中GLM陷入400+次调用。归一化到90%缓存率后,GLM成本$1.12/session,Opus $2.14/session,GLM便宜48%。

shao__mengSnowflake CEO @RamaswmySridhar 做了一个深度实验,对比 GLM vs Opus 成本,发现 GLM token 消耗是 Opus 的 2 倍? 先看看实验设计 · 任务集:103 个 dbt 任务,每模型跑 3 轮,同一 harness、同一任务集——变量控制扎实 · 原始 token:GLM 860M vs Opus 439M,约 2× 差距 Token 差距的三个原因 · 平均轮次/轮:99 vs. 8