10 tokens/s 到底多快？模拟 LLM 输出速度的 HTML 工具

精选理由

选模型时经常被 token 速率数字搞晕？这个工具让你直接看到不同速度下的文本生成效果，做模型选型或写提示词优化的开发者值得一试。

AI 摘要

Mike Veerman 开发了一个 HTML 应用，模拟从 5 到 800 tokens/s 的 LLM 输出速度，帮助用户直观感受不同 token 速率下的文本生成效果。当看到模型宣传“30 tokens/s”时，可以用这个工具快速理解实际体验。该工具通过 Hacker News 传播，对评估和比较不同 LLM 的响应速度很有帮助。

AI 翻译 · 中文

Simon Willison’s WeblogHow fast is 10 tokens per second really? Neat little HTML app by Mike Veerman ( source code here ) which simulates LLM token output speeds from 5/second to 800/second. Useful if you see a model advertised as "30 tokens/s…

阅读原文