token·general

Token

别名
首次出现
2026-05-22
最近出现
2026-06-10
累计提及
506
§ 01综述

Token作为大语言模型的基本计算单元,近期在效率提升和推理优化方面取得显著进展。华为升级的星河AI网络将Token生产效率提升2至5倍,通过优化网络架构减少数据传输瓶颈(华为升级星河AI网络,Token生产效率提升2至5倍)。Kog@AI在8×AMD MI300X上实现了3000 tokens/s的推理速度,展示了硬件适配的巨大潜力(Kog@AI 实现 3000 tokens/s 推理速度)。Fireworks AI每日处理30万亿token,开源模型份额持续攀升,说明开源生态在Token消耗量上已占据重要地位(Fireworks AI:每日处理30万亿token)。然而,多轮强化训练中Token重编码可能导致梯度错误,提醒业界关注训练稳定性问题(多轮RL训练智能体LLM的陷阱)。此外,Firecrawl /monitor通过自然语言监控网页变化可节省90% Token,体现了Token应用的精细化趋势(Firecrawl /monitor 上线)。当前焦点在于如何平衡Token效率与模型性能:黄仁勋强调应更关注时间效率而非成本(黄仁勋谈AI应用:浪费点钱没关系,别浪费时间),而Claude Opus 4.8的诚实改进(Claude Opus 4.8 发布)可能也涉及Token利用的优化。未来观察点:Token效率提升能否在更大模型上保持线性收益,以及训练中梯度问题是否会导致新的优化范式。

§ 02相关报道10 条在档
  1. 01
    Claude Fable 5 初体验:慢、贵、但强大
    Simon Willison’s Weblog
  2. 02
    用 AgentsView 计算 Claude Fable 5 Token 消耗的 TIL
    Simon Willison
  3. 03
    在 AgentsView 中为模型设置自定义价格
    Simon Willison’s Weblog
  4. 04
    Anthropic 发布 Claude Fable 5:性能超越、价格减半
    Aadit Sheth
  5. 05
    Anthropic 发布 Claude Fable 5:带分类器门控的公共模型
    rohanpaul_ai
  6. 06
    Claude Fable 5 模型上线,定价公布
    elvis
  7. 07
    Anthropic 发布 Fable 5:低配版 Mythos 模型,性能超 Opus 4.8
    歸藏(guizang.ai)
  8. 08
    Anthropic 发布 Claude Fable 5 和 Mythos 5,能力提升价格降低
    宝玉
  9. 09
    UniSound U2 模型发布:效率优先,跻身中国大模型第一梯队
    Pandaily
  10. 10
    MiMo V2.5 Pro UltraSpeed 每秒1000 Token,万亿参数模型实测
    歸藏(guizang.ai)
§ 03邻近话题

本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

/topic/Token