08:01Simon Willison’s Weblog(博客/媒体)Mike Veerman 开发了一个 HTML 应用,模拟从 5 到 800 tokens/s 的 LLM 输出速度,帮助用户直观感受不同 token 速率下的文本生成效果。当看到模型宣传“30 tokens/s”时,可以用这个工具快速理解实际体验。该工具通过 Hacker News 传播,对评估和比较不同 LLM 的响应速度很有帮助。AI产品LLMtoken 速率可视化工具模型评估开源推荐理由:选模型时经常被 token 速率数字搞晕?这个工具让你直接看到不同速度下的文本生成效果,做模型选型或写提示词优化的开发者值得一试。原文
01:46Nathan Lambert: Interconnects@Florian Brand76°过去一个月内,多个重磅开源模型密集发布,包括 Google 的 Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5 和 GLM-5.1 等。这些模型在性能、架构和开源策略上各有突破,标志着开源 AI 生态进入新一轮竞争。CAISI 的 V4 评估报告对这些模型进行了横向对比,揭示了不同模型在推理、多模态和效率上的优劣。对于关注开源模型选型和趋势的开发者与研究者,这是重要的参考节点。AI模型开源模型Gemma 4DeepSeek V4Kimi K2.6模型评估1 个信源在谈推荐理由:开源模型一个月内连发五款旗舰,做模型选型或研究的团队可以直接参考 CAISI 的 V4 评估对比,省去自己跑 benchmark 的时间。原文