18:37Together AI@togethercompute精选Together AI分享了优化GLM 5.1推理性能的三项关键改进。他们重写了索引器的topk内核。接着融合了索引器内核以减少内存和启动开销。同时消除了限制预填充吞吐量的CPU开销。这些优化显著提升了GLM 5.1在Together AI平台上的运行效率。AI模型GLM 5.1Together AI推理优化内核重写推荐理由:想知道Together AI怎么让GLM 5.1跑得更快?他们分享了三个工程优化点,对部署GLM 5.1有直接帮助。原文
01:46Fireworks AI@FireworksAI_HQFireworks AI 在 Harvey 的法律智能体基准上测试了稀疏顾问模式:用 GLM 5.1 作为执行工人,Claude Opus 4.7 作为稀疏顾问,结果全部通过率从 Opus 单独运行的 14/100 提升至 18/100,成本仅为 Opus 单独运行的 39%。该模式通过让强大模型仅在关键步骤提供建议,显著降低了推理成本。Fireworks 已开源相关 harness 设计、顾问模式及训练结果。AI产品智能体法律AIGLM 5.1Claude Opus 4.7开源/仓库1 个信源在谈推荐理由:法律 AI 团队终于有了降本增效的实战方案——用 GLM 5.1 搭配 Claude Opus 4.7 做稀疏顾问,性能提升 28% 的同时成本砍掉 61%,做法律智能体或长链推理的开发者值得一试。原文
10:12lmarena.ai@lmarena_ai精选Arena 的 AI 能力负责人 @petergostev 对 Anthropic 最新发布的 Claude Opus 4.8 进行了超过 200 项 Code Arena 前端测试,涵盖思考与非思考模式,并与过去的 Opus 变体、Gemini 3.1 Pro、3.5 Flash 和 GLM 5.1 进行对比。测试内容包括 3D 场景生成、游戏开发和前端 UI 设计等多个维度。结果已发布在 Arena 的线程中,供开发者参考和讨论。AI模型Claude Opus 4.8前端测试模型对比Gemini 3.1 ProGLM 5.110 个信源在谈推荐理由:前端开发者可以直观看到 Claude Opus 4.8 在复杂 UI 和游戏生成上的实际表现,对比多个主流模型后能更精准选型,值得点开线程看具体案例。原文
23:03Fireworks AI@FireworksAI_HQ精选Fireworks 宣布其训练平台进一步扩展,即日起通过 Training API 支持 GLM 5.1 的 LoRA RL(强化学习),包括 SFT、DPO 和完整 RL 训练,上下文窗口达 200K。用户可使用自定义损失函数或智能默认设置,无使用上限,无需积分兑换,训练后的模型归用户所有并可用于推理。同时,从 6 月 15 日起,付费 Claude 计划用户可获得每月专用积分,用于 Claude Agent SDK、claude -p、Claude Code GitHub Actions 及基于 Agent SDK 的第三方应用。AI产品FireworksGLM 5.1LoRA RL训练平台Claude推荐理由:Fireworks 让 GLM 5.1 的强化学习训练变得简单且无上限,做模型微调或 RL 研究的团队可以直接上手,不用操心配额和积分。原文
19:14AI Engineer@aiDotEngineer精选73°开源模型 GLM 5.1 在 Artificial Analysis 智能指数上超越闭源模型,差距持续缩小。权重开放意味着可以在不离开基础设施的情况下进行量化、微调和边缘部署。Hugging Face 生态已为智能体工作构建:推理提供商支持工具路由、按 SWE bench 分数过滤的基准数据集、存储智能体会话的追踪仓库类型,以及可插入编码智能体的技能。现场演示中,Claude Code 被要求微调一个视觉语言模型,智能体自动计算 VRAM 需求、选择实例并启动任务,将过去需要一天的手工计算变为一个提示。AI模型GLM 5.1开源模型智能体Hugging Face微调推荐理由:开源模型首次在权威指数上超越闭源模型,做模型部署和微调的团队可以直接利用权重优势,而 Hugging Face 的智能体生态让训练任务自动化成为现实——建议点开看 Claude Code 如何一键微调模型。原文