全部 AI 动态 · AI 热点

6月19日

18:37

Together AI@togethercompute

精选

Together AI分享了优化GLM 5.1推理性能的三项关键改进。他们重写了索引器的topk内核。接着融合了索引器内核以减少内存和启动开销。同时消除了限制预填充吞吐量的CPU开销。这些优化显著提升了GLM 5.1在Together AI平台上的运行效率。

AI模型 GLM 5.1 Together AI 推理优化内核重写

推荐理由：想知道Together AI怎么让GLM 5.1跑得更快？他们分享了三个工程优化点，对部署GLM 5.1有直接帮助。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

01:46

Fireworks AI@FireworksAI_HQ

Fireworks AI 在 Harvey 的法律智能体基准上测试了稀疏顾问模式：用 GLM 5.1 作为执行工人，Claude Opus 4.7 作为稀疏顾问，结果全部通过率从 Opus 单独运行的 14/100 提升至 18/100，成本仅为 Opus 单独运行的 39%。该模式通过让强大模型仅在关键步骤提供建议，显著降低了推理成本。Fireworks 已开源相关 harness 设计、顾问模式及训练结果。

AI产品智能体法律AI GLM 5.1 Claude Opus 4.7 开源/仓库

推荐理由：法律 AI 团队终于有了降本增效的实战方案——用 GLM 5.1 搭配 Claude Opus 4.7 做稀疏顾问，性能提升 28% 的同时成本砍掉 61%，做法律智能体或长链推理的开发者值得一试。

原文

5月29日

10:12

lmarena.ai@lmarena_ai

精选

Arena 的 AI 能力负责人 @petergostev 对 Anthropic 最新发布的 Claude Opus 4.8 进行了超过 200 项 Code Arena 前端测试，涵盖思考与非思考模式，并与过去的 Opus 变体、Gemini 3.1 Pro、3.5 Flash 和 GLM 5.1 进行对比。测试内容包括 3D 场景生成、游戏开发和前端 UI 设计等多个维度。结果已发布在 Arena 的线程中，供开发者参考和讨论。

AI模型 Claude Opus 4.8 前端测试模型对比 Gemini 3.1 Pro GLM 5.1

推荐理由：前端开发者可以直观看到 Claude Opus 4.8 在复杂 UI 和游戏生成上的实际表现，对比多个主流模型后能更精准选型，值得点开线程看具体案例。

原文

5月16日

23:03

Fireworks AI@FireworksAI_HQ

精选

Fireworks 宣布其训练平台进一步扩展，即日起通过 Training API 支持 GLM 5.1 的 LoRA RL（强化学习），包括 SFT、DPO 和完整 RL 训练，上下文窗口达 200K。用户可使用自定义损失函数或智能默认设置，无使用上限，无需积分兑换，训练后的模型归用户所有并可用于推理。同时，从 6 月 15 日起，付费 Claude 计划用户可获得每月专用积分，用于 Claude Agent SDK、claude -p、Claude Code GitHub Actions 及基于 Agent SDK 的第三方应用。

AI产品 Fireworks GLM 5.1 LoRA RL 训练平台 Claude

推荐理由：Fireworks 让 GLM 5.1 的强化学习训练变得简单且无上限，做模型微调或 RL 研究的团队可以直接上手，不用操心配额和积分。

原文

19:14

AI Engineer@aiDotEngineer

精选73°

开源模型 GLM 5.1 在 Artificial Analysis 智能指数上超越闭源模型，差距持续缩小。权重开放意味着可以在不离开基础设施的情况下进行量化、微调和边缘部署。Hugging Face 生态已为智能体工作构建：推理提供商支持工具路由、按 SWE bench 分数过滤的基准数据集、存储智能体会话的追踪仓库类型，以及可插入编码智能体的技能。现场演示中，Claude Code 被要求微调一个视觉语言模型，智能体自动计算 VRAM 需求、选择实例并启动任务，将过去需要一天的手工计算变为一个提示。

AI模型 GLM 5.1 开源模型智能体 Hugging Face 微调

推荐理由：开源模型首次在权威指数上超越闭源模型，做模型部署和微调的团队可以直接利用权重优势，而 Hugging Face 的智能体生态让训练任务自动化成为现实——建议点开看 Claude Code 如何一键微调模型。

原文