精选 AI 资讯 · AI 热点

6月19日

18:37

18:37

Together AI@togethercompute

精选

Together AI分享了优化GLM 5.1推理性能的三项关键改进。他们重写了索引器的topk内核。接着融合了索引器内核以减少内存和启动开销。同时消除了限制预填充吞吐量的CPU开销。这些优化显著提升了GLM 5.1在Together AI平台上的运行效率。

AI模型 GLM 5.1 Together AI 推理优化内核重写

推荐理由：想知道Together AI怎么让GLM 5.1跑得更快？他们分享了三个工程优化点，对部署GLM 5.1有直接帮助。

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月1日

00:09

AITOP6月1日 00:09

OpenAI 发起“Codex for Open Source”：免费赠送 6 个月 Pro 订阅，开源维护者能否迎来 AI 变革？

5月29日

10:12

10:12

lmarena.ai@lmarena_ai

精选

Arena 的 AI 能力负责人 @petergostev 对 Anthropic 最新发布的 Claude Opus 4.8 进行了超过 200 项 Code Arena 前端测试，涵盖思考与非思考模式，并与过去的 Opus 变体、Gemini 3.1 Pro、3.5 Flash 和 GLM 5.1 进行对比。测试内容包括 3D 场景生成、游戏开发和前端 UI 设计等多个维度。结果已发布在 Arena 的线程中，供开发者参考和讨论。

AI模型 Claude Opus 4.8 前端测试模型对比 Gemini 3.1 Pro GLM 5.1

推荐理由：前端开发者可以直观看到 Claude Opus 4.8 在复杂 UI 和游戏生成上的实际表现，对比多个主流模型后能更精准选型，值得点开线程看具体案例。

08:02

AITOP5月29日 08:02

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？🔥Anthropic 把 AI 编程的“确认键”彻底删掉了！Claude Code 搭载全新 Opus 4.8 模型，长时间任务不跑偏、不废话、不中断，像一个资深工程师一样默默干活，从功能开发到漏洞清扫全包圆，你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”，现在它直接交完整交付物……自主编程的最后一层窗户纸，被捅破了。做自动化开发和代码审查的团队，这个模型建议直接上手，效率差距肉眼可见……

Opus 4.8发布：编程助手的“静默时刻”，是解放开发者，还是新门槛？

5月16日

23:03

23:03

Fireworks AI@FireworksAI_HQ

精选

Fireworks 宣布其训练平台进一步扩展，即日起通过 Training API 支持 GLM 5.1 的 LoRA RL（强化学习），包括 SFT、DPO 和完整 RL 训练，上下文窗口达 200K。用户可使用自定义损失函数或智能默认设置，无使用上限，无需积分兑换，训练后的模型归用户所有并可用于推理。同时，从 6 月 15 日起，付费 Claude 计划用户可获得每月专用积分，用于 Claude Agent SDK、claude -p、Claude Code GitHub Actions 及基于 Agent SDK 的第三方应用。

AI产品 Fireworks GLM 5.1 LoRA RL 训练平台 Claude

推荐理由：Fireworks 让 GLM 5.1 的强化学习训练变得简单且无上限，做模型微调或 RL 研究的团队可以直接上手，不用操心配额和积分。

19:14

19:14

AI Engineer@aiDotEngineer

精选73°

开源模型 GLM 5.1 在 Artificial Analysis 智能指数上超越闭源模型，差距持续缩小。权重开放意味着可以在不离开基础设施的情况下进行量化、微调和边缘部署。Hugging Face 生态已为智能体工作构建：推理提供商支持工具路由、按 SWE bench 分数过滤的基准数据集、存储智能体会话的追踪仓库类型，以及可插入编码智能体的技能。现场演示中，Claude Code 被要求微调一个视觉语言模型，智能体自动计算 VRAM 需求、选择实例并启动任务，将过去需要一天的手工计算变为一个提示。

AI模型 GLM 5.1 开源模型智能体 Hugging Face 微调

推荐理由：开源模型首次在权威指数上超越闭源模型，做模型部署和微调的团队可以直接利用权重优势，而 Hugging Face 的智能体生态让训练任务自动化成为现实——建议点开看 Claude Code 如何一键微调模型。