AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:RedHat×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月5日
02:33
02:33Andrew Ng@AndrewYNg
Andrew Ng 联合 RedHat 推出新课程,教你如何高效服务大语言模型,以低延迟和合理成本处理大量并发用户。课程核心包括量化降低模型内存占用(如 70B 模型权重约 140GB)以及使用 vLLM 的智能内存管理(如 KV 缓存)来提升并发处理能力。学员将学会量化模型并权衡精度、用 vLLM 部署并观察并发效果、以及基准测试以在速度、成本和精度间做决策。课程适合想优化 LLM 部署的开发者,可直接在 deeplearning.ai 上学习。
AI产品LLM 服务量化vLLMRedHatAndrew Ng

推荐理由:做 LLM 部署的开发者终于有了系统课程——量化降内存 + vLLM 处理并发,直接上手就能优化成本,建议点开学。
原文
6月4日
00:20
00:20DeepLearning.AI@DeepLearningAI
DeepLearning.AI 与 RedHat 合作推出免费短课程《Fast & Efficient LLM Inference with vLLM》,由 Cedric Clyburn 授课。课程涵盖开源 LLM 量化、使用 vLLM 部署模型,以及从速度、成本和准确率三个维度进行基准测试。学员可免费注册学习,适合希望提升 LLM 推理效率的开发者。
AI产品vLLMLLM推理模型量化RedHat课程

推荐理由:vLLM 是目前最主流的 LLM 推理框架之一,这门课直接教你量化、部署和基准测试,做模型部署或推理优化的工程师值得花时间学。
原文
精选全部日报登录