AI产品精选

vLLM 支持自托管开源模型作为编程助手

Your coding agent can run on open models you host …

精选理由

vLLM 现在能让你自己在 GPU 上跑开源模型当编程助手,省了 API 钱还更灵活,支持 NVIDIA、AMD 和多种模型。

AI 摘要

vLLM 推出新功能,允许用户在自己的 GPU 上运行开源模型作为编程助手。该引擎兼容 OpenAI Responses API,因此任何使用代码助手的工具都可直接指向你的服务器。支持 NVIDIA、AMD 等多种硬件。当前可部署 GLM 5.2、Kimi K2.7 Code、MiniMax M3 等模型。

AI 翻译 · 中文

vLLM 推出新功能,允许用户在自己的 GPU 上运行开源模型作为编程助手。该引擎兼容 OpenAI Responses API,因此任何使用代码助手的工具都可直接指向你的服务器。支持 NVIDIA、AMD 等多种硬件。当前可部署 GLM 5.2、Kimi K2.7 Code、MiniMax M3 等模型。

vLLMYour coding agent can run on open models you host yourself, not just a hosted API. vLLM serves them fast and cost-efficiently on your own GPUs, with broad hardware support across @NVIDIA, @AMD, and more. It speaks the sa