精选理由
做 Agent 编排和工具调用的团队终于有了专用 CPU——Vera 专治高并发调度瓶颈,Anthropic、OpenAI 已经拿到手,搞 AI 基础设施的开发者值得关注。
英伟达开始交付其首款自研通用 CPU NVIDIA Vera,专为高并发、高吞吐的 Agent 编排和工具调用场景设计。该 CPU 负责调度编排和工具调用,而模型推理仍在 GPU 上进行,旨在解决密集 Agent 工作下的强 IO、内存和调度压力。首批交付对象包括 Anthropic、OpenAI、xAI 和 Oracle Cloud,其中 xAI 由马斯克亲自接待。这标志着英伟达从 GPU 向 CPU 领域扩展,为 Agentic AI 时代提供专用硬件。
AI 翻译 · 中文
英伟达开始交付其首款自研通用 CPU NVIDIA Vera,专为高并发、高吞吐的 Agent 编排和工具调用场景设计。该 CPU 负责调度编排和工具调用,而模型推理仍在 GPU 上进行,旨在解决密集 Agent 工作下的强 IO、内存和调度压力。首批交付对象包括 Anthropic、OpenAI、xAI 和 Oracle Cloud,其中 xAI 由马斯克亲自接待。这标志着英伟达从 GPU 向 CPU 领域扩展,为 Agentic AI 时代提供专用硬件。
英伟达开始交付自己设计的通用 CPU NVIDIA Vera了。 重点优化的是长期高并发和高吞吐的场景,专门用来做Agent 编排和工具调用的中枢。 模型可以在 GPU 上进行推理,但所有的调度编排和调用工具都放在这个 CPU 上。 这种密集 Agent、密集常驻的强 IO、内存和调度压力的工作,其实都是 CPU 的工作,所以他们专门做了一个 CPU。 这次交付由英伟达自己上门,将这个 CPU 送到了:Anthropic、OpenAI、…