01:02The Rundown AI@therundownai88°Nvidia 在 COMPUTEX 上发布多项重磅产品,覆盖 AI 计算的不同层面。RTX Spark 是与微软合作的新一代 AI 超算芯片,可直接在 Windows 电脑上运行 AI 智能体,无需云端,今年秋季发货。Vera 是 Nvidia 首款专为 AI 智能体设计的 CPU,性能比竞品快 1.8 倍,纽约证券交易所计划用其扩容。Cosmos 3 是开源世界模型,可让机器人和自动驾驶汽车预测场景,现已可用。Nemotron 3 Ultra 是 550B 参数的开源权重模型,本周发布,对标 Kimi K2.6、GLM 5.1 等。AI产品NvidiaRTX SparkVera CPUCosmos 3AI 智能体10 个信源在谈推荐理由:Nvidia 把 AI 智能体从云端拉到本地 PC,做边缘计算或桌面 AI 应用的开发者可以直接关注 RTX Spark;Vera CPU 专为智能体设计,做数据中心或高频交易的团队值得研究。原文
20:05rohanpaul_ai@rohanpaul_ai76°NVIDIA 发布了由 Phoronix 完成的 Vera CPU 基准测试报告。报告显示,Vera 相比当前 128 核 x86 CPU 整体性能领先 1.5 倍,相比前代 Grace CPU 几何平均性能提升 1.6 倍。Vera 采用 Armv9.2 架构,每核内存带宽是传统 x86 的 4 倍以上,LPDDR5X 带宽达 1.2TB/s,功耗仅 30W,而典型 DDR5 服务器功耗超 100W。对于智能体 AI 场景,CPU 端任务(如工具调用、文件读写、浏览器操作)日益繁重,Vera 的高效计算能力将显著提升这类工作负载的表现。AI产品NVIDIAVera CPUArmv9.2服务器芯片智能体6 个信源在谈推荐理由:NVIDIA 用 Arm 架构正面挑战 Intel/AMD 服务器 CPU,性能更强且功耗更低,做 AI 推理和智能体系统的团队值得关注——CPU 端负载正在变重,Vera 可能是更优选择。原文
14:10歸藏(guizang.ai)@op741883°英伟达开始交付其首款自研通用 CPU NVIDIA Vera,专为高并发、高吞吐的 Agent 编排和工具调用场景设计。该 CPU 负责调度编排和工具调用,而模型推理仍在 GPU 上进行,旨在解决密集 Agent 工作下的强 IO、内存和调度压力。首批交付对象包括 Anthropic、OpenAI、xAI 和 Oracle Cloud,其中 xAI 由马斯克亲自接待。这标志着英伟达从 GPU 向 CPU 领域扩展,为 Agentic AI 时代提供专用硬件。AI产品英伟达Vera CPUAgent 编排硬件交付AI 基础设施10 个信源在谈推荐理由:做 Agent 编排和工具调用的团队终于有了专用 CPU——Vera 专治高并发调度瓶颈,Anthropic、OpenAI 已经拿到手,搞 AI 基础设施的开发者值得关注。原文