12:54Amazon Science@AmazonScience精选AWS 宣布其自研芯片 Graviton5 正式可用。该芯片采用四芯片架构,拥有 192 个核心,支持 DDR5-8800 内存和 PCIe Gen6。相比上一代 Graviton4,在通用计算和智能体 AI 工作负载上性能提升 25%。这标志着 AWS 在自研芯片领域的又一重要进展,为云端 AI 和通用计算提供了更强的基础设施选择。AI产品AWSGraviton5芯片云端计算AI 基础设施推荐理由:AWS 自研芯片的迭代直接关系到云端计算成本与性能,做 AI 推理或大规模部署的团队值得关注 Graviton5 的性价比提升。原文
01:36Clement Delangue@ClementDelangue精选Hugging Face 宣布其存储平台已成为私有和公开模型及数据集的最佳选择,支持中间和最终版本。以 @heyjasperai 为例,他们使用 HF 存储桶存储 Monet 数据集并直接在其上训练模型。这展示了 HF 在 AI 存储和训练工作流中的一体化能力。对于需要管理大型模型和数据集的团队,HF 提供了便捷的存储和训练集成方案。AI产品Hugging Face存储平台数据集模型训练AI 基础设施推荐理由:Hugging Face 将存储与训练无缝集成,管理模型和数据集的团队可以直接在平台上完成从存储到训练的全流程,省去多平台切换的麻烦。原文
13:30Jerry Liu@jerryjliu0精选Jerry Liu(LlamaIndex 创始人)认为,AI 创业公司将在“模型路由即服务”领域积累大量价值,这不仅是 OpenRouter 这样的通用路由,还包括垂直化的智能体和基础设施。他以文档基础设施(解析、提取、搜索)和网络搜索(Exa/Parallel)为例,说明在准确性与成本的帕累托曲线上找到最佳点既重要又困难。Brian Armstrong 补充说,未来 80% 的工作负载将运行在便宜 99% 的模型上,只有 20% 需要最新高端模型,而 Coinbase 已通过路由提示词到更便宜的模型来保持成本稳定。这揭示了模型路由作为降低 AI 应用成本、提升效率的关键基础设施,对开发者和创业公司是巨大机会。行业模型路由AI 基础设施成本优化智能体OpenRouter推荐理由:模型路由是 AI 应用降本增效的关键,做 AI 产品、智能体或基础设施的团队值得关注——它可能成为下一个像 API 网关一样的基础设施层。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……
14:56Cohere@cohere精选Cohere 发布了新模型 Command A+,该模型针对 NVIDIA Blackwell 架构进行了优化,并使用了 NVIDIA CUDA-X 库进行训练。NVIDIA AI 基础设施团队公开祝贺,强调了双方在 AI 基础设施上的紧密合作。这一合作意味着 Command A+ 将充分利用 NVIDIA 最新硬件的性能,为企业和开发者提供更高效的 AI 推理能力。AI模型CohereCommand A+NVIDIA BlackwellAI 基础设施模型优化推荐理由:Cohere 与 NVIDIA 的深度合作让 Command A+ 在 Blackwell 上跑出最佳性能,做企业级 AI 部署的团队值得关注这个新选择。原文