13:51Together AI@togethercomputeTogether AI 宣布其处理 token 量已达 400 万亿,认为这标志着开放模型在真实生产中进入规模采用阶段。团队将实际工作负载迁移到开放模型,是为了获得前沿质量、更好的 tokenomics 和更强的推理控制力。Together AI 提供基础设施支持这一转型。行业Together AI开放模型tokenomics推理生产部署推荐理由:400万亿 token 的量级,说明开放模型在真实生产里站稳了,看 Together AI 怎么搭台子。原文
01:15Hugging Face@huggingfaceHugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程,无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。技巧Hugging Face开源模型本地部署推理推荐理由:想自己跑开源模型?Hugging Face 这场直播手把手教你在本地部署,省去云端费用和延迟。原文
01:04NVIDIA AI@NVIDIAAINVIDIA 发布了 OpenShell v0.0.55 版本,新增对 Google Vertex AI 推理提供者的支持,允许用户直接使用 Vertex AI 运行智能体。该版本还引入了基于配置文件的策略可见性,增强了网关中的 Podman 检测能力,并恢复了 GPU procfs 的基线行为。此外,修复了 CI 和文档问题,提升了整体稳定性和安全性。对于需要跨云部署 AI 智能体的开发者来说,这是一个实用的更新。AI产品OpenShellVertex AI智能体推理NVIDIA10 个信源在谈推荐理由:OpenShell 新增 Vertex AI 支持,让多云 AI 智能体部署更灵活,做跨平台推理的团队可以直接用起来。原文
03:02rohanpaul_ai@rohanpaul_ai精选Intel 计划在年底前推出一款新的 AI 数据中心芯片,该芯片采用比 Nvidia 和 AMD 更便宜的内存和冷却技术。AI 热潮正从构建模型转向日常运行推理,Intel 的 Crescent Island 策略聚焦于推理场景,使用空气冷却和 LPDDR5 内存,而非液冷和高带宽内存。在 Gaudi 芯片未能突破后,Intel 选择了一个更窄的战场,以低成本优势切入推理市场。AI产品IntelAI 芯片推理数据中心低成本10 个信源在谈推荐理由:Intel 的推理芯片策略瞄准了 AI 落地中成本敏感的环节,做数据中心部署或预算有限的团队值得关注,低成本方案可能改变选型格局。原文
10:49Gary Marcus@GaryMarcus精选Gary Marcus 在推文中指出,世界模型(world model)并非新概念,已在象棋程序、导航系统、维基百科等系统中存在多年,它们是对对象、地点、事件、机制等可推理内容的显式表示。然而,当前的大语言模型(LLM)缺乏这种显式世界模型。Marcus 强调,大多数世界模型是手工构建的,真正的挑战在于如何从数据中自动获取它们。这引发了关于AI系统如何更好地理解和推理世界的讨论。AI模型世界模型LLM推理Gary Marcus知识表示推荐理由:Marcus 点出了LLM的核心短板——缺乏显式世界模型,做AI推理和知识表示的开发者值得关注,看完会重新思考LLM的局限性。原文
18:46阿里云 Alibaba Cloud@alibaba_cloud精选阿里云宣布将于2026年举办Qwen Conference,主题议程聚焦AI原生云、智能体原生云架构、推理未来和多模态视觉技术。会议承诺无冗余内容,直接提供面向全球规模的工程蓝图。该会议旨在展示阿里云在AI基础设施和智能体领域的最新进展,为开发者和企业提供可落地的技术方案。目前已开放注册。行业AI原生云智能体推理多模态阿里云推荐理由:阿里云首次将AI原生云和智能体原生云架构作为核心议题,做云原生和AI基础设施的团队可以提前了解工程蓝图,建议关注注册。原文