全部 AI 动态 · AI 热点

6月29日

13:51

13:51

Together AI@togethercompute

Together AI 宣布其处理 token 量已达 400 万亿，认为这标志着开放模型在真实生产中进入规模采用阶段。团队将实际工作负载迁移到开放模型，是为了获得前沿质量、更好的 tokenomics 和更强的推理控制力。Together AI 提供基础设施支持这一转型。

行业 Together AI 开放模型 tokenomics 推理生产部署

推荐理由：400万亿 token 的量级，说明开放模型在真实生产里站稳了，看 Together AI 怎么搭台子。

6月26日

01:15

01:15

Hugging Face@huggingface

Hugging Face 通过直播演示如何在本机部署和运行开源 AI 模型。教程覆盖了从模型下载、环境配置到推理执行的完整流程，无需依赖云端服务。适合希望离线使用 LLaMA、Mistral 等模型的开发者。

技巧 Hugging Face 开源模型本地部署推理

推荐理由：想自己跑开源模型？Hugging Face 这场直播手把手教你在本地部署，省去云端费用和延迟。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

01:04

01:04

NVIDIA AI@NVIDIAAI

NVIDIA 发布了 OpenShell v0.0.55 版本，新增对 Google Vertex AI 推理提供者的支持，允许用户直接使用 Vertex AI 运行智能体。该版本还引入了基于配置文件的策略可见性，增强了网关中的 Podman 检测能力，并恢复了 GPU procfs 的基线行为。此外，修复了 CI 和文档问题，提升了整体稳定性和安全性。对于需要跨云部署 AI 智能体的开发者来说，这是一个实用的更新。

AI产品 OpenShell Vertex AI 智能体推理 NVIDIA

推荐理由：OpenShell 新增 Vertex AI 支持，让多云 AI 智能体部署更灵活，做跨平台推理的团队可以直接用起来。

6月2日

03:02

03:02

rohanpaul_ai@rohanpaul_ai

精选

Intel 计划在年底前推出一款新的 AI 数据中心芯片，该芯片采用比 Nvidia 和 AMD 更便宜的内存和冷却技术。AI 热潮正从构建模型转向日常运行推理，Intel 的 Crescent Island 策略聚焦于推理场景，使用空气冷却和 LPDDR5 内存，而非液冷和高带宽内存。在 Gaudi 芯片未能突破后，Intel 选择了一个更窄的战场，以低成本优势切入推理市场。

AI产品 Intel AI 芯片推理数据中心低成本

推荐理由：Intel 的推理芯片策略瞄准了 AI 落地中成本敏感的环节，做数据中心部署或预算有限的团队值得关注，低成本方案可能改变选型格局。

5月24日

10:49

10:49

Gary Marcus@GaryMarcus

精选

Gary Marcus 在推文中指出，世界模型（world model）并非新概念，已在象棋程序、导航系统、维基百科等系统中存在多年，它们是对对象、地点、事件、机制等可推理内容的显式表示。然而，当前的大语言模型（LLM）缺乏这种显式世界模型。Marcus 强调，大多数世界模型是手工构建的，真正的挑战在于如何从数据中自动获取它们。这引发了关于AI系统如何更好地理解和推理世界的讨论。

AI模型世界模型 LLM 推理 Gary Marcus 知识表示

推荐理由：Marcus 点出了LLM的核心短板——缺乏显式世界模型，做AI推理和知识表示的开发者值得关注，看完会重新思考LLM的局限性。

5月20日

18:46

18:46

阿里云 Alibaba Cloud@alibaba_cloud

精选

阿里云宣布将于2026年举办Qwen Conference，主题议程聚焦AI原生云、智能体原生云架构、推理未来和多模态视觉技术。会议承诺无冗余内容，直接提供面向全球规模的工程蓝图。该会议旨在展示阿里云在AI基础设施和智能体领域的最新进展，为开发者和企业提供可落地的技术方案。目前已开放注册。

行业 AI原生云智能体推理多模态阿里云

推荐理由：阿里云首次将AI原生云和智能体原生云架构作为核心议题，做云原生和AI基础设施的团队可以提前了解工程蓝图，建议关注注册。