全部 AI 动态 · AI 热点

6月19日

03:08

vLLM@vllm_project

精选72°

Anyscale 与 Google Cloud GKE 合作推出 Ray Serve LLM 新版本，在 vLLM 基础上实现显著性能飞跃。预填密集型负载吞吐量提升 4.4 倍，解码密集型负载提升 24 倍。三个关键优化包括：控制平面端点选择器的直接流式传输、新的 vLLM Ray V2 执行器后端、以及基于 HAProxy 的 C 语言级路由。Ray 的容错、可观察性和跨 K8s/VM 可移植性为复杂推理部署奠定基础。

AI模型 Ray Serve LLM vLLM Anyscale Google Cloud 推理优化

推荐理由：Anyscale 和 Google Cloud 联手让 vLLM 推理快了好几倍，预填负载快 4.4 倍，解码负载快 24 倍，用 Ray V2 执行器就能体验。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

16:28

marktechpost@Asif Razzaq

精选

Google Cloud发布Open Knowledge Format (OKF)，一种供应商中立的Markdown规范，旨在让AI智能体获取经过策划的上下文知识。OKF采用bundle结构——包含YAML frontmatter的Markdown文件目录，每个概念只需指定type字段。该规范遵循三个核心设计原则，并附带参考实现工具。与传统的RAG（检索增强生成）不同，OKF强调知识的结构化与策划，而非纯向量检索。官方还提供了可运行的Python消费示例和交互式bundle探索工具。

行业 OKF Google Cloud AI Agent Markdown RAG

推荐理由：Google Cloud搞了个OKF，用Markdown加YAML给AI Agent喂知识，比RAG更结构化。有代码和工具可直接上手。

原文

6月14日

21:59

Decoder@Matthias Bastian

精选

Google Cloud 推出 Open Knowledge Format (OKF)，一种将组织知识标准化为 Markdown 文件（含 YAML 元数据）的格式。该格式借鉴了 Andrej Karpathy 近期推广的“LLM Wiki”模式，旨在让 AI 智能体轻松读取和利用分散的文档。OKF 强调可移植性，支持将知识库转换为 AI 代理可处理的统一格式。

AI产品 Google Cloud Open Knowledge Format Markdown 智能体知识管理

推荐理由：让AI智能体读懂你的文档

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

03:41

Patrick Loeber@patloeber

在 Google Cloud Summit 捷克站，Pat Loebe 介绍了 Google DeepMind AI 栈，涵盖 Gemini 3.5、GenMedia 与音频模型、AI Studio 等工具、Interactions API 与 Managed Agents 智能体、Gemma 4 以及机器人技术。这展示了 Google 在 AI 领域的全面布局，从模型到工具再到智能体，为开发者和企业提供了完整的解决方案。

AI产品 Gemini 3.5 智能体 Google Cloud Gemma 4 AI 工具

推荐理由：想了解 Google AI 最新全家桶的开发者，这篇总结帮你快速抓住 Gemini 3.5、智能体 API 和 Gemma 4 的核心亮点，值得收藏。

原文

6月2日

10:54

10:54IT之家（博客/媒体）

谷歌母公司 Alphabet 宣布进行 800 亿美元（约 5418 亿元人民币）的大额股权融资，用于投资 AI 基础设施与算力。融资包括 300 亿美元包销公开发行、400 亿美元按市值发行股票，以及伯克希尔·哈撒韦 100 亿美元私募投资。Alphabet 此前表示 2026 年资本支出将达 1800-1900 亿美元，2027 年还将显著提升。Google Cloud 在 2026 年 Q1 营收同比增长 63%，积压订单近 4600 亿美元，显示 AI 云服务需求强劲。此举表明 Alphabet 正全力押注 AI 基础设施，以应对算力需求爆发。

行业 Alphabet AI 基础设施算力融资 Google Cloud

推荐理由：Alphabet 用 800 亿美元真金白银押注 AI 算力，做云服务或大模型训练的团队值得关注——这笔钱将直接推动 Google Cloud 的扩张，可能影响未来 AI 基础设施的定价和竞争格局。

原文

5月29日

00:33

Decoder@Maximilian Schreiner

Google Cloud 发布了名为 AI Threat Defense 的新平台，旨在自动发现、评估并修复企业系统中的安全漏洞。该平台整合了 Google 通过收购获得的多项技术，以应对日益增多的 AI 加速网络攻击。其核心能力是能在几分钟内完成从检测到修补的闭环，大幅缩短传统安全响应时间。这一举措反映了云服务商正加速利用 AI 来对抗 AI 驱动的威胁，对依赖云基础设施的企业尤为重要。

AI产品 Google Cloud AI 安全漏洞修复网络安全云安全

推荐理由：安全团队终于有了能跟上 AI 攻击速度的工具——AI Threat Defense 把漏洞修复从小时级压缩到分钟级，做云安全运维的可以直接关注，减少被动挨打的窗口期。

原文

5月26日

22:24

Decoder@Maximilian Schreiner

Google Cloud COO Francis de Souza 呼吁企业从第一天起就将安全融入AI战略，而不仅仅是技术层面的考虑。他认为AI安全应成为董事会讨论的核心议题，而非仅由IT部门负责。这一观点强调了AI治理的重要性，尤其是在企业加速采用AI的背景下，安全漏洞可能带来重大商业风险。文章指出，企业需要建立跨部门的安全框架，确保AI系统的可信度和合规性。

行业 AI安全企业战略 Google Cloud 治理董事会

推荐理由：AI安全不再是技术细节，而是企业战略问题——做AI部署的团队和决策者，建议把这条转给管理层看看。

原文

5月21日

08:01

Andrew Ng@AndrewYNg

Andrew Ng 宣布与 Google Cloud 合作推出新课程，教授如何构建能生成图像和视频的 AI 智能体。课程重点在于让智能体自我评估输出并迭代改进质量，涵盖三种评估技术：图像-文本相似度评分、LLM 裁判按品牌一致性等自定义标准评分、以及结构化评分表。学员将学习图像和视频提示工程，构建将品牌指南转化为 UI 模型的图像智能体，以及规划多场景解说视频并同步音频的视频智能体。该课程面向希望探索 AI 智能体在视觉内容生成领域应用的开发者。

AI产品智能体图像生成视频生成评估技术 Google Cloud

推荐理由：Andrew Ng 的课程一向实用，这次聚焦图像/视频生成智能体这个少有人深入的方向，做多模态或内容生成的开发者可以直接学起来，掌握让智能体自我迭代的关键技巧。

原文

07:59

Logan Kilpatrick@OfficialLoganK

72°

Google 在 #GoogleIO 上发布了 Gemini Spark，一款 24/7 全天候个人 AI 代理。它运行在 Google Cloud 的专属虚拟机上，无需用户保持设备在线即可在后台执行长时间任务。Spark 基于 Gemini 3.5 和 Antigravity 构建，能无缝集成 Google 工具，并计划通过 MCP 支持第三方服务。全新 UI 在移动端和网页端同步更新，体验流畅。

AI产品 Gemini Spark AI 代理 Google Cloud MCP/工具 Gemini 3.5

推荐理由：Google 终于推出了真正意义上的 24/7 个人 AI 代理，做自动化工作流或重度 Google 用户可以直接用起来，后台跑任务不用再守着电脑。

原文

5月17日

07:32

berryxia@berryxia

Anthropic 此前被认为“太危险”而不适合公开发布的 Claude Mythos 模型，突然出现在 Google Cloud Console 中，且 preview 标签已消失。这与之前 Opus 4.7 的发布路径一致——先在云控制台露面，随后正式落地。最合理的猜测是 Anthropic 不会直接推公开版，而是让已接入 GCP 的企业用户直接调用，在企业环境中运行。这一举动将“危险模型”的叙事直接反转，表明 Anthropic 正以最安静的方式将最强思考模型推向生产环境。

AI产品 Claude Mythos Anthropic Google Cloud 企业部署推理模型

推荐理由：Anthropic 把之前说“太危险”的模型悄悄放到了 GCP 上，做企业级 AI 部署的团队可以直接关注——这可能是你最早拿到最强思考模型的渠道。

原文

07:25

TestingCatalog@testingcatalog

Anthropic 的新模型 Claude Mythos 在 Google Cloud Console 中被发现，暗示该模型可能通过 GCP 提供给特定企业用户。目前尚不确定 Anthropic 是否会公开发布该模型，但可能作为模型提供商，让有权限的公司在其 GCP 环境中使用。这一发现引发了社区对 Anthropic 模型策略的关注，尤其是其与云平台的合作模式。

AI模型 Claude Mythos Anthropic Google Cloud 模型发布企业服务

推荐理由：对于使用 GCP 的企业 AI 团队，这可能意味着获得更强大的 Claude 模型的新途径，值得关注 Anthropic 的云合作动态。

原文

5月13日

00:33

00:33Google Developers Blog（博客/媒体）

Google Cloud 推出 Agents CLI，这是一个专为 AI Agent 开发设计的命令行工具，旨在弥合本地开发与生产部署之间的鸿沟。该工具为编码助手提供对 Google Cloud 全栈的机器可读访问，通过简化评估、基础设施配置和部署流程，将云上的开发周期从数周缩短至数小时。Agents CLI 整合了底层资源管理、模板框架和自动化验证，有效减少开发者的上下文切换和 token 浪费。这标志着主流云平台在 Agent 开发工具链上的重要进展，降低了 AI 应用从原型到上线的复杂度。

AI产品 Agent开发 Google Cloud CLI工具部署/工具链云原生

推荐理由：对 AI 开发者和企业而言，Cloud原生 Agent 工具链的成熟将加速智能体应用的落地，减少手动编排基础设施的负担，值得关注其对 MCP 等标准生态的兼容性。

原文

00:33

00:33Google Developers Blog（博客/媒体）

Google Cloud推出新集成方案，通过fsspec接口将Rapid Storage与PyTorch直连，利用Colossus架构和双向gRPC流，实现最高15 TiB/s聚合吞吐量并显著降低延迟。开发者只需更新存储桶类型，无需修改代码即可使训练总时间缩短23%。该方案旨在消除AI训练中的数据加载瓶颈，提升大规模分布式训练效率。

AI产品 PyTorch Google Cloud 存储优化训练加速 fsspec

推荐理由：对于依赖PyTorch进行大规模AI训练的团队，该方案提供了零代码改动的性能提升路径，验证了存储系统优化对训练效率的显著影响。

原文