03:08vLLM@vllm_project精选72°Anyscale 与 Google Cloud GKE 合作推出 Ray Serve LLM 新版本,在 vLLM 基础上实现显著性能飞跃。预填密集型负载吞吐量提升 4.4 倍,解码密集型负载提升 24 倍。三个关键优化包括:控制平面端点选择器的直接流式传输、新的 vLLM Ray V2 执行器后端、以及基于 HAProxy 的 C 语言级路由。Ray 的容错、可观察性和跨 K8s/VM 可移植性为复杂推理部署奠定基础。AI模型Ray Serve LLMvLLMAnyscaleGoogle Cloud推理优化推荐理由:Anyscale 和 Google Cloud 联手让 vLLM 推理快了好几倍,预填负载快 4.4 倍,解码负载快 24 倍,用 Ray V2 执行器就能体验。原文
16:28marktechpost@Asif Razzaq精选Google Cloud发布Open Knowledge Format (OKF),一种供应商中立的Markdown规范,旨在让AI智能体获取经过策划的上下文知识。OKF采用bundle结构——包含YAML frontmatter的Markdown文件目录,每个概念只需指定type字段。该规范遵循三个核心设计原则,并附带参考实现工具。与传统的RAG(检索增强生成)不同,OKF强调知识的结构化与策划,而非纯向量检索。官方还提供了可运行的Python消费示例和交互式bundle探索工具。行业OKFGoogle CloudAI AgentMarkdownRAG推荐理由:Google Cloud搞了个OKF,用Markdown加YAML给AI Agent喂知识,比RAG更结构化。有代码和工具可直接上手。原文
21:59Decoder@Matthias Bastian精选Google Cloud 推出 Open Knowledge Format (OKF),一种将组织知识标准化为 Markdown 文件(含 YAML 元数据)的格式。该格式借鉴了 Andrej Karpathy 近期推广的“LLM Wiki”模式,旨在让 AI 智能体轻松读取和利用分散的文档。OKF 强调可移植性,支持将知识库转换为 AI 代理可处理的统一格式。AI产品Google CloudOpen Knowledge FormatMarkdown智能体知识管理推荐理由:让AI智能体读懂你的文档原文
03:41Patrick Loeber@patloeber在 Google Cloud Summit 捷克站,Pat Loebe 介绍了 Google DeepMind AI 栈,涵盖 Gemini 3.5、GenMedia 与音频模型、AI Studio 等工具、Interactions API 与 Managed Agents 智能体、Gemma 4 以及机器人技术。这展示了 Google 在 AI 领域的全面布局,从模型到工具再到智能体,为开发者和企业提供了完整的解决方案。AI产品Gemini 3.5智能体Google CloudGemma 4AI 工具2 个信源在谈推荐理由:想了解 Google AI 最新全家桶的开发者,这篇总结帮你快速抓住 Gemini 3.5、智能体 API 和 Gemma 4 的核心亮点,值得收藏。原文
10:54IT之家(博客/媒体)谷歌母公司 Alphabet 宣布进行 800 亿美元(约 5418 亿元人民币)的大额股权融资,用于投资 AI 基础设施与算力。融资包括 300 亿美元包销公开发行、400 亿美元按市值发行股票,以及伯克希尔·哈撒韦 100 亿美元私募投资。Alphabet 此前表示 2026 年资本支出将达 1800-1900 亿美元,2027 年还将显著提升。Google Cloud 在 2026 年 Q1 营收同比增长 63%,积压订单近 4600 亿美元,显示 AI 云服务需求强劲。此举表明 Alphabet 正全力押注 AI 基础设施,以应对算力需求爆发。行业AlphabetAI 基础设施算力融资Google Cloud4 个信源在谈推荐理由:Alphabet 用 800 亿美元真金白银押注 AI 算力,做云服务或大模型训练的团队值得关注——这笔钱将直接推动 Google Cloud 的扩张,可能影响未来 AI 基础设施的定价和竞争格局。原文
00:33Decoder@Maximilian SchreinerGoogle Cloud 发布了名为 AI Threat Defense 的新平台,旨在自动发现、评估并修复企业系统中的安全漏洞。该平台整合了 Google 通过收购获得的多项技术,以应对日益增多的 AI 加速网络攻击。其核心能力是能在几分钟内完成从检测到修补的闭环,大幅缩短传统安全响应时间。这一举措反映了云服务商正加速利用 AI 来对抗 AI 驱动的威胁,对依赖云基础设施的企业尤为重要。AI产品Google CloudAI 安全漏洞修复网络安全云安全推荐理由:安全团队终于有了能跟上 AI 攻击速度的工具——AI Threat Defense 把漏洞修复从小时级压缩到分钟级,做云安全运维的可以直接关注,减少被动挨打的窗口期。原文
22:24Decoder@Maximilian SchreinerGoogle Cloud COO Francis de Souza 呼吁企业从第一天起就将安全融入AI战略,而不仅仅是技术层面的考虑。他认为AI安全应成为董事会讨论的核心议题,而非仅由IT部门负责。这一观点强调了AI治理的重要性,尤其是在企业加速采用AI的背景下,安全漏洞可能带来重大商业风险。文章指出,企业需要建立跨部门的安全框架,确保AI系统的可信度和合规性。行业AI安全企业战略Google Cloud治理董事会推荐理由:AI安全不再是技术细节,而是企业战略问题——做AI部署的团队和决策者,建议把这条转给管理层看看。原文
08:01Andrew Ng@AndrewYNgAndrew Ng 宣布与 Google Cloud 合作推出新课程,教授如何构建能生成图像和视频的 AI 智能体。课程重点在于让智能体自我评估输出并迭代改进质量,涵盖三种评估技术:图像-文本相似度评分、LLM 裁判按品牌一致性等自定义标准评分、以及结构化评分表。学员将学习图像和视频提示工程,构建将品牌指南转化为 UI 模型的图像智能体,以及规划多场景解说视频并同步音频的视频智能体。该课程面向希望探索 AI 智能体在视觉内容生成领域应用的开发者。AI产品智能体图像生成视频生成评估技术Google Cloud推荐理由:Andrew Ng 的课程一向实用,这次聚焦图像/视频生成智能体这个少有人深入的方向,做多模态或内容生成的开发者可以直接学起来,掌握让智能体自我迭代的关键技巧。原文
07:59Logan Kilpatrick@OfficialLoganK72°Google 在 #GoogleIO 上发布了 Gemini Spark,一款 24/7 全天候个人 AI 代理。它运行在 Google Cloud 的专属虚拟机上,无需用户保持设备在线即可在后台执行长时间任务。Spark 基于 Gemini 3.5 和 Antigravity 构建,能无缝集成 Google 工具,并计划通过 MCP 支持第三方服务。全新 UI 在移动端和网页端同步更新,体验流畅。AI产品Gemini SparkAI 代理Google CloudMCP/工具Gemini 3.5推荐理由:Google 终于推出了真正意义上的 24/7 个人 AI 代理,做自动化工作流或重度 Google 用户可以直接用起来,后台跑任务不用再守着电脑。原文
07:32berryxia@berryxiaAnthropic 此前被认为“太危险”而不适合公开发布的 Claude Mythos 模型,突然出现在 Google Cloud Console 中,且 preview 标签已消失。这与之前 Opus 4.7 的发布路径一致——先在云控制台露面,随后正式落地。最合理的猜测是 Anthropic 不会直接推公开版,而是让已接入 GCP 的企业用户直接调用,在企业环境中运行。这一举动将“危险模型”的叙事直接反转,表明 Anthropic 正以最安静的方式将最强思考模型推向生产环境。AI产品Claude MythosAnthropicGoogle Cloud企业部署推理模型10 个信源在谈推荐理由:Anthropic 把之前说“太危险”的模型悄悄放到了 GCP 上,做企业级 AI 部署的团队可以直接关注——这可能是你最早拿到最强思考模型的渠道。原文
07:25TestingCatalog@testingcatalogAnthropic 的新模型 Claude Mythos 在 Google Cloud Console 中被发现,暗示该模型可能通过 GCP 提供给特定企业用户。目前尚不确定 Anthropic 是否会公开发布该模型,但可能作为模型提供商,让有权限的公司在其 GCP 环境中使用。这一发现引发了社区对 Anthropic 模型策略的关注,尤其是其与云平台的合作模式。AI模型Claude MythosAnthropicGoogle Cloud模型发布企业服务10 个信源在谈推荐理由:对于使用 GCP 的企业 AI 团队,这可能意味着获得更强大的 Claude 模型的新途径,值得关注 Anthropic 的云合作动态。原文
00:33Google Developers Blog(博客/媒体)Google Cloud 推出 Agents CLI,这是一个专为 AI Agent 开发设计的命令行工具,旨在弥合本地开发与生产部署之间的鸿沟。该工具为编码助手提供对 Google Cloud 全栈的机器可读访问,通过简化评估、基础设施配置和部署流程,将云上的开发周期从数周缩短至数小时。Agents CLI 整合了底层资源管理、模板框架和自动化验证,有效减少开发者的上下文切换和 token 浪费。这标志着主流云平台在 Agent 开发工具链上的重要进展,降低了 AI 应用从原型到上线的复杂度。AI产品Agent开发Google CloudCLI工具部署/工具链云原生推荐理由:对 AI 开发者和企业而言,Cloud原生 Agent 工具链的成熟将加速智能体应用的落地,减少手动编排基础设施的负担,值得关注其对 MCP 等标准生态的兼容性。原文
00:33Google Developers Blog(博客/媒体)Google Cloud推出新集成方案,通过fsspec接口将Rapid Storage与PyTorch直连,利用Colossus架构和双向gRPC流,实现最高15 TiB/s聚合吞吐量并显著降低延迟。开发者只需更新存储桶类型,无需修改代码即可使训练总时间缩短23%。该方案旨在消除AI训练中的数据加载瓶颈,提升大规模分布式训练效率。AI产品PyTorchGoogle Cloud存储优化训练加速fsspec推荐理由:对于依赖PyTorch进行大规模AI训练的团队,该方案提供了零代码改动的性能提升路径,验证了存储系统优化对训练效率的显著影响。原文