全部 AI 动态 · AI 热点

6月29日

13:51

Together AI@togethercompute

Together AI 宣布其处理 token 量已达 400 万亿，认为这标志着开放模型在真实生产中进入规模采用阶段。团队将实际工作负载迁移到开放模型，是为了获得前沿质量、更好的 tokenomics 和更强的推理控制力。Together AI 提供基础设施支持这一转型。

行业 Together AI 开放模型 tokenomics 推理生产部署

推荐理由：400万亿 token 的量级，说明开放模型在真实生产里站稳了，看 Together AI 怎么搭台子。

原文

6月26日

23:57

LangChain@LangChainAI

LangChain 将于6月29日至7月2日在旧金山 AI Engineer World's Fair 设展台（U-G19）。团队将现场交流生产环境中智能体工作流及评估设置。欢迎参会者前往探讨实际部署与评测方案。

行业 LangChain AI Engineer World's Fair 智能体评估生产部署

推荐理由：LangChain 团队在旧金山 AI Fair 设摊，聊聊智能体生产部署和评估，想去交流的记得去 U-G19 找他们。

原文

6月18日

22:19

LangChain@LangChainAI

LangChain 在 X 上宣布推出 Managed Deep Agents，旨在解决 AI Agent 从构建到生产部署的痛点。该服务让团队可以专注于 Agent 行为逻辑，无需重复构建运行时基础设施。LangChain 认为构建有用 Agent 正变得更简单，但生产运行仍困难，Managed Deep Agents 正是为此设计。

AI产品 LangChain Agent 生产部署工具

推荐理由：LangChain 出了个新服务，帮你省掉自己搭Agent运行环境的麻烦，直接聚焦业务逻辑，适合做Agent应用的团队看看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

18:04

阿里云 Alibaba Cloud@alibaba_cloud

阿里云将于6月25日晚6-9点在伦敦Tessl举办面向工程师的Agentic AI活动，聚焦生产级智能体系统的构建与部署。活动为工程导向，邀请实际搭建智能体系统的开发者参与。参与者可现场提问交流。

行业 Alibaba Cloud Agentic AI 智能体生产部署

推荐理由：阿里云要在伦敦办Agentic AI的线下活动了，面向真实做智能体系统的工程师，能直接问问题聊落地，适合想搞生产级的同学去瞅瞅。

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

03:02

LangChain@LangChainAI

精选

LangChain 发布 Agentic Operating Model 框架，旨在解决企业 AI 智能体在生产环境中面临的可靠性、可治理性和持续改进问题。该框架聚焦于智能体部署后的运维阶段，帮助团队建立监控、治理和迭代机制。LangChain 指出，将智能体投入生产相对容易，但长期保持其稳定运行和持续优化才是企业 AI 项目的真正瓶颈。

AI产品智能体生产部署运维治理 LangChain 企业AI

推荐理由：做企业级 AI 智能体部署的团队终于有了运维层面的系统框架——LangChain 的 Agentic Operating Model 直接戳中生产环境治理痛点，建议正在或即将上线智能体的团队点开看看。

原文

6月11日

22:43

LangChain@LangChainAI

LangChain 发布了一篇博客，深入介绍了如何以最快速度将 Deep Agent 部署到生产环境。文章分享了关键架构决策、工具链选择和最佳实践，帮助开发者避免常见陷阱。核心亮点包括如何利用 LangGraph 构建可靠的多步骤 Agent，以及如何通过监控和回滚机制确保生产稳定性。对于正在构建或计划部署 AI Agent 的团队来说，这是一份实用的实战指南。

AI产品 LangChain Deep Agent 生产部署 LangGraph AI Agent

推荐理由：LangChain 团队把生产级 Deep Agent 的部署经验浓缩成了一篇实战指南，做 Agent 落地的开发者直接拿来就能少踩坑，值得收藏。

原文

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

06:19

LangChain@LangChainAI

Nebius 发布了 Agent Blueprint，这是一个开源参考架构，旨在解决 AI 智能体在生产环境中因基础设施问题而失败的问题。该架构连接了智能体栈各层的成熟组件，包括 Deep Agents 和 LangSmith。它提供了构建、运营和持续改进生产级智能体的标准化方案，帮助开发者避免常见陷阱。对于正在构建或计划部署 AI 智能体的团队来说，这是一个值得关注的参考框架。

行业智能体开源/仓库生产部署 Nebius LangSmith

推荐理由：智能体部署失败往往出在基础设施而非模型本身，Nebius 的开源架构直接给出了生产级参考方案，做智能体开发的团队可以拿来就用，省去自己踩坑的时间。

原文

6月9日

05:15

LangChain@LangChainAI

LangChain 创始人 Harrison Chase 在推文中指出，开发智能体不应追求完美，而应尽早发布、有意测试、监控真实行为，并利用生产环境中的学习来改进下一版本。他将于 6 月 24 日分享团队如何应用智能体开发生命周期（Agent Development Lifecycle）来构建生产级智能体。这一理念强调了快速迭代和持续学习的重要性，对正在开发或部署 AI 智能体的团队具有直接指导意义。

AI产品智能体开发方法论 LangChain 生产部署迭代开发

推荐理由：做智能体开发的团队别再纠结完美了——LangChain 创始人亲自拆解从发布到迭代的实战方法，6 月 24 日的分享值得蹲守。

原文

05:12

LangChain@LangChainAI

LangChain 指出，虽然很多团队都想发布 AI Agent，但真正在生产中让 Agent 稳定运行的团队，并不将其视为一次性实验或孤立项目。他们构建的是一个可重复的系统，涵盖构建、测试、部署、监控和改进五个阶段，即 Agent 开发生命周期。这一方法论强调持续迭代和系统化流程，而非一次性交付。对于正在或计划将 Agent 投入生产的团队来说，这是值得参考的工程实践。

行业智能体生产部署开发流程 LangChain 工程实践

推荐理由：LangChain 把 Agent 从实验到生产的工程化路径讲清楚了，做 AI 应用落地的团队可以直接对照自己的流程，看看缺了哪一环。

原文

6月4日

03:14

LangChain@LangChainAI

LangChain 推出 Managed Deep Agents，结合开源 Deep Agents 框架与 LangSmith 平台，提供持久化执行、托管上下文、沙箱工作流和可观测性。这一方案让开发者既能利用开源框架的灵活性，又能享受托管平台的稳定性和监控能力，适合需要可靠 AI 代理的生产环境。

AI产品智能体 LangChain LangSmith 开源/仓库生产部署

推荐理由：做 AI 代理的团队终于不用在灵活性和稳定性之间二选一了——开源框架 + 托管平台，生产部署可以直接用。

原文

6月3日

22:13

LangChain@LangChainAI

在Interrupt大会上，思科客户体验部门的首席架构师Carlos Pereira分享了他们如何利用LangChain构建一个AI队友来支持CX团队。该AI队友旨在提升客户支持效率，解决企业级Agent在生产环境中的部署和运行挑战。演讲涵盖了架构决策、经验教训以及大规模运行Agent所需的关键要素。这为其他企业构建和落地AI Agent提供了宝贵的参考案例。

行业智能体 LangChain 企业级应用客户体验生产部署

推荐理由：思科CX团队的企业级Agent落地经验，对正在或计划将AI Agent投入生产的团队极具参考价值，建议点开了解架构决策和避坑指南。

原文

10:51

Weaviate@weaviate_io

精选

Weaviate 指出，RAG Agent 在生产环境中的成败不取决于模型，而取决于系统设计的四个基础层：安全、检索、指令和护栏。许多团队止步于演示阶段，但实际部署中会出现幻觉、输出不一致、安全漏洞等问题。可靠的 Agent 需要在这些层面进行严格设计，才能从演示变成真正可信的系统。文章提供了免费技术指南，涵盖高级 RAG 技术、工作流架构和安全实践。

AI产品 RAG Agent 系统设计安全生产部署

推荐理由：做 RAG 应用的团队别再只盯着模型了——这篇把生产环境踩坑的四个关键层讲透了，建议做 Agent 架构的开发者点开看看，能省不少试错成本。

原文

6月2日

10:05

Harrison Chase@hwchase17

精选

LangChain 联合创始人 Harrison Chase 在推文中分享了 DeepAgents 的全面概述，包括其定义、在复杂任务上的优势以及如何快速投入生产。Sydney Runkle 通过视频详细介绍了 DeepAgents 的核心概念、使其擅长复杂任务的关键设计，以及轻松将其部署到生产环境的方法。该内容对希望构建和部署高级 AI 代理的开发者具有重要参考价值。

AI产品 DeepAgents 智能体生产部署复杂任务 LangChain

推荐理由：想了解如何构建能处理复杂任务的 AI 代理并快速上线？这个概述直接点出了 DeepAgents 的核心优势和生产路径，做智能体开发的团队值得一看。

原文

5月30日

22:33

AI Notkilleveryone@ai_zona

精选

AI 代理系统在生产环境中运行时，如果没有适当的控制机制，可能会执行意外或有害的操作。审批门（Approval gates）是一种关键但常被低估的功能，它允许人类在代理执行关键操作前进行审核和批准。本文解释了为什么每个生产级 AI 代理部署都需要审批门，以及如何实现它们来确保安全性和可控性。

AI产品 AI代理审批门生产部署安全性可控性

推荐理由：做 AI 代理系统部署的团队，审批门能防止代理失控造成损失，建议立即检查你的系统是否具备这一功能。

原文

22:31

AI Notkilleveryone@ai_zona

AI Zona在X上发起讨论，询问开发者是否愿意在没有治理机制（如审批门、审计追踪、信任评分、升级规则）的情况下将AI Agent部署到生产环境。该问题触及AI Agent落地的核心安全与合规痛点，引发社区对LLMOps最佳实践的反思。关键细节在于，缺乏治理可能导致不可控行为、数据泄露或决策错误，而信任评分和升级规则是降低风险的关键手段。

行业 AI Agent 治理 LLMOps 生产部署安全合规

推荐理由：AI Agent部署的治理问题直接关系到生产环境的安全与可靠性，做Agent落地的团队必须考虑审批门和审计追踪，否则风险不可控。建议点开看看社区怎么选，能帮你避开常见坑。

原文

5月28日

19:58

Dify@dify_ai

企业AI项目常卡在实验与生产之间：团队快速推进AI，而IT部门却要管理治理、安全、成本和长期可靠性。当AI采用速度超过治理能力时，Shadow AI（影子AI）就会填补空白——分散的工具、一次性脚本、无法审计或扩展的流程。Dify提供了一个共享平台层，将AI想法转化为可维护的工作流，专为生产环境而非仅演示而构建。这解决了企业AI落地中的治理与扩展痛点。

AI产品 Dify 企业AI AI治理生产部署平台层

推荐理由：企业AI团队和IT管理者终于有了一个平台层方案来治理Shadow AI——Dify让AI想法变成可维护的生产工作流，做AI落地的团队可以直接试试。

原文

5月27日

22:01

LangChain@LangChainAI

LangChain 团队宣布将参加 6 月 4 日在纽约举办的生成式 AI 峰会。该峰会聚集了 500 多名工程师、开发者和技术领导者，聚焦于将 AI 系统从原型可靠地部署到生产环境。活动旨在帮助开发者解决原型与规模化部署之间的差距问题。LangChain 团队将在现场设展并举办分享环节，与参会者交流实际构建经验。

行业 LangChain 生成式 AI 峰会生产部署纽约

推荐理由：如果你正在为 AI 原型到生产部署的鸿沟头疼，这场峰会就是为你准备的——500+ 技术同行和 LangChain 团队都在现场，值得去聊聊实际落地的坑与解法。

原文

11:22

LangChain@LangChainAI

精选

LangChain 的 Adam Łucek 分享了如何利用 Agent 运行时的 Trace 数据来构建生产级评估。Trace 数据记录了 Agent 的输入、输出、执行步骤和元数据，是优化 Agent 行为的关键。通过分析 Trace，可以识别低效环节，并用于构建更复杂的评估体系。文章介绍了两种利用 Trace 构建评估的具体方法，帮助团队快速迭代和提升 Agent 的可靠性。

AI产品 Agent Trace 评估 LangChain 生产部署

推荐理由：做 Agent 开发的团队终于有了可落地的评估方法论——Trace 数据不再是日志垃圾，而是构建评估的黄金矿，建议做生产级 Agent 的开发者点开看看具体怎么用。

原文

5月26日

15:02

阿里云 Alibaba Cloud@alibaba_cloud

83°

阿里云宣布其 Qwen3.7-Max 模型在 Code Arena 评测中以 1541 分位列全球第二，仅次于 Claude。该模型专为生产环境设计，支持连续运行 35 小时任务、执行 1000 次以上工具调用，能将原本两周的项目缩短至数小时完成。这标志着国产大模型在编程领域取得重要突破，为开发者提供了高性能的替代选择。

AI模型 Qwen3.7-Max 编程模型 Code Arena 阿里云生产部署

推荐理由：Qwen3.7-Max 在编程能力上逼近 Claude，做自动化脚本或复杂项目开发的团队可以试试，能显著缩短交付周期。

原文

5月24日

00:03

elvis@omarsar0

精选

一篇新论文提出一种不修改模型、只调整运行时接口（Harness）的方法，将重复交互失败转化为可复用的干预措施。在 7 个确定性环境、126 个模型-环境设置和 18 个基座模型上，该方法平均相对提升 88.5%。从一个模型轨迹学到的 Harness 可泛化到其他 17 个基座模型，说明它捕获的是环境结构而非模型特定模式。这对生产环境中部署智能体的团队有直接参考价值。

论文智能体 Harness/接口泛化性生产部署论文

推荐理由：做智能体工程化的团队会发现，你的 Harness 工作比想象中更可迁移——不用反复调模型，改接口就能显著提升性能，值得点开看具体实现。

原文

5月22日

08:05

LangChain@LangChainAI

AI产品 LangChain LangSmith 智能体监控生产部署

推荐理由：生产环境智能体监控是很多团队头疼的问题，LangSmith 给出了成本、质量、延迟一体的方案，做 AI 应用运维的开发者可以直接学起来。

原文

08:05

LangChain@LangChainAI

LangChain 在推文中指出，构建智能体（Agent）最残酷的现实是：在投入生产环境之前，你根本无法预知它的行为。这意味着开发者必须重视生产环境下的测试与监控，而非仅依赖开发阶段的模拟。这一观点强调了智能体在实际部署中的不可预测性，对构建可靠 AI 系统的团队具有重要警示意义。

行业智能体生产部署测试 LangChain 可靠性

推荐理由：做智能体开发的团队都会遇到这个痛点——开发环境跑得好好的，一上线就翻车。LangChain 点出了这个行业共识，值得所有 Agent 开发者停下来反思自己的测试流程。

原文

5月20日

18:48

阿里云 Alibaba Cloud@alibaba_cloud

阿里云推出MSE AI Scheduler，旨在解决开源Agent在可用性、运维成本和可观测性方面的痛点。该工具提供高可用分布式调度、统一管理与细粒度权限、弹性伸缩以降低成本，以及全链路可观测性。它支持OpenClaw、Dify等主流框架，目前免费公测中。对于需要将AI Agent投入生产环境的团队，这是一个值得关注的解决方案。

AI产品阿里云 MSE AI Agent 分布式调度生产部署

推荐理由：做AI Agent落地的团队终于有了生产级调度方案——MSE AI Scheduler解决了开源方案可用性低、运维成本高的痛点，做Agent部署的可以直接申请免费公测。

原文

04:42

claudedevs@claudedevs

88°

Claude 的 Computer use 功能使其能够像人类一样操作真实用户界面。一篇新博客文章详细介绍了如何让该功能在生产环境中更可靠，包括提高点击精度、选择思考努力级别、在长会话中保持上下文，以及录制 Claude 可回放的演示。这些技巧对于构建自动化工作流的开发者至关重要。

AI产品 Claude Computer use 智能体 UI自动化生产部署

推荐理由：做 UI 自动化的开发者终于有了可靠的生产级方案——这篇博客直接给出了点击精度和上下文管理的实操技巧，值得收藏。

原文

5月16日

23:04

Fireworks AI@FireworksAI_HQ

Fireworks AI 宣布与 Azure AI Foundry 集成，为团队提供生产级推理层，解决前沿模型在延迟、吞吐量和治理方面的约束。该服务帮助团队在规模化运行模型时避免常见瓶颈。Fireworks AI 的推理优化与 Azure 的云基础设施结合，适合需要高性能和合规性的企业场景。

AI产品推理模型 Fireworks AI Azure AI Foundry 生产部署企业级

推荐理由：做 AI 推理部署的团队终于有了兼顾性能和治理的选项——Fireworks AI 在 Azure 上直接可用，建议有生产环境需求的点开看看。

原文

5月14日

13:36

Mistral AI@MistralAI

Mistral AI 今日推出 Workflows 公开预览版，这是一个面向企业 AI 的编排层。它解决了企业团队拥有强大模型但无法在生产中可靠运行的问题，将 AI 驱动的业务流程从原型推进到生产，提供生产所需的持久性、可观测性和容错能力。ASML、ABANCA、CMA-CGM、France Travail、La Banque Postale、Moeve 等领先组织已在使用 Workflows 自动化关键流程。

AI产品 Mistral AI Workflows 企业AI 编排层生产部署

推荐理由：企业 AI 落地最大的坑是模型跑得通但生产跑不稳——Mistral 的 Workflows 直接填了这个坑，做 AI 工程化或企业自动化的团队值得关注，尤其是那些被模型可靠性折磨的团队。

原文

5月13日

00:33

00:33Google Developers Blog（博客/媒体）

谷歌发布 ADK Go 1.0，将 AI 智能体开发从实验性脚本转向生产级服务。新版本原生集成 OpenTelemetry 实现深度追踪、新增插件系统支持自愈逻辑，并引入“人在回路”确认机制保障敏感操作安全。同时支持 YAML 配置快速迭代，并优化 Agent2Agent（A2A）协议实现跨语言通信。此次更新让开发者能基于 Golang 的高性能工程标准构建可靠的多智能体系统。

AI产品智能体 ADK Go 可观测性 A2A协议生产部署

推荐理由：该版本补齐了 AI 智能体在生产环境中的可观测性、安全性和可维护性短板，对 Golang 技术栈构建复杂多智能体系统的团队意义重大。

原文

00:33

00:33Google Developers Blog（博客/媒体）

70°

Google Cloud AI Agent Bake-Off强调从提示工程转向严格的智能体工程，生产级AI需模块化、多智能体架构。文章提出五条关键建议：将复杂任务分解为专用子智能体，用确定性代码执行避免概率性错误，优先支持多模态和开源协议（如MCP），确保智能体可扩展、可集成，适应模型快速演进。

AI产品智能体 MCP/工具架构设计多模态生产部署

推荐理由：这些技巧直接来自Google Cloud的实战经验，为开发者构建可靠、可维护的AI智能体提供了具体方法论，对行业从原型到落地的工程实践有重要参考价值。

原文

5月11日

22:17

Together AI@togethercompute

Together AI 推理高级总监 Yineng Zhang 将于 5 月 16 日在 PyCon US 发表演讲，主题为生产环境中 LLM 推理的实战经验。他将讲解 Python 在推理运行时优化中的实际作用、真实部署中遇到的挑战及解决方案，以及大规模推理引擎的新设计方向。该演讲定于美国时间 5 月 16 日 17:00-17:30 在 Grand Ballroom A 举行，适合正在优化推理性能的从业者关注。

行业 LLM推理生产部署 Python Together AI PyCon

推荐理由：该演讲聚焦于真实部署中的推理优化和引擎设计，对于从事 LLM 服务化、推理加速的工程师和架构师具有直接参考价值。

原文