全部 AI 动态 · AI 热点

6月30日

02:47

AWS Machine Learning Blog@Enrique Salgado Hernández

精选

本文介绍了Amazon QuickSight中BI资产的备份最佳实践。首先讲解如何选择需要备份的资产（如仪表板、数据集等）。然后说明可用的API（如ListDashboards、CreateDashboard）用于备份操作。最后提供示例代码帮助快速实现备份流程。

推荐理由：AWS教你备份QuickSight资产，有代码示例，照着做就能避免数据丢失。

原文

01:58

AWS Machine Learning Blog@Anuranjan Mondal

精选

PAR 在 AWS 上构建了一个生产级多租户 LLM 分析系统，通过三层架构强制执行行级安全：使用 AWS SigV4 进行加密请求签名、在 Amazon Bedrock 上进行语义验证、以及通过 Split-Plane SQL 实现程序化数据隔离。每层独立运行以降低跨租户数据暴露风险，即使 LLM 本身被攻破或操纵也能保护数据。

技巧 AWS Amazon Bedrock 多租户行级安全 AI安全

推荐理由：AWS 这篇教程手把手教你用 Bedrock 和 Split-Plane SQL 搭建多租户 LLM 分析系统，三层隔离防止数据泄露，值得做企业级 AI 安全的开发者看看。

原文

01:57

AWS Machine Learning Blog@Sanghwa Na

精选

AWS 博客展示如何用 Amazon Nova 2 Lite 和 Claude Sonnet 4.6 构建两模型管道，用于扫描文档的数字化。Nova 2 Lite 在单次调用中完成多模态提取（检测照片、提取姓名坐标、返回页面元数据）。Claude Sonnet 4.6 根据版面布局进行空间推理，将姓名和面孔匹配。该管道在 Amazon Bedrock 上运行，通过分工降低总处理成本。

技巧 Amazon Nova 2 Lite Claude Sonnet 4.6 Amazon Bedrock 文档数字化多模态

推荐理由：用 Nova 2 Lite 做粗提取，Claude Sonnet 4.6 做精准匹配，文档数字化省心又省钱。

原文

01:56

AWS Machine Learning Blog@Troy Parrett

精选

本教程展示如何结合Amazon Bedrock Data Automation自动提取医疗理赔表单数据，再通过Amazon Bedrock AgentCore托管AI代理进行验证并转换为FHIR资源存入AWS HealthLake。该端到端工作流可减少人工处理流程，同时通过自动化校验保持数据准确性。文中逐步讲解每个组件的配置与集成方法。

技巧 Amazon Bedrock AWS HealthLake FHIR 智能体医疗数据

推荐理由：AWS官方手把手教你搭医疗理赔流水线，用Bedrock自动抽数据、转FHIR格式存HealthLake，能省不少人工核对时间。

原文

01:33

AWS Machine Learning Blog@Joshua Lacy

精选

本文介绍如何使用Amazon Bedrock AgentCore的内置可观测性功能调试生产环境中的智能体故障。文章涵盖常见的故障模式，如无限循环和工具调用失败。通过追踪和指标分析智能体行为，并提供结构化工作流来解决问题。本文是两部分系列的第一部分，第二部分将讨论性能优化和内存管理。

技巧 Amazon Bedrock AgentCore 可观测性智能体工具调用

推荐理由：AWS博客教你用Bedrock AgentCore内置观察功能排查生产智能体故障，比如无限循环和工具调用失败，省去自己搭建监控的麻烦。

原文

6月29日

23:12

berryxia@berryxia

Margot Van Laar在Code with Claude大会上分享提示词工程实战，核心观点是生产提示词调试维护比从零写更重要。她展示客服机器人场景：团队发现旧模型遗留的'禁止列表'指令导致新模型过度拟合，以及'请仔细计算'无效需提供计算器工具。在零售排班Agent场景中，她将复杂提示词拆成三个简单提示词（生成、评估、修复）组成循环，比单一大提示词更稳定。她强调可用Opus等更强推理模型加自适应思考来简化提示词，并务必建立量化评估基准验证改动效果。

技巧 Anthropic Claude 提示词工程评估提示词维护

推荐理由：Anthropic工程师手把手教你维护生产提示词，从客服机器人到排班Agent，拆成小提示词更靠谱，还有评估妙招。

原文

23:10

berryxia@berryxia

精选

Anthropic工程师Margot Van Laar在Code with Claude分享提示词工程最佳实践，强调通过评估（Eval）而非直接修改提示词来优化。她用客服机器人和零售排班两个案例演示：使用XML标签结构化提示词、移除旧模型遗留的禁止列表（如Claude 3 Opus）、用工具替代指令处理计算任务。拆解复杂任务为生成-评估-修复循环，并建议用更强推理模型（如Opus）加自适应思考替代小模型复杂提示词。

技巧提示词工程 Claude 评估 Claude Opus 工作流

推荐理由：Anthropic工程师手把手教你怎么调客服提示词和搭Agent，用Opus加循环拆解比堆复杂指令更管用，核心就一句话：先搞评估

原文

20:05

@zarazhangrui@zarazhangrui

一位创业者分享经验：每花1小时构建产品，应投入2小时用于解释、演示、销售和教学。这一比例强调产品需要持续向外界传达并基于用户反馈迭代。指出将时间优先花在传播和沟通上，是产品成功的关键。该观点源自与现实的接触和不断打磨。

技巧产品开发推广技巧创业经验时间管理

推荐理由：别只顾码代码，花两倍时间去推销和教学，这才是让产品落地的硬道理。

原文

18:57

vLLM@vllm_project

精选

NVIDIA 与 vLLM 合作发布 step-by-step 指南，教你用四台 DGX Spark 盒子组建私有集群，自托管 550B 参数的 Nemotron-3-Ultra 模型。指南基于 vLLM 官方容器，可提供兼容 OpenAI 的端点。无需数据中心，适合构建私有 agent 工作流。

技巧 Nemotron-3-Ultra NVIDIA DGX Spark vLLM 自托管

推荐理由：想不依赖数据中心自己跑 550B 模型？NVIDIA 出了详细教程，四台 DGX Spark 就能拼出 OpenAI 兼容的端点。

原文

14:55

宝玉@dotey

有用户发现，在 Codex 应用中将模型选为 GPT-5.5 并设置推理为 xhigh 后，运行 Juice 测试 Prompt 若返回 128 则实际使用的是 GPT 5.6 Sol，否则返回 768 就是 GPT 5.5。该 Prompt 要求模型输出 Juice 数除以2乘10再除以5的结果。目前测试仍返回 768，说明多数用户尚未灰度到 GPT 5.6 Sol。

技巧 GPT 5.6 Sol GPT 5.5 提示词工程推理模型

推荐理由：想提前知道自己的 GPT 5.5 是不是偷偷升级了？用这个 Juice 测试 Prompt 一试便知，很简单。

原文

13:58

Ate-a-Pi@svpino

这个开源项目允许你录制浏览器操作，系统会自动清理录制内容，移除重试、死路和页面特定细节。然后它只保留任务逻辑而非具体点击，将其转化为可复用的技能。最后这些技能被组织成技能图谱，智能体可检索用于相关新任务。整个过程完全开源。

技巧开源浏览器自动化智能体技能图谱工作流

推荐理由：有个开源项目能录制你在浏览器里做的事，自动变成可复用的技能，还能让智能体直接调用，省去重复劳动。

原文

13:52

EleutherAI@AiEleuther

EleutherAI在ICML 2024会议上发布了参会指南。指南包含了他们在会议期间的展位和演讲安排。参会者可通过链接获取详细位置信息。

技巧 EleutherAI ICML 开源模型活动指南

推荐理由：EleutherAI发了他们在ICML的定位指南，想去现场找他们的可以看看，免得错过。

原文

13:51

Together AI@togethercompute

Together AI 工程师将在 AI Engineer World’s Fair 举办 hands-on workshop，讨论 Agentic Coding 如何改变推理引擎需求。workshop 将讲解推理引擎的工作原理及服务生产级 agentic workloads 的要点。活动时间为6月29日上午9-11点，地点在 Room 2020。

技巧 Together AI AI Engineer World’s Fair agentic coding 推理引擎智能体

推荐理由：想了解 agentic coding 对推理引擎的新要求？Together AI 的这个实操 workshop 直接带你上手，时间是6月29日上午。

原文

13:51

Jasper AI@heyjasperai

Jasper将Hugging Face基础设施用于其MONET系统的数据创建和存储。该方法针对随时间更新的大型训练数据集进行了优化。Jasper团队通过HF实现了更高效的数据管道管理。这一案例展示了HF在训练数据工作流中的实际应用。

技巧 Jasper Hugging Face MONET 数据管道模型训练

推荐理由：看看Jasper怎么用Hugging Face当MONET的数据后台，对做大模型训练数据管道的团队很有启发。

原文

13:50

François Chollet@fchollet

François Chollet（Keras创建者）在推文中指出编程不是关于代码，而是通过抽象层管理复杂性的艺术。他认为编程的核心在于构建函数、类等抽象层来降低认知负荷。AI在这一框架下仅是一种新的抽象工具，不应被过度神化。这一观点提醒程序员更关注架构设计而非语法细节。

技巧 François Chollet Keras 抽象层编程思想

推荐理由：Chollet一句话点醒你：编程不是写代码，是搭抽象层。别把AI太当回事。

原文

13:50

François Chollet@fchollet

精选

François Chollet 指出，智能体编程（Agentic coding）迫使开发者设计清晰的 API 接口并编写完整的文档字符串。AI 代理无法阅读团队内部的隐式心理模型，只能依赖显式的 API 合约和 docstring。这要求接口规范必须精确、无歧义，文档覆盖所有输入/输出场景。对工程团队而言，这意味着需要投入更多时间在接口形式化设计上。

技巧 Agentic coding API设计文档字符串智能体编程助手

推荐理由：François Chollet 说得很实在：想用AI代笔写代码，接口就得干净、文档得详细，别指望它懂你没写出来的默契。

原文

13:50

阿里云 Alibaba Cloud@alibaba_cloud

阿里巴巴云Qwen团队将于2026年6月30日举办Qwen Live第一集直播，主题为Agent-First。Qwen云负责人Linlin Kong与产品经理Pan Gu、Xijue将分享从零构建智能体云平台的经验。直播将重新定义面向非人类用户的开发者体验，并探讨大规模人机协作的新范式。

技巧 Qwen 阿里云智能体云平台开发者体验

推荐理由：想搞智能体云平台？Qwen这期直播讲从零搭建、非人类用户开发体验，做agent的开发者别错过。

原文

13:50

阶跃星辰 Stepfun@Stepfun_AI

Step Plan 专为 Agent 工作流设计，用户只需连接一次即可持续构建和实验。它在 Claude Code 中集成了 Step 3.7 Flash 模型，大幅降低每次 API 调用的管理成本。开发者 @codedailyML 用 Step Plan 制作了 Tarot 生成器 demo，验证了工作流的便捷性。

技巧 Step Plan StepFun Claude Code Step 3.7 Flash 智能体

推荐理由：StepFun 的 Step Plan 让你在 Claude Code 里连一次就能持续调模型，不用反复写 API，看那个 Tarot 生成器 demo 就知道了。

原文

13:49

Ethan Mollick@emollick

Ethan Mollick 指出，所有模型路由器（model routers）在处理非数学/编程任务时，普遍低估任务难度并分配过少的智能资源。他建议，对于不可验证的任务（如创新、营销、定性分析），使用更智能的模型往往能带来更大收益。这一观点源于他对多种路由器实际表现的经验观察。

技巧 model routers 任务分配推理模型非数学任务

推荐理由：Ethan Mollick 分享了一个容易被忽视的问题：模型路由器的任务分配不够智能，尤其对创意和分析类任务。如果你也发现一些任务结果不好，可能不是模型不行，是路由器给它派了太弱的模型。

原文

13:48

岚叔@lufzzliz

文章指出长期依赖AI生成代码会削弱工程师的沉浸式创造能力和职业满足感。作者用历史小说家批量生产而非亲自研究写书的类比，说明类似问题。他自述使用Claude和Codex几个月后，写代码变得懒散迟钝，遇到复杂问题第一反应是让AI找bug或写修复。文章警告AI批量产生的代码如同“数字塑料垃圾”，便宜但长期污染软件生态。

技巧 Claude Codex 编程助手软件工程

推荐理由：这篇很真实，说透了AI用得越多，自己越容易变懒，得先自己思考再让AI动手。

原文

13:48

Ethan Mollick@emollick

技巧 GLM-5.2 Opus 4.8 提示词工程推理模型

推荐理由：想看看AI怎么思考？让GLM-5.2或Opus 4.8帮你选诗，能看到它的推理过程，挺有意思的。

原文

13:48

岚叔@lufzzliz

在世界杯小组赛预测中，GLM-5.2在比分榜综合最强，GPT-5.5在胜负榜综合最强且命中率达70%。淘汰赛阶段取消24小时限制，可一次性预测16场比赛。作者分享了提示词示例："继续预测，可以提交淘汰赛16场的比赛，你需要仔细分析给出你的答案、并提交"。同时附带了opus-4.8和deepseekv4-pro的预测结果。

技巧 GLM-5.2 GPT-5.5 提示词工程智能体世界杯

推荐理由：作者用GLM-5.2和GPT-5.5预测世界杯，GPT-5.5命中率70%，还给了淘汰赛提示词，试试用自己的agent玩。

原文

13:48

岚叔@lufzzliz

精选

LufzzLiz基于Andrej Karpathy的LLM Wiki gist衍生出两套模板：个人知识库schema（五层目录）和代码仓库wiki schema（三层目录+双层导览）。附带实践案例Hermes-wiki和wiki-web，后者支持关系图和脑图。模板可直接用于构建结构化个人知识库或项目文档。

技巧 Karpathy 知识库模板笔记技巧工作流

推荐理由：如果你嫌搭建知识库太麻烦，试试这套基于Karpathy思路的模板，五层目录帮你把笔记理得清清楚楚，还有实际案例参考。

原文

12:48

Geek@geekbb

GitHub上Pluviobyte/video-skill仓库将AI视频制作流程拆解为多个可安装的skill模块，涵盖视频创作、复刻、动效、片头包装、质检等环节。每个skill独立可用，降低视频制作门槛。项目长期维护，持续更新。

技巧 video-skill Pluviobyte 视频制作工作流开源项目

推荐理由：这个仓库把视频创作、动效、包装等技能打包成模块，装一个就能用，做视频更轻松。

原文

06:46

06:46Simon Willison’s Weblog（博客/媒体）

Jon Udell 反对“人类在环中”的说法，认为这拱手交出了主动权。他主张“人类代理在环中”，即由人类主导流程，邀请 LLM 代理加入团队。他以“Doctor, it hurts when agents create unreviewable PRs”为例，强调代理不该成为产生不可审查代码的黑箱。核心是让代理辅助而非替代人类的判断与工作流。

技巧 Jon Udell 智能体编程助手 LLMs

推荐理由：Jon Udell 换了个角度聊 AI 工作流：别让代理做黑箱，让它们当团队助手，人类还是舵手。

原文

01:45

AI产品黄叔@PMbackttfuture

用户使用Hermes生成手机壁纸，并将微信Agent入口交回Hermes，同时接入flomo MCP实现记忆同步。每次手动触发“保存到flomo”时，内容会同步到flomo，并立即触发即时增强功能，从flomo/Hermes记忆中检索相关知识点推送笔记。这为知识工作者提供了利用AI助手整理灵感和长期记忆的工作流。

技巧 Hermes flomo MCP/工具工作流智能体

推荐理由：教你给AI设个微信入口，用Hermes做壁纸，还能自动同步到flomo，随时调取记忆，挺实用的。

原文

01:42

OpenRouter@OpenRouterAI

OpenRouter 持续对大多数开源权重模型运行 GPQA 与 TAU-Bench 两个基准，并将结果公开。这些成绩被用于其 AutoExacto 元基准，后者是路由工具调用的默认依据。当前 Parasail 和 Zai 在排行榜上位列第一。

技巧 OpenRouter GPQA TAU-Bench AutoExacto 基准测试

推荐理由：选模型路由工具前，看看 OpenRouter 定期跑的 GPQA 和 TAU-Bench 排名，现在 Parasail 和 Zai 排第一，挺有参考价值。

原文

00:54

marktechpost@Sana Hassan

精选

本教程使用 Python 构建完整的 OCRmyPDF 流水线。先生成合成图像 PDF 以测试 OCR，再将其转换为可搜索 PDF 和 PDF/A 格式。通过提取侧边文本、计算单词召回率（word-recall）并比较文件大小来验证效果。还能调整 Tesseract 参数、清理噪点、纠正方向、在内存中运行 OCR 以及批量处理整个文件夹。

技巧 OCRmyPDF PDF/A Tesseract Python 文档扫描

推荐理由：手把手教你用 Python 调 OCRmyPDF，从生成测试图片到批量转 PDF/A，还带召回率比较，适合文档处理需求的人。

原文

00:01

Clement Delangue@ClementDelangue

Brian Armstrong在推文中分享了Coinbase控制AI成本的实践。他提到，通过将默认模型切换到开源模型如GLM 5.2和Kimi 2.7，91%的员工从未触及使用上限。通过改进缓存，LibreChat的缓存命中率从5%提升到60%。这些措施使AI支出减少近一半，同时token用量仍在增长。他还强调路由优化和精简上下文的重要性。

技巧 Hugging Face GLM 5.2 Kimi 2.7 成本优化缓存

推荐理由：Coinbase创始人Brian Armstrong分享了一套实际操作方案：用更便宜的默认模型、优化缓存和路由，能把AI成本砍半。开源模型GLM 5.2和Kimi 2.7是主角，缓存命中率从5%跳到60%。

原文

6月28日

16:18

Geek@geekbb

精选

网友分享的 Gentle-AI 配置串联 11 个不同职能的智能体，使用低成本 Flash 模型处理大部分上下文，仅在设计（Qwen）和编码（Kimi Code）等关键环节调用高性能模型。每日成本控制在 4~7 美元，并通过多智能体对齐审查显著降低幻觉率。该 per-phase model routing 策略可适配 15 种 AI 编程工具。

技巧 Gentle-AI Qwen Kimi Code 智能体模型路由

推荐理由：挺实用的配置：11个智能体分工，Flash模型省成本，Qwen和Kimi Code干重活，每天才4-7美元，还降幻觉。

原文

15:15

marktechpost@Sana Hassan

精选

本教程基于 Hugging Face 的 Fable 5 Traces 数据集，在 Colab 中构建稳定工作流。手动解析合并的 JSONL 文件避免依赖问题，检查仓库文件并标准化工具调用。通过审计结构、脱敏密钥和可视化分布，导出安全的无 CoT 聊天数据集。最后使用纯 Python 的朴素贝叶斯模型在 traces 上训练基线，无需复杂框架。

技巧 Fable 5 Traces Colab 工具调用数据审计基线模型

推荐理由：手把手教你用 Colab 搞定 Fable 5 Traces 数据，从解析到审计再到训练基线，全流程避坑实战。

原文

11:19

AI产品黄叔@PMbackttfuture

精选

黄叔分享了flomo Agent的10点使用心得，核心是降低记录前0.5秒的摩擦。他通过微信入口和Hermes Agent，并接入flomo MCP，将Hermes长期记忆同步到flomo。同时手动触发“保存到flomo”的内容，即时使用增强功能从flomo/Hermes记忆里检索相关笔记以帮助思考。他认为DeepSeek V4和王登科推动了flomo的发展，且Agent功能少反而更可信。最后提出flomo Agent+Codex/Hermes可形成“记忆-行动”双系统。

技巧 flomo Agent 知识管理 MCP/工具 Hermes

推荐理由：黄叔总结了flomo Agent的10条理解，比如用微信入口降低摩擦、打通记忆和行动，还提到了DeepSeek V4的作用。想用好flomo的可以看看。

原文

11:19

AI产品黄叔@PMbackttfuture

黄叔总结了自己重度使用flomo Agent的10点理解，核心是降低记录前0.5秒的摩擦。他认为flomo Agent对手不是Notion或Obsidian，而是微信文件传输助手。该工具通过接入flomo MCP与Hermes，将对话长期记忆同步保存到flomo，并即时触发增强功能，从记忆中提取相关笔记辅助思考。黄叔还指出，DeepSeek V4和王登科推动了flomo发展，Agent功能少反而更可信，付费理由是“一个可信的记忆容器”。

技巧 flomo 智能体 Hermes MCP 知识管理

推荐理由：黄叔分享了10条实际使用flomo Agent的心得，比如对手是微信文件传输助手、AI洞察是卡片结构的迟到红利，挺有启发。

原文

11:10

Yangyi@Yangyixxxx

宝玉分享 Codex/Claude Code 的实用工作流：fork 功能可从某节点创建分支，保留历史让上下文更纯粹。/btw 或 /side 命令可在当前会话中提问与主任务无关的问题，不污染上下文。上下文压缩配合 Prompt Caching 降低持续对话成本，一个 Session 内连续完成任务更可行。plan 模式中可用 /btw 请求详细解释选项含义。

技巧 Codex Claude Code fork /btw 提示词工程

推荐理由：宝玉分享了两个超实用的技巧：fork分支对话和/btw侧边提问，让Codex和Claude Code用得更顺，强烈建议试试。

原文

07:19

Suhail@Suhail

Suhail分享了在过去一周中，使用某个工具或方法快速验证新建立的训练后基础设施的经验。该方法不仅超越了简单的Hello World强化学习运行，还能帮助发现并修复rollout过程中的瓶颈。这是一个实用的快速配方，确保各组件正常运转。

技巧训练基础设施强化学习 rollout 验证技巧

推荐理由：Suhail分享了一个实用方法，能快速验证RL训练基础设施，避开常见瓶颈。

原文

04:31

Harrison Chase@hwchase17

社区成员推出3小时深度课程，系统讲解Deep Agents构建。课程覆盖任务规划模块、文件系统用于上下文管理、子代理生成机制以及长期记忆实现。适合想深入掌握Agent开发流程的学习者。

技巧 Deep Agents 智能体任务规划上下文管理子代理

推荐理由：想学Deep Agents实战吗？3小时从任务规划讲到长期记忆，社区大神亲自带，比硬啃文档快多了。

原文

04:19

elvis@omarsar0

该推文指出，循环工程（loop engineering）本质上是提示工程（prompt engineering）与良好系统设计的结合。这条观点来自社交媒体，获得了8条评论、1次转发和21个点赞。它强调在构建AI应用时，需要把提示工程与系统架构整合，而非单独优化提示词。

技巧 loop engineering 提示词工程系统设计

推荐理由：有人一句话点醒我：循环工程其实就是提示工程搭上系统设计，做AI应用的朋友可以想想你的架构对不对。

原文

03:19

Suhail@Suhail

用户Suhail分享了两个提示词版本："read-quick-dont-validate"用于快速阅读论文，要求AI一步步拆解并一次性输出章节式解释；"validate-my-understanding-and-teach-me"则需提供5-10个参考链接，要求AI逐步教学并验证理解。第二个版本可耗时数周但学习更深入。两条提示词分别适用于不同学习场景。

技巧提示词工程论文阅读学习技巧 ChatGPT 教学方法

推荐理由：想用AI读论文又怕浅尝辄止？试试这两个具体写法，一个快速扫读，一个深度教学，亲测有效。

原文

03:19

Suhail@Suhail

该指令用于自动启动并监控AI模型训练运行。它在4个节点上运行完整训练，持续记录实验文档、超参数、配置以及定期评估结果。系统还会分析训练稳定性和性能，并在训练崩溃时从最新可靠检查点恢复。整个流程大幅减少了人工监视和干预的需求。

技巧训练自动化多节点训练实验记录检查点恢复

推荐理由：这个指令能自动帮你记实验日志、处理崩溃恢复，省去一直盯着的麻烦。

原文

03:19

Suhail@Suhail

博主分享了一种异步学习工作流：将博客、推文、arxiv论文等全部用特定提示词让AI生成教学版，不立刻读而是排队等待。等到有空时（乘车、睡前等）再去阅读AI生成的易读版本，并追问问题。这样比直接存链接好，因为AI能适应读者的经验水平并重写内容。作者称这种学习速度远超以往。

技巧学习工作流异步学习 AI教学提示词技巧阅读理解

推荐理由：把想读的文章丢给AI，让它先教你一遍，等你回头读的时候效率翻倍，还能追问。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？