05:20Aravind Srinivas@AravSrinivas推文预测未来每家企业都会构建自身的模型-测试-沙箱-评估飞轮,并优化每瓦特token价值。核心驱动力是企业对其领域、客户和工作流拥有独特的隐性知识。该观点获得630个赞和35339次浏览。行业Perplexity企业AI模型评估飞轮token效率隐性知识推荐理由:Perplexity CEO预测企业AI的未来是定制评估飞轮和能耗优化,看看这个趋势分析原文
09:54Aravind Srinivas@AravSrinivasPerplexity推出Computer for Counsel功能,将计算机与律师日常使用的法律研究数据库、文档工具和案件管理系统连接。该功能可从中立AI(midpageAI)、LegalZoom、Docusign、NetDocuments等平台拉取可引用来源。面向所有Pro和Max订阅用户开放。AI产品PerplexityComputer for Counsel法律研究文档工具1 个信源在谈推荐理由:Perplexity给律师做了个工具,直接连上多个法律数据库和文档平台,查资料不用来回切换了。原文
04:55Y Combinator@ycombinatorCoval 为企业提供模拟和可观测性平台,用于测试、监控和评估 AI 语音代理,每月处理数千万通电话。客户包括 Perplexity 和 Deepgram。公司刚完成 2820 万美元 A 轮融资。CEO Brooke Hopkins 此前在 Waymo 领导评估基础设施,发现经验可迁移至语音代理。她将广泛评估想法聚焦为企业平台,曾有客户在未写代码前就愿付费。行业CovalPerplexityDeepgram语音代理A轮融资1 个信源在谈推荐理由:Coval 刚拿了 2820 万美元,帮企业测语音代理,客户有 Perplexity 和 Deepgram,创始人从 Waymo 的经验移植过来,值得一看。原文
23:29elvis@omarsar0Perplexity 发布了新功能 /learn 技能,通过智能体自动生成学习计划。该计划包含一个动态学习中心(artifact),可根据学习者的需求和进度实时调整。目前该功能已在 Perplexity 平台上线,用户可体验个性化学习路径。AI产品Perplexity/learn智能体学习计划个性化推荐理由:Perplexity 新出的 /learn 技能,能自动帮你制定学习计划,还会根据你学的情况动态调整,比自己瞎找资料高效多了。原文
03:25Aravind Srinivas@AravSrinivasRamp 推出了针对 Perplexity Computer 的 Model Context Protocol (MCP) 集成。该集成提供超过 50 个工具,允许用户直接在 Perplexity 的研究工作流中调用 Ramp 的财务数据。用户可通过 perplexity.ai/computer/conne… 连接使用。这一功能显著简化了企业财务数据的查询与分析流程。AI产品RampPerplexityMCP/工具企业工具推荐理由:Ramp 在 Perplexity 上放了 50 多个工具,做财务研究时可以直接拉数据,不用来回切换。原文
17:33Aravind Srinivas@AravSrinivas精选Perplexity 的 Agent API 新增了对智谱 AI 旗舰模型 GLM-5.2 的支持。GLM-5.2 是目前最强的开源模型之一,在长周期编码和智能体工作流上表现突出。它充分利用了 Perplexity 的 Search as Code 架构,用户通过一次 API 调用即可结合前沿推理与实时程序化搜索。该接口兼容 OpenAI 格式,且 Perplexity 提供第一方定价,无额外加价。AI模型GLM-5.2PerplexityAgent API开源模型智能体10 个信源在谈推荐理由:Perplexity Agent API 现在能调用 GLM-5.2 了,这个模型编码和智能体任务很强,还能边推理边搜索,价格也透明。原文
20:27AI Will@FinanceYF5Listen Labs推出未来创始人项目,面向想创业的工程师,提供全职薪资、福利和Sequoia等投资者指导。Anthropic的Claude Corps为期12个月,资助早期建设者在非营利组织部署AI工具,薪资$85K加福利,第1批7月17日截止。a16z的FDE奖学金为时8周,面向企业部署工程师。Vals AI奖学金每周$1K–2.5K,解决AI评估难题。Perplexity研究驻留年薪$220K,支持远程或SF办公。DoorDash研究奖学金为期3-6个月,提供计算和住房补贴。Amplify Partners写作奖学金为期3个月,面向技术人员。行业Anthropica16zPerplexityAI奖学金项目机会10 个信源在谈推荐理由:想进Anthropic、a16z、Perplexity?这里有7个带薪奖学金项目,最高$220K年薪,截止日期近,赶紧看看原文
09:07Aravind Srinivas@AravSrinivas精选73°Perplexity发布了Brain,一个持续学习的记忆系统,能构建包含所有会话、连接器和文件的上下文图。Brain会在夜间主动更新最新上下文,并自动接入Computer上的每个任务,使Computer具备状态化和自我改进能力。该功能以研究预览形式向所有Perplexity Max订阅者开放。AI产品PerplexityBrainComputer上下文图记忆系统推荐理由:Perplexity搞了个Brain,能给Computer自动建上下文图,让它记住之前的事,越用越聪明,Max用户快去试试。原文
14:14kimmonismus@kimmonismus精选OpenRouter 推出 Fusion 功能,这是一种服务端“模型面板”。它可将用户提示并行发送给多个模型,并允许它们使用网络搜索和 Bash 工具。Fusion 通过裁判比较各模型答案,由合成器生成最终响应。成本可能低于依赖单一昂贵前沿模型。官方称其在 Perplexity 的 DRACO 深度研究基准上击败了前沿模型。AI产品OpenRouterFusionPerplexityDRACO基准多模型协作推荐理由:OpenRouter 出了个新玩法 Fusion,多个模型一起干活还能用工具,比单用最贵的模型还省钱,实测在 DRACO 基准上比前沿模型强。原文
03:09Aravind Srinivas@AravSrinivas精选Perplexity 宣布其智能体框架 Computer 原生集成了 Deep Research 能力,用户无需再单独切换模式。该功能基于“搜索即代码”架构,模型自动编写代码来组织搜索流程,并行执行数千次检索步骤,针对每个问题定制化搜索。在多个基准测试中,其性能超越了传统的 Deep Research 方案。这标志着智能体工具在深度研究自动化方面迈出了重要一步。AI产品智能体搜索即代码深度研究Perplexity自动化推荐理由:做深度调研或竞品分析的团队终于有了一个能自动并行搜索的智能体——Perplexity Computer 把 Deep Research 变成原生技能,不用再手动切换模式,建议试试看能否替代你现有的研究流程。原文
02:36Perplexity@perplexity_ai精选Perplexity 宣布将 Deep Research 作为原生技能集成到其 Computer 产品中。该功能现在连接到驱动 Computer 的智能体框架,能够访问搜索、代码生成、长期运行的沙箱、连接器、工具和授权数据。这一整合使得用户可以在 Computer 环境中直接进行深度研究,无需切换工具。该功能目前对 Pro 和 Max 订阅用户开放。AI产品PerplexityDeep Research智能体搜索代码生成推荐理由:Perplexity 把深度研究能力直接嵌入到智能体框架里,做研究或数据分析的团队可以省去来回切换工具的麻烦,Pro/Max 用户值得立刻试试。原文
02:20Perplexity@perplexity_ai精选Perplexity AI 宣布其 Deep Research 功能基于全新的 Search as Code 架构构建。该架构让模型能够编写代码来动态组装搜索过程,针对每个问题并行运行数千个检索步骤。在各项基准测试中,该系统的表现均超越了传统的深度研究方法。这一进展意味着 AI 搜索可以更高效、更精准地处理复杂研究任务。AI产品PerplexityDeep ResearchSearch as CodeAI搜索架构创新推荐理由:Perplexity 用代码驱动搜索的方式解决了传统深度研究效率低、泛化差的问题,做信息检索或研究分析的团队值得关注这一新范式。原文
06:30Aravind Srinivas@AravSrinivas83°Perplexity 宣布 Claude Fable 5 现可作为 Computer 内的编排模型使用,仅限 Pro 和 Max 订阅用户。该模型专为长时间、复杂的智能体工作流设计,能显著提升任务执行的稳定性和效率。这一更新让高级用户能在 Computer 中利用 Anthropic 最先进的模型进行多步骤自动化操作。AI产品Claude Fable 5编排模型智能体PerplexityComputer10 个信源在谈推荐理由:做复杂智能体工作流的开发者终于有了更可靠的编排模型——Claude Fable 5 在长任务场景下表现突出,Perplexity Pro/Max 用户可以直接在 Computer 里切换使用,值得一试。原文
19:15The Rundown AI@therundownaiAnthropic 向公众推出了其 Mythos 级别的 AI 模型,标志着其在 AI 能力上的又一次重大提升。Perplexity 发布的数据地图显示了智能体工作模式的转变趋势,表明 AI 代理正在从概念走向实际应用。此外,Dexter 工具实现了金融研究的自动化,而 Codex 则帮助日本一家西兰花农场实现了自动化运营。同时,还有 4 款新的 AI 工具和社区工作流发布,展示了 AI 在各行业的渗透。这些进展共同反映了 AI 在自动化、研究和农业等领域的快速落地。AI产品AnthropicMythosPerplexity智能体自动化10 个信源在谈推荐理由:Anthropic 的 Mythos 级 AI 可能带来更强的推理能力,AI 从业者和开发者值得关注其实际表现;Perplexity 的数据地图则给做智能体产品的团队提供了市场信号,建议点开看看趋势。原文
09:36shao__meng@shao__meng76°Perplexity 与哈佛商学院合作,基于真实使用数据首次系统比较了「对话助手」与「通用 Agent」对知识工作的影响。研究发现,Agent 模式(Computer)相比传统搜索模式(Search),任务完成时间平均节省 87%,成本降低约 94%,且用户满意度更高。Agent 提高了任务自主性,用户角色从「操作者」转向「监督者」,同时扩大了工作边界,让用户能承担更广、更深的任务。研究覆盖 18 个领域,编程领域效果最显著,时间节省 92%,成本节省 96%。行业AI Agent知识工作效率提升Perplexity哈佛研究推荐理由:这份研究用真实数据证明了 Agent 不是噱头——做知识工作、项目管理或跨职能协作的团队,看完会重新评估自己的工具链。建议点开看看具体的数据对比,尤其是成本节省部分。原文
04:27Perplexity@perplexity_ai83°Perplexity AI与哈佛大学联合发布了一项关于从聊天界面转向自主Agent(如Computer)的研究。为期3个月的研究显示,使用Computer的工人完成任务的时间比仅使用搜索减少了87%,成本降低了94%,且满意度更高。该研究强调了自主Agent在提升工作效率和降低成本方面的巨大潜力,为AI应用从对话式向自主执行转变提供了实证支持。AI产品自主AgentPerplexity效率提升研究企业应用推荐理由:这项研究用数据证明了自主Agent比传统搜索效率高出一个量级,做AI产品设计或企业效率优化的团队值得关注,可以直接参考其方法论评估自己的Agent方案。原文
01:51Aravind Srinivas@AravSrinivas精选Perplexity AI 与哈佛大学合作发布了一项关于其自主代理产品 Perplexity Computer 在真实工作场景中的研究。研究为期三个月,发现使用 Computer 的工人完成任务的时间比仅用搜索减少了 87%,成本降低了 94%,同时用户满意度更高。该代理能够进行跨学科搜索,提供比多步搜索更自主、更高质量的输出。这标志着从传统聊天界面到自主代理的转变,为知识工作者提供了更高效的工具。AI产品Perplexity自主代理效率提升哈佛研究知识工作推荐理由:Perplexity Computer 用真实数据证明了自主代理比传统搜索快 87%、省 94% 成本,做研究、写报告、跨领域查资料的知识工作者可以直接用起来,效率提升肉眼可见。原文
05:42Aravind Srinivas@AravSrinivasPerplexity CEO Arav Srinivas 宣布与 Intel 合作,将本地模型和混合推理带到 Intel Ultra Series 3 笔记本电脑上。Intel CEO Lip-Bu Tan 在 Computex 2026 主题演讲中阐述了从硅到系统到软件的愿景,涵盖 PC、边缘设备、数据中心和智能中心。该合作旨在提升个人电脑的 AI 能力,实现更高效的本地推理。这是 Intel 转型过程中的重要一步,也标志着 AI 与 PC 的深度融合。AI产品PerplexityIntel本地模型混合推理笔记本推荐理由:本地 AI 推理终于要走进主流笔记本了——Perplexity 与 Intel 的合作让 Ultra 3 用户无需联网也能跑模型,做 AI 应用或本地推理的开发者值得关注。原文
13:20Perplexity@perplexity_ai72°Perplexity 宣布其 Pro 和 Max 订阅用户现在可以使用 Nemotron 3 Ultra 模型。该模型由 NVIDIA 开发,是一款专为长时间运行的智能体任务设计的新开源模型。此举将高性能的智能体能力直接提供给付费用户,无需额外配置。对于依赖 AI 进行复杂、持续任务的用户来说,这是一个直接可用的新选择。AI产品PerplexityNemotron 3 UltraNVIDIA智能体开源模型10 个信源在谈推荐理由:做长任务智能体的开发者可以直接在 Perplexity 上体验 NVIDIA 的最新开源模型,省去部署成本,值得 Pro/Max 用户试试。原文
08:03Aravind Srinivas@AravSrinivasNVIDIA 最新的开源模型 Nemotron 3 Ultra 现已上线 Perplexity,面向所有 Pro 和 Max 用户开放。该模型专为长时间运行的智能体任务设计,是美国领先的开源模型之一。用户可以直接在 Perplexity 平台上体验其长上下文和推理能力。此举进一步丰富了 Perplexity 的模型选择,为开发者提供了更多开源选项。AI产品Nemotron 3 UltraNVIDIAPerplexity开源模型智能体10 个信源在谈推荐理由:NVIDIA 的 Nemotron 3 Ultra 是专为长时智能体任务设计的开源模型,做 AI 智能体开发的团队可以直接在 Perplexity 上试用,省去本地部署的麻烦。原文
02:46Aravind Srinivas@AravSrinivasPerplexity 宣布其 Computer 产品将集成所有启动和运营业务所需的连接器,支持 400 多种工具,包括 Intuit QuickBooks、Vercel、Shopify、Canva 等。这意味着任何有想法和一小群高效能团队的人,都能比以往更快地构建快速增长的有价值公司。Perplexity Computer 专为成长型企业设计,旨在简化业务流程,让用户从零开始快速搭建和运营公司。AI产品Perplexity企业工具集成平台创业自动化推荐理由:Perplexity Computer 把启动业务所需的所有工具连接器整合到一起,做创业或中小企业的团队可以直接用它快速搭建运营流程,省去手动对接多个工具的麻烦。原文
21:15Aravind Srinivas@AravSrinivasPerplexity Computer 现已集成 Guidepoint MCP,允许金融用户直接搜索并引用超过 10 万份专家访谈记录。该功能将专家电话会议内容纳入 AI 工作流,每条引用都可追溯至原始转录文件。这为金融分析师提供了深度研究的新工具,尤其适用于尽职调查、行业分析和投资决策。Guidepoint 客户可直接在 Perplexity 中查询专家观点,提升研究效率与可信度。AI产品金融研究MCP/工具Perplexity专家访谈AI 工作流推荐理由:金融分析师终于有了可追溯的专家访谈数据库——Perplexity 把 10 万+ 一手资料接入 AI 工作流,做深度研究的团队可以直接用,省去手动翻找的麻烦。原文
21:13Aravind Srinivas@AravSrinivasPerplexity 宣布其 Personal Computer 功能即将登陆所有 Windows 机器。该功能可在本地运行,并协调用户日常使用的应用和文件。首批将面向付费的 Max 和 Enterprise Max 订阅者开放。这标志着 AI 助手从云端走向本地化操作系统的关键一步。AI产品PerplexityWindowsAI助手本地化生产力工具推荐理由:Perplexity 把 AI 助手直接嵌入 Windows 本地,能跨应用协调文件操作,重度 Windows 用户和生产力工具爱好者值得关注。原文
08:42Aravind Srinivas@AravSrinivasPerplexity 宣布其 AI 计算机 Perplexity Computer 将支持本地模型运行,实现混合智能推理。该功能允许任务在本地硬件与云端前沿模型之间智能拆分,既保护隐私数据又提升 token 效率。当需要更强算力时,系统可自动调用服务器端 GPU 上的前沿模型。该功能即将登陆 Windows 笔记本,具体上线时间待公布。AI产品Perplexity混合推理本地模型隐私保护Windows推荐理由:混合推理架构解决了隐私与性能的平衡难题,做本地 AI 部署或关注数据安全的开发者值得关注,Windows 用户很快就能直接体验。原文
09:49Aravind Srinivas@AravSrinivas精选Perplexity 的新功能“Search as Code”允许 AI 编写短 Python 脚本,一次性完成并行搜索、自定义过滤、去重和智能处理,取代传统的逐轮问答。脚本在系统内部运行,减少了来回交互,速度更快。随着 AI 写代码能力的提升,该功能效果会越来越好。这本质上是将缓慢的对话式搜索转变为定制化的研究配方。AI产品PerplexitySearch as CodeAI搜索Python脚本自动化推荐理由:Perplexity 把搜索从“聊天”变成了“编程”,做研究、数据采集或竞品分析的团队可以大幅减少手动操作,值得一试。原文
09:05Aravind Srinivas@AravSrinivas精选76°Perplexity CEO Arav Srinivas 宣布,公司正从传统的“搜索作为网络抓取工具调用”转向“搜索即代码”架构。新架构让 AI 智能体直接编写 Python 代码调用搜索栈,而非逐次循环函数调用。这一转变旨在适应未来智能体环境中代码执行成为知识工作主流方式的趋势,使多步骤原语组合更自然,对智能体框架的变更更具适应性,并能受益于下一代模型在编程能力上的持续提升。该架构已通过 Perplexity Agent API 提供,并默认用于 Computer 模式。AI产品搜索即代码Perplexity智能体AI 架构代码生成推荐理由:Perplexity 把搜索从工具调用升级为代码生成,解决了智能体多步搜索效率低、难适配的问题。做 AI 智能体或搜索产品的开发者值得关注,可以直接在 Agent API 里体验。原文
08:22Perplexity@perplexity_aiPerplexity 宣布其 AI 助手 Perplexity Computer 现已直接嵌入 Microsoft Excel、Word、PowerPoint 和 Outlook 的侧边栏中。用户可以在办公软件内直接调用 AI 来起草文档、建模、制作演示文稿和处理邮件,无需切换应用。这一集成旨在提升办公效率,让 AI 辅助工作流更无缝。目前该功能已上线,用户可通过 Perplexity 官网获取。AI产品PerplexityMicrosoft OfficeAI 助手办公效率集成推荐理由:办公族终于可以在 Office 里直接调用 AI 写文档、做表、做 PPT 了,不用来回切换窗口,效率提升明显,建议经常用 Office 的团队试试。原文
08:20Aravind Srinivas@AravSrinivasPerplexity 宣布 Claude Opus 4.8 模型已对所有 Max 订阅用户开放。该模型被定位为 Perplexity Computer 的编排器(orchestrator),意味着它能在多步骤任务中协调其他工具或模型。Perplexity Max 用户可直接在 Perplexity 平台和 Perplexity Computer 上体验。这一更新为需要复杂推理和多工具协作的用户提供了更强大的模型选择。AI产品PerplexityClaude Opus 4.8模型更新编排器Max 订阅10 个信源在谈推荐理由:Perplexity Max 用户终于能用上 Claude Opus 4.8 了,做复杂研究或自动化任务的团队可以直接在 Perplexity Computer 里体验编排能力,值得试试。原文
08:09Perplexity@perplexity_aiPerplexity 宣布 Claude Opus 4.8 现已面向其 Max 订阅用户开放,支持在 Perplexity 和 Computer 平台上使用。这是 Anthropic 最新一代旗舰模型,在推理、编程和长文本处理方面有显著提升。用户可通过 Perplexity 的搜索增强界面直接调用,获得更精准的答案和更长的上下文支持。该更新进一步丰富了 Perplexity 的模型生态,为高级用户提供了更多选择。AI产品Claude Opus 4.8Perplexity订阅服务推理模型搜索增强10 个信源在谈推荐理由:Perplexity 用户终于能用上最新 Claude 旗舰模型了,做深度搜索和复杂推理的 Max 订阅者可以直接体验,不用再切到其他平台。原文
00:35Aravind Srinivas@AravSrinivas72°Perplexity 宣布其 AI 助手 Perplexity Computer 现已集成到 Microsoft Office 套件中,包括 Excel、Word、PowerPoint 和 Outlook。用户可以在应用侧边栏直接调用 AI 来起草文档、建模、制作演示文稿和处理邮件。这一集成将 AI 能力无缝嵌入办公场景,提升工作效率。目前该功能已上线,用户可通过 Perplexity 官网获取。AI产品PerplexityMS OfficeAI 助手办公效率集成推荐理由:办公族终于能在 Office 里直接调用 AI 了——Perplexity Computer 嵌入 Excel/Word/PPT/Outlook,写文档、做模型、回邮件都能在侧边栏完成,建议经常用 Office 的团队试试。原文
04:47Perplexity@perplexity_ai72°Perplexity AI 开源了其重构的 Unigram 分词器,该分词器将 CPU 利用率降低了 5-6 倍。由于小型重排序器和嵌入器在 GPU 上只需个位数毫秒即可运行,CPU 分词延迟成为总延迟中的重要部分。这一优化显著减少了推理过程中的 CPU 瓶颈,尤其适合需要低延迟的实时 AI 应用。开源代码已在 GitHub 上发布,供开发者使用和贡献。AI产品Perplexity分词器开源/仓库CPU优化低延迟推荐理由:Perplexity 解决了推理管线中 CPU 分词这个容易被忽视的瓶颈,做低延迟 AI 应用或自建搜索/重排序系统的团队可以直接用这个开源方案来加速。原文
02:41Aravind Srinivas@AravSrinivas72°Perplexity 开源了其生产环境中使用的 Unigram 分词器,相比 HuggingFace 和 SentencePiece 效率更高。该分词器将 CPU 利用率降低了 5-6 倍,解决了 GPU 上运行的小型重排序器和嵌入器因 CPU 分词延迟而成为瓶颈的问题。项目已在 GitHub 上开源,旨在优化推理管道的端到端延迟。AI产品分词器开源/仓库Perplexity推理优化CPU/GPU推荐理由:Perplexity 把生产级分词器开源了,CPU 利用率降 5-6 倍,做推理优化的团队可以直接拿来用,减少延迟瓶颈。原文
06:54Aravind Srinivas@AravSrinivasPerplexity CEO Arav Srinivas 宣布开源 Bumblebee,一个面向 macOS 和 Linux 的只读安全扫描器,用于检测开发者机器上的风险包、扩展和 AI 工具配置。该工具与 Perplexity Computer 集成,可在出现供应链风险时自动触发深度扫描。Perplexity 强调通过将工具置于智能体沙盒中并让安全工作流自主运行,来实现企业级深度嵌入。此举旨在推动 AI 工具在企业中的安全落地,并邀请开发者参与贡献。AI产品PerplexityBumblebee安全扫描开源/仓库企业安全推荐理由:企业安全团队和 AI 工具开发者终于有了一个开源方案来扫描开发环境中的供应链风险——Bumblebee 直接与 Perplexity Computer 联动,做安全运维的可以试试集成到 CI/CD 中。原文
01:39Aravind Srinivas@AravSrinivas开源模型和智能体平台 MiniMax 宣布其 Agent 产品现已接入 Perplexity 的搜索基础设施。在超过 700 个智能体任务的基准测试中,Perplexity 在答案质量和片段密度上表现最佳,相比之前的默认搜索服务 Serper,每次任务工具调用次数从 32.6 次降至 17.8 次(减少 45%),Token 用量从 162.3M 降至 94.6M(减少 42%),通过率提升 2%,总成本降低 27%。这一改进对于依赖搜索循环的智能体工作流意义重大,更好的搜索片段意味着更少的搜索次数和更低的上下文开销。AI产品智能体搜索增强MiniMaxPerplexity成本优化推荐理由:做智能体开发的团队终于有了更高效的搜索方案——Perplexity 的搜索集成让 MiniMax Agent 成本直降 27%,同时保持答案质量,做 RAG 或搜索增强型 Agent 的建议直接试试。原文
15:49Aravind Srinivas@AravSrinivas精选Perplexity 正在构建市场上最安全的可扩展智能体运行时沙箱。其安全设计包括:安全处理代理 API 密钥、对所有智能体访问的内容进行安全检测、加密通过连接器传递给智能体的数据、以及可靠地分离存储和计算。Perplexity Computer 默认安全,每个任务在独立的硬件隔离沙箱中运行,具有 VPC 级别的存储和计算分离。智能体通过短期代理令牌进行身份验证,而不是使用原始 API 密钥。AI产品智能体安全沙箱Perplexity代理密钥VPC隔离推荐理由:做智能体应用开发的团队终于有了一个默认安全的沙箱方案——Perplexity 把密钥管理、内容检测、数据加密和存储计算分离都做了,建议直接参考他们的设计思路。原文
15:51Perplexity@perplexity_ai精选Perplexity AI 发布了关于在 NVIDIA GB200 NVL72 Blackwell 机架上部署后训练 Qwen3 235B 模型的新研究。研究表明,GB200 不仅是训练平台,更是大型 MoE 模型高吞吐推理的重大升级,性能显著优于 Hopper 架构。该工作展示了如何利用 Blackwell 的硬件特性优化推理效率,为大规模 AI 服务提供新思路。AI模型推理模型PerplexityQwen3NVIDIA GB200MoE推荐理由:做大规模模型推理部署的团队值得关注——GB200 在 MoE 模型上的推理效率提升显著,Perplexity 的实践给出了可直接参考的优化路径。原文