09:26andrew chen@andrewchen风险投资人Andrew Chen提出,未来相当比例的LLM查询可能通过本地AI模型在浏览器中运行WebGPU完成,无需发送到云端前沿模型。驱动因素包括:大量查询简单如谷歌搜索,本地模型质量快速提升,苹果等消费硬件已能流畅运行Qwen 3.6 35b MoE等模型,隐私需求(健康、金融等),以及浏览器WebGPU免安装、降低计算成本的优势。尽管云端算力持续增长、token成本下降,但本地推理的便利性和隐私性可能催生新的需求。AI产品本地AIWebGPU浏览器推理隐私消费硬件推荐理由:本地AI推理正在从概念走向实用,做浏览器应用或关注隐私的开发者值得关注WebGPU的潜力,它可能改变LLM的使用模式。原文