08:12Simon Willison’s Weblog(博客/媒体)Simon Willison在Hacker News发现Moebius 0.2B图像修复模型,声称拥有10B级性能,原本需PyTorch与CUDA。他决定利用Claude Code在终端辅助下,通过ONNX Runtime Web的WebGPU后端将该模型移植到浏览器中运行。最终成功制作出demo(地址simonw.github.io/moebius-web/),用户可上传图片、涂抹区域并一键修复。整个过程仅用数小时,且与Datasette项目并行开发。技巧MoebiusClaude CodeWebGPU图像修复浏览器推理推荐理由:Simon用Claude Code把0.2B参数的Moebius图像修复模型跑在浏览器里,无需显卡就能涂掉图片里的东西自动补全,挺酷的。原文
09:26andrew chen@andrewchen风险投资人Andrew Chen提出,未来相当比例的LLM查询可能通过本地AI模型在浏览器中运行WebGPU完成,无需发送到云端前沿模型。驱动因素包括:大量查询简单如谷歌搜索,本地模型质量快速提升,苹果等消费硬件已能流畅运行Qwen 3.6 35b MoE等模型,隐私需求(健康、金融等),以及浏览器WebGPU免安装、降低计算成本的优势。尽管云端算力持续增长、token成本下降,但本地推理的便利性和隐私性可能催生新的需求。AI产品本地AIWebGPU浏览器推理隐私消费硬件推荐理由:本地AI推理正在从概念走向实用,做浏览器应用或关注隐私的开发者值得关注WebGPU的潜力,它可能改变LLM的使用模式。原文