AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:浏览器推理×
6月23日
08:12
08:12Simon Willison’s Weblog(博客/媒体)
Simon Willison在Hacker News发现Moebius 0.2B图像修复模型,声称拥有10B级性能,原本需PyTorch与CUDA。他决定利用Claude Code在终端辅助下,通过ONNX Runtime Web的WebGPU后端将该模型移植到浏览器中运行。最终成功制作出demo(地址simonw.github.io/moebius-web/),用户可上传图片、涂抹区域并一键修复。整个过程仅用数小时,且与Datasette项目并行开发。
技巧MoebiusClaude CodeWebGPU图像修复浏览器推理

推荐理由:Simon用Claude Code把0.2B参数的Moebius图像修复模型跑在浏览器里,无需显卡就能涂掉图片里的东西自动补全,挺酷的。
原文
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月20日
09:26
09:26andrew chen@andrewchen
风险投资人Andrew Chen提出,未来相当比例的LLM查询可能通过本地AI模型在浏览器中运行WebGPU完成,无需发送到云端前沿模型。驱动因素包括:大量查询简单如谷歌搜索,本地模型质量快速提升,苹果等消费硬件已能流畅运行Qwen 3.6 35b MoE等模型,隐私需求(健康、金融等),以及浏览器WebGPU免安装、降低计算成本的优势。尽管云端算力持续增长、token成本下降,但本地推理的便利性和隐私性可能催生新的需求。
AI产品本地AIWebGPU浏览器推理隐私消费硬件

推荐理由:本地AI推理正在从概念走向实用,做浏览器应用或关注隐私的开发者值得关注WebGPU的潜力,它可能改变LLM的使用模式。
原文
精选全部日报登录