全部 AI 动态 · AI 热点

6月23日

08:12

08:12Simon Willison’s Weblog（博客/媒体）

Simon Willison在Hacker News发现Moebius 0.2B图像修复模型，声称拥有10B级性能，原本需PyTorch与CUDA。他决定利用Claude Code在终端辅助下，通过ONNX Runtime Web的WebGPU后端将该模型移植到浏览器中运行。最终成功制作出demo（地址simonw.github.io/moebius-web/），用户可上传图片、涂抹区域并一键修复。整个过程仅用数小时，且与Datasette项目并行开发。

技巧 Moebius Claude Code WebGPU 图像修复浏览器推理

推荐理由：Simon用Claude Code把0.2B参数的Moebius图像修复模型跑在浏览器里，无需显卡就能涂掉图片里的东西自动补全，挺酷的。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月20日

09:26

09:26

andrew chen@andrewchen

风险投资人Andrew Chen提出，未来相当比例的LLM查询可能通过本地AI模型在浏览器中运行WebGPU完成，无需发送到云端前沿模型。驱动因素包括：大量查询简单如谷歌搜索，本地模型质量快速提升，苹果等消费硬件已能流畅运行Qwen 3.6 35b MoE等模型，隐私需求（健康、金融等），以及浏览器WebGPU免安装、降低计算成本的优势。尽管云端算力持续增长、token成本下降，但本地推理的便利性和隐私性可能催生新的需求。

AI产品本地AI WebGPU 浏览器推理隐私消费硬件

推荐理由：本地AI推理正在从概念走向实用，做浏览器应用或关注隐私的开发者值得关注WebGPU的潜力，它可能改变LLM的使用模式。