全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月20日

09:26

09:26

andrew chen@andrewchen

风险投资人Andrew Chen提出，未来相当比例的LLM查询可能通过本地AI模型在浏览器中运行WebGPU完成，无需发送到云端前沿模型。驱动因素包括：大量查询简单如谷歌搜索，本地模型质量快速提升，苹果等消费硬件已能流畅运行Qwen 3.6 35b MoE等模型，隐私需求（健康、金融等），以及浏览器WebGPU免安装、降低计算成本的优势。尽管云端算力持续增长、token成本下降，但本地推理的便利性和隐私性可能催生新的需求。

AI产品本地AI WebGPU 浏览器推理隐私消费硬件

推荐理由：本地AI推理正在从概念走向实用，做浏览器应用或关注隐私的开发者值得关注WebGPU的潜力，它可能改变LLM的使用模式。