09:39向阳乔木@vista8一个团队展示了能实时计数乒乓球颠球数的AI系统,并认为Physical AGI需要满足三个必要条件:统一的多模态大脑(非模型拼接)、在同一个大脑中完成任意模态的理解与生成、理解与生成以流式方式持续运行。最关键的一点是该大脑必须完整运行在端侧。团队还提供了更多介绍和演示视频。AI模型Physical AGI多模态端侧模型智能体推荐理由:看看这个团队对Physical AGI的看法,他们提出了3+1个必要条件,还做了颠球计数的演示,强调端侧运行和统一多模态大脑。原文
12:20小互@imxiaohu苹果发布了全新Siri AI演示视频,展示了端侧模型与云端模型结合的升级方案。端侧负责处理本地信息调用、个人数据感知和场景理解,云端则处理复杂任务执行,基于Gemini模型定制而非完全采用。Siri成为独立App,支持自然对话、上下文记忆、跨应用操作,并能理解屏幕和镜头内容。照片、Safari、密码、快捷指令等均加入AI功能,如照片重新构图、浏览器标签自动归类、弱密码一键修改、快捷指令一句话搭建。演示整体感觉基础,缺乏激情。AI产品Siri苹果端侧模型云端模型Gemini推荐理由:苹果Siri终于迎来AI升级,端侧+云端分工明确,基于Gemini定制而非照搬,做iOS生态或关注AI助手进化的开发者值得一看,看看苹果如何平衡隐私与能力。原文
08:01berryxia@berryxiaWWDC 2026 上,Tim Cook 最后一次以 CEO 身份主持,将于 9 月 1 日交接给 John Ternus。苹果推出 AI 双轨模型战略:3B 端侧模型(AFM 3 Core)和 20B MoE 模型(仅限 iPhone 17 Pro/M4 设备),强调数据隐私。Siri 升级支持连续对话、跨设备同步和视觉识别,但仅限英语,中国/欧盟暂不可用。应用生态智能化,Safari、密码、电话、快捷指令均有升级,影像方面 Image Playground 支持写实风格生成。开发者工具开放多模型选择和本地模型部署。整体缺乏颠覆性创新,Agent 能力未达预期。AI产品WWDC 2026苹果Siri端侧模型AI 双轨推荐理由:苹果 AI 战略终于落地,但双轨模型和隐私承诺能否打动开发者?做 iOS 应用或关注端侧 AI 的团队值得看看苹果的差异化路径。原文
08:25berryxia@berryxia78°Google 将 Gemma 4 12B 模型与 AI Edge 工具链深度整合,开发者可在笔记本上完全本地运行 Agentic 工作流。Mac 用户可通过 AI Edge Gallery 生成代码,AI Edge Eloquent 支持语音输入实时编辑文本。底层使用 LiteRT-LM 推理引擎,实现零网络、零延迟、数据全在本地。这标志着端侧 AI 从实验走向实用,让普通开发者能拥有私有的、可连续执行的本地 AI 队友。AI产品端侧模型Agentic 工作流Gemma 4Google AI Edge本地推理10 个信源在谈推荐理由:Google 把模型、推理引擎和开发工具链打包成一套方案,做端侧 AI 或隐私敏感应用的开发者可以直接在笔记本上跑 Agentic 工作流,建议试试 AI Edge Gallery 的代码生成功能。原文
07:22berryxia@berryxiaPrismML 发布了 Bonsai Image 4B 扩散模型的 1-bit 和 Ternary 版本,分别仅 0.93GB 和 1.21GB,比全精度模型小 8.3 倍。在 Mac M4 Pro 上生成速度最高提升 5.6 倍,图像质量和提示词遵循度与更大模型相当。同时上线了 Bonsai Studio iOS App,支持 iPhone 本地离线生成图像,无需订阅或 API。这标志着高质量图像生成从云端真正走向个人设备。AI模型端侧模型扩散模型图像生成模型压缩PrismML推荐理由:端侧生图终于不再妥协——Bonsai Image 4B 用极致压缩把云端级质量塞进手机,做移动端 AI 应用或离线创作工具的开发者可以直接在 iPhone 上试,无需联网和付费。原文