09:39向阳乔木@vista8一个团队展示了能实时计数乒乓球颠球数的AI系统,并认为Physical AGI需要满足三个必要条件:统一的多模态大脑(非模型拼接)、在同一个大脑中完成任意模态的理解与生成、理解与生成以流式方式持续运行。最关键的一点是该大脑必须完整运行在端侧。团队还提供了更多介绍和演示视频。AI模型Physical AGI多模态端侧模型智能体推荐理由:看看这个团队对Physical AGI的看法,他们提出了3+1个必要条件,还做了颠球计数的演示,强调端侧运行和统一多模态大脑。原文
23:25IT之家(博客/媒体)苹果在 WWDC 26 上发布了新一代操作系统,并深度集成了 Apple Intelligence 的全新 Siri AI。但该功能对设备硬件有严格限制:iPhone 需 15 Pro 及以上机型,iPad 需 M1 或更新芯片,Mac 需 Apple Silicon 芯片。此外,高阶端侧 AI 模型(如个性化语音调节)仅限 iPhone 17 Pro 等更高端设备,且要求至少 12GB 统一内存。这意味着用户需升级到较新设备才能体验完整 Siri AI 功能,苹果设置了从系统兼容到基础 AI 再到高阶 AI 的三级门槛。AI产品苹果Siri AI端侧模型硬件门槛iPhone 15 Pro推荐理由:想用苹果最新 Siri AI 的 iPhone 用户得先看看自己的设备是否在支持列表里,特别是高阶功能门槛更高,做购机决策的可以提前了解哪些机型被排除在外。原文
12:20小互@imxiaohu苹果发布了全新Siri AI演示视频,展示了端侧模型与云端模型结合的升级方案。端侧负责处理本地信息调用、个人数据感知和场景理解,云端则处理复杂任务执行,基于Gemini模型定制而非完全采用。Siri成为独立App,支持自然对话、上下文记忆、跨应用操作,并能理解屏幕和镜头内容。照片、Safari、密码、快捷指令等均加入AI功能,如照片重新构图、浏览器标签自动归类、弱密码一键修改、快捷指令一句话搭建。演示整体感觉基础,缺乏激情。AI产品Siri苹果端侧模型云端模型Gemini推荐理由:苹果Siri终于迎来AI升级,端侧+云端分工明确,基于Gemini定制而非照搬,做iOS生态或关注AI助手进化的开发者值得一看,看看苹果如何平衡隐私与能力。原文
08:01berryxia@berryxiaWWDC 2026 上,Tim Cook 最后一次以 CEO 身份主持,将于 9 月 1 日交接给 John Ternus。苹果推出 AI 双轨模型战略:3B 端侧模型(AFM 3 Core)和 20B MoE 模型(仅限 iPhone 17 Pro/M4 设备),强调数据隐私。Siri 升级支持连续对话、跨设备同步和视觉识别,但仅限英语,中国/欧盟暂不可用。应用生态智能化,Safari、密码、电话、快捷指令均有升级,影像方面 Image Playground 支持写实风格生成。开发者工具开放多模型选择和本地模型部署。整体缺乏颠覆性创新,Agent 能力未达预期。AI产品WWDC 2026苹果Siri端侧模型AI 双轨推荐理由:苹果 AI 战略终于落地,但双轨模型和隐私承诺能否打动开发者?做 iOS 应用或关注端侧 AI 的团队值得看看苹果的差异化路径。原文
08:25berryxia@berryxia78°Google 将 Gemma 4 12B 模型与 AI Edge 工具链深度整合,开发者可在笔记本上完全本地运行 Agentic 工作流。Mac 用户可通过 AI Edge Gallery 生成代码,AI Edge Eloquent 支持语音输入实时编辑文本。底层使用 LiteRT-LM 推理引擎,实现零网络、零延迟、数据全在本地。这标志着端侧 AI 从实验走向实用,让普通开发者能拥有私有的、可连续执行的本地 AI 队友。AI产品端侧模型Agentic 工作流Gemma 4Google AI Edge本地推理10 个信源在谈推荐理由:Google 把模型、推理引擎和开发工具链打包成一套方案,做端侧 AI 或隐私敏感应用的开发者可以直接在笔记本上跑 Agentic 工作流,建议试试 AI Edge Gallery 的代码生成功能。原文
07:36marktechpost@Asif RazzaqLiquid AI 发布了 LFM2.5-8B-A1B,一款面向端侧设备的混合专家(MoE)模型。该模型总参数量为 8.3B,但每次推理仅激活 1.5B 参数,大幅降低了计算和内存需求。它支持 128K 上下文长度,具备推理和工具调用能力,可在消费级硬件上运行。这标志着端侧 AI 模型在效率与能力之间取得了重要平衡,为移动设备和边缘计算场景提供了新的选择。AI模型端侧模型MoELiquid AI推理模型工具调用推荐理由:端侧部署大模型一直受限于算力和内存,LFM2.5-8B-A1B 用 1.5B 激活参数实现 128K 上下文和工具调用,做移动端 AI 应用或边缘推理的开发者可以直接评估其性能。原文
07:22berryxia@berryxiaPrismML 发布了 Bonsai Image 4B 扩散模型的 1-bit 和 Ternary 版本,分别仅 0.93GB 和 1.21GB,比全精度模型小 8.3 倍。在 Mac M4 Pro 上生成速度最高提升 5.6 倍,图像质量和提示词遵循度与更大模型相当。同时上线了 Bonsai Studio iOS App,支持 iPhone 本地离线生成图像,无需订阅或 API。这标志着高质量图像生成从云端真正走向个人设备。AI模型端侧模型扩散模型图像生成模型压缩PrismML推荐理由:端侧生图终于不再妥协——Bonsai Image 4B 用极致压缩把云端级质量塞进手机,做移动端 AI 应用或离线创作工具的开发者可以直接在 iPhone 上试,无需联网和付费。原文
13:15IT之家(博客/媒体)83°面壁智能联合清华大学、OpenBMB 开源社区发布了 MiniCPM5-1B 端侧文本基座大模型。该模型仅 1B 参数,在 AA-Index 榜单上超越了所有 2B 参数以下模型,性能优于 3 个月前发布的 Qwen3.5-2B 且参数量减半。INT4 量化后权重仅 0.5GB,可直接在手机和浏览器上运行。模型权重、训练数据集与部署方案已全面开源,基于面壁智能自研的 ForgeTrain 框架预训练。AI模型端侧模型开源/仓库MiniCPM5-1B面壁智能AA-Index推荐理由:端侧部署大模型终于有了小参数高性能的选择——做移动端 AI 应用或边缘计算的开发者,可以直接在手机或浏览器里跑这个模型,建议试试它的量化版本。原文
07:59IT之家(博客/媒体)联想在“天禧 AI 一体多端全场景新品超能之夜”上正式发布天禧 AI 4.0 版本,强调从“被动调用”转向“自主执行”。新版本引入天禧 Claw,支持仿生记忆功能,利用 1.7B 多模态记忆模型实现情景、语义、程序记忆,模型完全本地部署保证离线安全。同时提供个人知识库,支持 PDF、Word、表格、音视频等原始文档,结合知识图谱实现高效管理。此外,还推出模型广场、智能体广场和 Skills 技能广场,允许用户上传技能供他人使用。AI产品联想天禧AI端侧模型个人知识库技能广场推荐理由:天禧 AI 4.0 的 Claw 仿生记忆和本地部署解决了隐私与智能化的平衡问题,适合联想设备用户和关注端侧 AI 的开发者直接体验。原文
22:15AK@_akhaliqMiniCPM-o 4.5 是新一代端侧多模态大模型,支持实时全双工对话,即同时进行语音输入和输出。该模型在保持高效推理的同时,实现了文本、图像、语音等多种模态的协同理解与生成。论文已公开,展示了其在边缘设备上实现接近人类交互体验的潜力。这一进展对于智能助理、可穿戴设备等场景具有重要意义。AI模型多模态语音交互端侧模型实时对话推荐理由:MiniCPM-o 4.5 在端侧实现全双工多模态交互,降低了实时对话AI的部署门槛,为移动设备和物联网应用提供了新的技术路径。原文