全部 AI 动态 · AI 热点

6月26日

09:39

向阳乔木@vista8

一个团队展示了能实时计数乒乓球颠球数的AI系统，并认为Physical AGI需要满足三个必要条件：统一的多模态大脑（非模型拼接）、在同一个大脑中完成任意模态的理解与生成、理解与生成以流式方式持续运行。最关键的一点是该大脑必须完整运行在端侧。团队还提供了更多介绍和演示视频。

AI模型 Physical AGI 多模态端侧模型智能体

推荐理由：看看这个团队对Physical AGI的看法，他们提出了3+1个必要条件，还做了颠球计数的演示，强调端侧运行和统一多模态大脑。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

23:25

23:25IT之家（博客/媒体）

苹果在 WWDC 26 上发布了新一代操作系统，并深度集成了 Apple Intelligence 的全新 Siri AI。但该功能对设备硬件有严格限制：iPhone 需 15 Pro 及以上机型，iPad 需 M1 或更新芯片，Mac 需 Apple Silicon 芯片。此外，高阶端侧 AI 模型（如个性化语音调节）仅限 iPhone 17 Pro 等更高端设备，且要求至少 12GB 统一内存。这意味着用户需升级到较新设备才能体验完整 Siri AI 功能，苹果设置了从系统兼容到基础 AI 再到高阶 AI 的三级门槛。

AI产品苹果 Siri AI 端侧模型硬件门槛 iPhone 15 Pro

推荐理由：想用苹果最新 Siri AI 的 iPhone 用户得先看看自己的设备是否在支持列表里，特别是高阶功能门槛更高，做购机决策的可以提前了解哪些机型被排除在外。

原文

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

12:20

小互@imxiaohu

苹果发布了全新Siri AI演示视频，展示了端侧模型与云端模型结合的升级方案。端侧负责处理本地信息调用、个人数据感知和场景理解，云端则处理复杂任务执行，基于Gemini模型定制而非完全采用。Siri成为独立App，支持自然对话、上下文记忆、跨应用操作，并能理解屏幕和镜头内容。照片、Safari、密码、快捷指令等均加入AI功能，如照片重新构图、浏览器标签自动归类、弱密码一键修改、快捷指令一句话搭建。演示整体感觉基础，缺乏激情。

AI产品 Siri 苹果端侧模型云端模型 Gemini

推荐理由：苹果Siri终于迎来AI升级，端侧+云端分工明确，基于Gemini定制而非照搬，做iOS生态或关注AI助手进化的开发者值得一看，看看苹果如何平衡隐私与能力。

原文

08:01

berryxia@berryxia

WWDC 2026 上，Tim Cook 最后一次以 CEO 身份主持，将于 9 月 1 日交接给 John Ternus。苹果推出 AI 双轨模型战略：3B 端侧模型（AFM 3 Core）和 20B MoE 模型（仅限 iPhone 17 Pro/M4 设备），强调数据隐私。Siri 升级支持连续对话、跨设备同步和视觉识别，但仅限英语，中国/欧盟暂不可用。应用生态智能化，Safari、密码、电话、快捷指令均有升级，影像方面 Image Playground 支持写实风格生成。开发者工具开放多模型选择和本地模型部署。整体缺乏颠覆性创新，Agent 能力未达预期。

AI产品 WWDC 2026 苹果 Siri 端侧模型 AI 双轨

推荐理由：苹果 AI 战略终于落地，但双轨模型和隐私承诺能否打动开发者？做 iOS 应用或关注端侧 AI 的团队值得看看苹果的差异化路径。

原文

6月4日

08:25

berryxia@berryxia

78°

Google 将 Gemma 4 12B 模型与 AI Edge 工具链深度整合，开发者可在笔记本上完全本地运行 Agentic 工作流。Mac 用户可通过 AI Edge Gallery 生成代码，AI Edge Eloquent 支持语音输入实时编辑文本。底层使用 LiteRT-LM 推理引擎，实现零网络、零延迟、数据全在本地。这标志着端侧 AI 从实验走向实用，让普通开发者能拥有私有的、可连续执行的本地 AI 队友。

AI产品端侧模型 Agentic 工作流 Gemma 4 Google AI Edge 本地推理

推荐理由：Google 把模型、推理引擎和开发工具链打包成一套方案，做端侧 AI 或隐私敏感应用的开发者可以直接在笔记本上跑 Agentic 工作流，建议试试 AI Edge Gallery 的代码生成功能。

原文

5月29日

07:36

marktechpost@Asif Razzaq

Liquid AI 发布了 LFM2.5-8B-A1B，一款面向端侧设备的混合专家（MoE）模型。该模型总参数量为 8.3B，但每次推理仅激活 1.5B 参数，大幅降低了计算和内存需求。它支持 128K 上下文长度，具备推理和工具调用能力，可在消费级硬件上运行。这标志着端侧 AI 模型在效率与能力之间取得了重要平衡，为移动设备和边缘计算场景提供了新的选择。

AI模型端侧模型 MoE Liquid AI 推理模型工具调用

推荐理由：端侧部署大模型一直受限于算力和内存，LFM2.5-8B-A1B 用 1.5B 激活参数实现 128K 上下文和工具调用，做移动端 AI 应用或边缘推理的开发者可以直接评估其性能。

原文

5月27日

07:22

berryxia@berryxia

PrismML 发布了 Bonsai Image 4B 扩散模型的 1-bit 和 Ternary 版本，分别仅 0.93GB 和 1.21GB，比全精度模型小 8.3 倍。在 Mac M4 Pro 上生成速度最高提升 5.6 倍，图像质量和提示词遵循度与更大模型相当。同时上线了 Bonsai Studio iOS App，支持 iPhone 本地离线生成图像，无需订阅或 API。这标志着高质量图像生成从云端真正走向个人设备。

AI模型端侧模型扩散模型图像生成模型压缩 PrismML

推荐理由：端侧生图终于不再妥协——Bonsai Image 4B 用极致压缩把云端级质量塞进手机，做移动端 AI 应用或离线创作工具的开发者可以直接在 iPhone 上试，无需联网和付费。

原文

5月26日

13:15

13:15IT之家（博客/媒体）

83°

面壁智能联合清华大学、OpenBMB 开源社区发布了 MiniCPM5-1B 端侧文本基座大模型。该模型仅 1B 参数，在 AA-Index 榜单上超越了所有 2B 参数以下模型，性能优于 3 个月前发布的 Qwen3.5-2B 且参数量减半。INT4 量化后权重仅 0.5GB，可直接在手机和浏览器上运行。模型权重、训练数据集与部署方案已全面开源，基于面壁智能自研的 ForgeTrain 框架预训练。

AI模型端侧模型开源/仓库 MiniCPM5-1B 面壁智能 AA-Index

推荐理由：端侧部署大模型终于有了小参数高性能的选择——做移动端 AI 应用或边缘计算的开发者，可以直接在手机或浏览器里跑这个模型，建议试试它的量化版本。

原文

5月21日

07:59

07:59IT之家（博客/媒体）

联想在“天禧 AI 一体多端全场景新品超能之夜”上正式发布天禧 AI 4.0 版本，强调从“被动调用”转向“自主执行”。新版本引入天禧 Claw，支持仿生记忆功能，利用 1.7B 多模态记忆模型实现情景、语义、程序记忆，模型完全本地部署保证离线安全。同时提供个人知识库，支持 PDF、Word、表格、音视频等原始文档，结合知识图谱实现高效管理。此外，还推出模型广场、智能体广场和 Skills 技能广场，允许用户上传技能供他人使用。

AI产品联想天禧AI 端侧模型个人知识库技能广场

推荐理由：天禧 AI 4.0 的 Claw 仿生记忆和本地部署解决了隐私与智能化的平衡问题，适合联想设备用户和关注端侧 AI 的开发者直接体验。

原文

5月11日

22:15

AK@_akhaliq

MiniCPM-o 4.5 是新一代端侧多模态大模型，支持实时全双工对话，即同时进行语音输入和输出。该模型在保持高效推理的同时，实现了文本、图像、语音等多种模态的协同理解与生成。论文已公开，展示了其在边缘设备上实现接近人类交互体验的潜力。这一进展对于智能助理、可穿戴设备等场景具有重要意义。

AI模型多模态语音交互端侧模型实时对话

推荐理由：MiniCPM-o 4.5 在端侧实现全双工多模态交互，降低了实时对话AI的部署门槛，为移动设备和物联网应用提供了新的技术路径。

原文