AK@_akhaliq60MiniCPM-o 4.5 是新一代端侧多模态大模型,支持实时全双工对话,即同时进行语音输入和输出。该模型在保持高效推理的同时,实现了文本、图像、语音等多种模态的协同理解与生成。论文已公开,展示了其在边缘设备上实现接近人类交互体验的潜力。这一进展对于智能助理、可穿戴设备等场景具有重要意义。AI模型多模态语音交互端侧模型实时对话推荐理由:MiniCPM-o 4.5 在端侧实现全双工多模态交互,降低了实时对话AI的部署门槛,为移动设备和物联网应用提供了新的技术路径。