精选理由
Gemma 4让机器人会看会聊
Open Duck机器人搭载了谷歌的Gemma 4模型,实现了视觉识别和自然语言对话。在演示中,它能识别书桌、水杯等物体并描述场景。机器人还能通过语音与用户进行多轮问答。该方案展示了40亿参数模型在边缘设备上的实时推理能力。
AI 翻译 · 中文
Open Duck机器人搭载了谷歌的Gemma 4模型,实现了视觉识别和自然语言对话。在演示中,它能识别书桌、水杯等物体并描述场景。机器人还能通过语音与用户进行多轮问答。该方案展示了40亿参数模型在边缘设备上的实时推理能力。
由Gemma 4 驱动的 Open Duck 机器人 有视觉能力,还能对话 Your browser does not support the video tag. 🔗 View on Twitter 💬 2 🔄 0 ❤️ 1 👀 134 📊 2 ⚡ Powered by xgo.ing
- arXiv cs.AI05-19 11:55原文