12:34berryxia@berryxia阿里通义实验室新视频指出,具身智能的核心难点在于物理世界的不确定性。机器人面临传感器噪声、执行延迟、环境变化等挑战,简单抓取动作可能因光线、摩擦差异失败。相比之下,语言和代码世界的scaling law仍在快速进步。行业通义实验室具身智能机器人物理世界推荐理由:想看AI在真实世界碰壁?阿里通义实验室这个视频讲透了机器人拿鸡蛋为啥那么难。原文
00:02Gary Marcus@GaryMarcus精选Gary Marcus引用Matei Zaharia的研究,神经符号系统在机器人领域击败当前最优方法。该方法采用AI驱动的搜索(类似GEPA的方法),让AI生成AI与代码的混合体。Zaharia认为这类系统效率很高,并在其他应用中也观察到类似效果。该成果展示了神经符号系统在控制与规划方面的优势。AI模型Neurosymbolic SystemsGEPARoboticsAI Search机器人推荐理由:Gary Marcus分享了Matei Zaharia的神经符号系统研究,用AI搜索在机器人上打败了现有最优方案,值得搞机器人或符号推理的人关注。原文
03:06Jim Fan@DrJimFan精选76°Jim Fan揭秘了物理自动研究系统ENPIRE的设计内幕。安全采用两层硬编码:硬运动学限制立即触发任务失败并自动重置,以及扭矩限制柔性夹爪防止碰撞损坏。奖励函数通过收集成功/失败演示、用计算机视觉分类器编码并冻结在Gym环境中,防止智能体篡改。系统遥测定义了Mean Robot Utilization(MRU)、Mean Token Utilization(MTU)和GPU利用率三个实时指标,并基于Tokens-to-Success和Time-to-Success评估预算效率。AI模型ENPIRE物理自动研究安全机制机器人奖励函数2 个信源在谈推荐理由:Jim Fan讲了他们怎么让8个机器人通宵自动做实验,还防止奖励被篡改,资源利用率指标也很实用。原文
02:14Jim Fan@jimfan76°Jim Fan团队推出ENPIRE系统,让8个Codex智能体操控机器人舰队自主进行物理实验。系统硬编码两层安全机制:硬运动学限制和扭矩限制夹爪,防止机器人超出安全范围。通过人类演示几分钟成功/失败样本,智能体编写计算机视觉代码生成分类器作为冻结奖励函数。定义Mean Robot Utilization(MRU)和Mean Token Utilization(MTU)监控资源,以Tokens-to-Success和Time-to-Success衡量效率。AI模型ENPIRECodex机器人智能体安全2 个信源在谈推荐理由:Jim Fan展示了ENPIRE,8个机器人靠Codex智能体自主做实验,安全机制和资源监控设计挺有意思。原文
23:31阿里云 Alibaba Cloud@alibaba_cloud阿里云推出EdgeAgent Arena竞赛,旨在将Qwen模型应用于机器人及IoT设备。参赛者需构建通过边缘传感器感知并本地行动的硬件系统。竞赛总奖金超过70,000美元,注册现已开放。该活动鼓励利用Qwen在边缘场景中实现智能决策与本地执行。行业QwenAlibaba CloudEdgeAgent Arena机器人边缘计算推荐理由:阿里云搞了个比赛,用Qwen做边缘机器人,奖金7万美元,想动手的可以报名试试。原文
23:17AI Will@FinanceYF573°NVIDIA在SIGGRAPH 2026上发布MotionBricks,该AI模型支持超过35万种动作技能。它可实现15,000 FPS的推理速度和2毫秒延迟,让游戏角色和机器人即时切换移动风格。MotionBricks专为游戏和机器人领域设计,能动态生成自然动作。AI模型MotionBricksNVIDIA游戏角色机器人动作生成7 个信源在谈推荐理由:NVIDIA搞了个MotionBricks,35万种动作技能随便切换,游戏角色和机器人动起来更自然了,比以前的方案快很多。原文
04:49阿里通义 Qwen@Alibaba_Qwen阿里巴巴Qwen团队推出Qwen-Robot Suite,将大语言模型能力扩展到物理世界。该套件使AI能够执行真实的机器人动作,而不仅仅是文本对话。更多演示视频可在官方博客qwen.ai/blog?id=qwen-r...查看。目前该推文获得63个点赞和5812次浏览。AI模型QwenQwen-Robot Suite阿里巴巴机器人推荐理由:Qwen机器人套件让AI从聊天变动手,看看它怎么在现实里干活原文
03:03berryxia@berryxia73°NVIDIA开源了SOMA-X v0.2,一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性,采用Apache 2.0许可证。它专为机器人和物理AI设计,可用于机器人训练、物理仿真和动作迁移,解决了不同机器人体型不统一导致动作数据难以复用的问题。AI模型SOMA-XNVIDIA3D人体模型机器人物理AI10 个信源在谈推荐理由:NVIDIA开源了SOMA-X v0.2,单一骨架就能适配不同体型,机器人动作数据复用门槛降低,训练效率提升。原文
01:58Jim Fan@jimfan精选72°ENPIRE赋予8个Codex智能体机器人集群和GPU资源,自主完成高精度物理任务。系统能独立绑扎带、整理细针、安装GPU。实验显示8台机器人并行探索比少量效率显著提升。NVIDIA GEAR实验室已实现机器人彻夜自主改进。团队计划开源全部代码。AI产品ENPIRECodexNVIDIA智能体机器人10 个信源在谈推荐理由:NVIDIA让8个AI智能体自己控制机器人干活,还能绑扎带装显卡,而且要开源,你可以在家搭机器人实验室了!原文
01:57Jim Fan@jimfan76°NVIDIA联合CMU和伯克利推出ENPIRE系统,让AI智能体完全自主控制真实机器人循环,包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化,无需人类介入。AI模型ENPIRENVIDIA机器人智能体自主循环8 个信源在谈推荐理由:NVIDIA搞了个ENPIRE,让AI自己操控机器人反复试错,真实任务成功率干到99%,连GPU都能自己插。原文
01:06Y Combinator@ycombinatorHub 是一个通过全球贡献者网络采集真实世界数据的新平台。人类劳动力占全球GDP的一半,但绝大部分从未被记录。Hub 为前沿AI实验室和机器人公司开放访问这些难以获取的数据。该平台由 Y Combinator 支持,创始人 @xarmin 和 @tim404x 今日正式发布。AI产品Hub训练数据数据采集AI实验室机器人推荐理由:Hub刚上线,它用全球贡献者网络帮你采集人类真实劳动力数据,解决AI训练数据稀缺问题。原文
22:23rohanpaul_ai@rohanpaul_aiSony AI开发的Ace机器人在国际乒联官方规则下击败了职业选手Miyuu Kihara。相关研究发表在《自然》杂志,论文标题为“Outplaying elite table tennis players with an autonomous robot”。该机器人展示了在动态对抗运动中超越人类精英的能力。论文Sony AIAceMiyuu Kihara机器人乒乓球推荐理由:机器人赢了职业选手原文
13:26berryxia@berryxiaAether AI创始人黄碧薇教授指出,当前视频生成模型仅学习“手靠近杯子时杯子会动”的相关性,而非因果机制。其团队benchmark显示,因果结构可使机器人任务成功率提升25-50%,样本需求降低5-10倍。在物理世界如机器人、自动驾驶中,相关性模型易产生危险幻觉,因果世界模型旨在让AI理解机制而非表象。行业Aether AI因果模型机器人视频生成推荐理由:黄碧薇讲透了AI在物理世界的短板原文
13:15Physical Intelligence@physical_int精选Physical Intelligence 开发了一种强化学习(RL)方法,用于在数小时甚至数分钟内微调其模型以执行精确任务。该方法不训练整个模型,而是向最新模型 π-0.6 添加一个“RL token”输出,由小型 actor 和 critic 网络使用,通过 RL 快速学习。这大幅降低了模型微调的时间和计算成本,适用于机器人等需要快速适应新任务的场景。该技术有望加速 AI 在物理世界中的应用部署。AI模型强化学习微调π-0.6机器人Physical Intelligence推荐理由:Physical Intelligence 的 RL 微调方法解决了模型适应新任务耗时长的痛点,做机器人或物理 AI 的团队可以大幅缩短部署周期,值得关注。原文
13:14Physical Intelligence@physical_int精选Physical Intelligence 为其机器人模型开发了一套记忆系统,结合了短期视觉记忆和长期语义记忆。该系统使机器人能够执行复杂的长任务,如清理厨房或从头制作烤奶酪三明治。这一突破解决了机器人长期任务执行中的记忆瓶颈,提升了自主性和实用性。AI模型机器人记忆系统Physical Intelligence长期任务视觉记忆推荐理由:机器人团队终于有了实用的记忆方案——短期视觉+长期语义让机器人能完成厨房清理、做三明治等长任务,做机器人开发的建议点开看看。原文
13:14Physical Intelligence@physical_intPhysical Intelligence公司提出,通用AI模型已驱动许多数字应用,而类似π0.6的“物理智能层”将推动物理世界的新应用。该公司已与多家企业合作,部署机器人执行实际任务。π0.6模型旨在为机器人提供通用智能,使其能适应复杂物理环境。这一进展标志着AI从数字领域向物理世界的扩展,有望加速机器人商业化应用。AI模型π0.6物理智能机器人通用模型Physical Intelligence推荐理由:Physical Intelligence的π0.6模型正在将AI能力从数字世界延伸到物理世界,做机器人或自动化应用的团队值得关注——它可能成为机器人通用智能的基础层。原文
12:05Allen AI (Ai2)@allen_ai精选Allen AI 宣布其机器人基础模型 MolmoAct 2 在不到一个月内被下载超过 40 万次。现在他们开源了完整的代码和训练数据,允许开发者进行微调或在此基础上构建。这标志着机器人领域的一个重要开放资源,降低了进入门槛。AI模型机器人开源/仓库基础模型微调Allen AI推荐理由:机器人开发者终于有了一个完全开源的基础模型可用,MolmoAct 2 的完整代码和数据让你可以直接微调或构建自己的机器人应用,值得立即尝试。原文
06:16NVIDIA AI@NVIDIAAI精选NVIDIA Research发布开放模型MotionBricks,基于35万+运动片段实现每秒15,000帧的实时角色动画。该模型无需手工制作过渡或微调,可直接用于角色动画,并支持机器人应用。相关论文将发表于SIGGRAPH 2026,代码和演示已开源。AI模型MotionBricksNVIDIA角色动画实时机器人10 个信源在谈推荐理由:NVIDIA开源实时动画,35万片段15K FPS原文
00:35NVIDIA AI@NVIDIAAI精选NVIDIA 发布了 Cosmos 3,这是一个专为机器人和物理 AI 设计的基础模型平台。该平台旨在加速机器人感知、规划和交互能力的开发,通过提供预训练模型和工具链,降低物理 AI 应用的门槛。Cosmos 3 支持多模态输入,能够生成高保真的物理世界模拟,帮助开发者更快地训练和部署机器人系统。这一发布标志着 NVIDIA 在物理 AI 领域的重要布局,有望推动机器人技术从实验室走向实际应用。AI产品机器人物理AINVIDIA基础模型仿真5 个信源在谈推荐理由:NVIDIA Cosmos 3 为机器人开发者提供了现成的物理 AI 基础模型,省去了从零训练的时间和成本,做机器人感知或仿真的团队可以直接上手试试。原文
22:14rohanpaul_ai@rohanpaul_ai机器人开发缓慢的瓶颈在于每次改动都需要物理环境、人员和实地测试。Antioch 推出了 Antioch Agent,一个基于浏览器的机器人模拟器,能够运行现有机器人软件,连接虚拟传感器和执行器,让开发者无需依赖物理硬件即可测试机器人行为。这相当于为机器人领域引入了软件团队早已依赖的测试系统,有望大幅缩短开发周期。AI产品机器人模拟器Antioch物理AI测试工具推荐理由:机器人开发者终于有了像软件测试一样的模拟环境,Antioch Agent 解决了物理测试耗时耗力的问题,做机器人或物理AI的团队可以直接在浏览器里跑测试,值得一试。原文
20:38PolymarketMoney@PolymarketMoneyNVIDIA($NVDA)与 NBIS($NBIS)联合启动了 Physical AI Living Lab,这是一个专为机器人初创公司设计的实体 AI 实验室。该实验室旨在为初创企业提供物理环境、计算资源和数据支持,加速机器人技术的研发与落地。此举标志着 AI 从虚拟世界向物理世界的延伸,对机器人行业具有重要推动作用。初创公司可借此降低开发门槛,更快实现产品原型测试。AI产品机器人Physical AINVIDIANBIS初创公司8 个信源在谈推荐理由:机器人初创公司终于有了实体 AI 试验场——NVIDIA 和 NBIS 的 Living Lab 解决了从仿真到现实部署的痛点,做机器人开发的团队值得关注,可以直接申请使用。原文
05:48rohanpaul_ai@rohanpaul_ai美国提出一项新法案《GUARD Act》,要求安全机构审查来自中国等对手国家的机器人,并将高风险系统列入 FCC 的“覆盖清单”,类似对华为和中兴的限制。法案担忧机器人不仅是摄像头、麦克风、传感器等设备的集合,更是在工厂、实验室、家庭和警察局中移动的计算机。另一项由舒默和科顿提出的法案将禁止联邦机构购买或使用中国人形机器人,但允许受控的军事或执法研究例外。此举旨在防范数据安全和间谍风险,可能影响中国机器人企业在美市场。行业机器人美国法案出口管制数据安全GUARD Act推荐理由:做机器人出口或跨境业务的团队需要关注——GUARD Act 可能直接封堵中国机器人进入美国市场,类似华为禁令的升级版,建议提前评估合规风险。原文
03:26Y Combinator@ycombinator9Mothers 公司为美国国防部开发 AI 任务系统,其首款产品 EDDA 是一款小型机器人,专门用于对抗 Group 1 自杀式无人机。该机器人设计得足够小巧和廉价,可以部署在每一辆车辆、每一个阵地和每一处资产上,实现全面防护。YC 宣布其正式发布,创始人 Roman 和 Bogdan 获得祝贺。这一产品有望改变战场上的低成本无人机防御格局。AI产品反无人机军事 AI机器人YC 孵化EDDA推荐理由:EDDA 解决了战场上小型无人机威胁的痛点,做军事安防或机器人防御的团队值得关注——它把高端反无人机能力做成了可大规模部署的廉价方案。原文
00:42The Rundown AI@therundownaiiRobot 联合创始人 Colin Angle 推出新公司 Familiar Machines & Magic,首款产品是一只毛绒熊外观的四足机器人。该机器人拥有 23 个电动关节、触感毛皮、摄像头和麦克风,通过动作而非语音交流。内置 AI 赋予其个性和记忆,用户数据不上云。除了陪伴功能,还能帮助用户养成健康习惯,如限制屏幕时间。AI产品机器人陪伴机器人iRobotColin AngleFamiliar Machines & Magic推荐理由:Colin Angle 从扫地机器人转向情感陪伴机器人,做智能硬件或机器人产品的团队值得关注这个新方向——毛绒+AI 的组合可能打开家庭场景的新市场。原文
00:14Qdrant@qdrant_engineAWS 的 Sandhya Subramani 将在 Vector Space Day 上展示一个开源智能体框架,允许用户通过自然语言直接控制机器人。该框架将物理硬件暴露为可编程的智能体工具,采用混合架构:边缘端负责低延迟控制,云端处理复杂推理。这一演示旨在让具身 AI 更易用,降低机器人编程门槛。活动将于 6 月 11 日在旧金山 Midway 举行。AI产品开源/仓库智能体具身AI机器人AWS推荐理由:机器人开发者终于可以像聊天一样指挥硬件了——这个开源框架把物理设备变成智能体工具,边缘+云端分工明确,做机器人或 IoT 的团队值得关注,可以直接用起来。原文
00:27The Rundown AI@therundownai巴黎初创公司 SquareMind 完成 1800 万美元 A 轮融资,推出全球首台标准化全身皮肤镜成像机器人 Swan。该机器人由“手术机器人之父”Fred Moll 创立的 Sonder Capital 领投,能在几分钟内用机械臂扫描患者全身皮肤,结合 AI 软件追踪新旧痣的变化。Swan 解决了皮肤科预约等待数月、且 80% 黑色素瘤为新发皮损的临床痛点,预计今年晚些时候在美欧上市。AI产品AI 医疗皮肤癌筛查机器人SquareMindSwan推荐理由:皮肤科医生和患者终于有了高效筛查工具——Swan 把全身皮肤扫描从数小时缩短到几分钟,AI 还能自动对比历史影像,做皮肤癌早筛的团队值得关注。原文
02:53NVIDIA AI@NVIDIAAI78°NVIDIA 宣布推出 Cosmos 3,号称首个面向物理 AI 的全模态模型。该模型能够处理多种输入模态(如文本、图像、视频等),并应用于机器人、自动驾驶等物理世界场景。官方展示了多个令人惊叹的示例,体现了模型在理解与生成物理交互方面的能力。这标志着 AI 从数字世界向物理世界迈出了重要一步。AI模型物理AI全模态模型NVIDIA机器人自动驾驶10 个信源在谈推荐理由:做机器人或自动驾驶的开发者终于有了一个能统一处理多模态输入的物理 AI 模型,值得看看它能带来哪些新可能。原文
16:02rohanpaul_ai@rohanpaul_ai英伟达CEO黄仁勋在台北与SK海力士、三星、LG和Naver等韩国科技巨头高管会面。此举凸显韩国在英伟达供应链中的重要性日益增长,这些企业提供内存、设备、工厂、软件以及机器人领域的大规模需求。受此乐观情绪影响,韩国科技股普遍上涨。行业英伟达韩国科技供应链半导体机器人1 个信源在谈推荐理由:黄仁勋亲自组局,说明韩国在英伟达AI硬件和机器人生态中的角色正在升级,关注半导体和供应链的投资者、从业者值得留意这一信号。原文
03:02Y Combinator@ycombinatorIntelligence Factory 是一家专注于为机器人构建人类智能的初创公司,通过收集人类演示数据(包括视觉、动作和触觉),训练通用操作模型。这些模型已部署在仓库、杂货店和数据中心等实际场景中。该公司由 Y Combinator 支持并宣布正式启动,旨在解决机器人泛化操作能力不足的问题。AI产品机器人通用操作模型人类演示数据Y Combinator部署应用推荐理由:机器人领域终于有了从数据到部署的完整闭环,做仓储自动化或服务机器人的团队值得关注,可以直接参考他们的数据收集和模型训练方法。原文
15:06NVIDIA AI@NVIDIAAI精选NVIDIA AI 发布了一个基于数十亿跨模态样本训练的多模态预训练模型,旨在为开发者提供强大的基础模型,用于构建物理AI系统。该模型能显著减少所需的数据量和训练成本,使开发者能够更高效地开发机器人、自动驾驶等物理AI应用。NVIDIA 在技术博客中详细介绍了该模型的架构和性能优势。AI模型NVIDIA多模态模型预训练模型物理AI机器人8 个信源在谈推荐理由:做物理AI(如机器人、自动驾驶)的开发者终于有了一个强大的预训练基础,能大幅降低数据收集和训练成本,建议直接查看技术博客了解细节。原文
09:36Greg Brockman@gdbOpenAI Robotics 正在快速推进物理世界 AI 的研发,目标是让 AI 在现实世界中帮助人类。短期重点是为熟练工人制造机器人,支持基础设施建设;长期愿景是让每个人拥有个人机器人。团队由 Aditya Ramesh 领导,基于硬件与 ML 研究的协同设计。目前正在招聘全栈硬件、运营、系统和 ML 工程师,要求有卓越成就。行业机器人具身智能OpenAI招聘硬件10 个信源在谈推荐理由:OpenAI 正式重启机器人团队,从模拟研究转向硬件落地,做机器人或具身智能的开发者值得关注——这是少有的从硬件到 ML 全栈招聘,机会难得。原文
01:29Sam Altman@sama76°OpenAI 宣布成立 OpenAI Robotics 部门,并开始招聘全栈硬件、运营、系统和机器学习工程师。该部门由 Aditya Ramesh 领导的世界模拟研究项目在过去一年中演变而来,专注于编程和制造对社会有用的机器人。短期目标是支持技术工人建设未来基础设施,长期愿景是让每个人拥有能完成任何任务的个人机器人。OpenAI 强调机器人硬件与 ML 研究的协同设计,并邀请有卓越成就的工程师加入。行业OpenAI机器人招聘硬件机器学习10 个信源在谈推荐理由:OpenAI 正式进军机器人领域,硬件与 ML 协同设计思路值得关注,做机器人或具身智能的工程师可以直接投递简历。原文
23:50AK@_akhaliq精选Qwen-VLA 是一个统一的视觉-语言-动作模型,旨在跨任务、环境和机器人本体进行泛化。该模型通过融合视觉与语言指令,直接输出机器人动作。在多个基准测试中,Qwen-VLA 展示了优于现有方法的性能,尤其是在零样本泛化场景。其架构基于 ViT-L 视觉编码器和 Qwen2.5 语言基座。AI模型Qwen-VLA机器人多模态视觉-语言-动作推荐理由:通才机器人模型来了原文
17:12berryxia@berryxia76°中国机器人公司 Unitree 发布 WVLA 2.0 在真实会议室中的多任务清理测试视频,机器人全程自主识别垃圾、分类处理、擦桌子、摆放物品,面对外部干扰(人员走动、物品晃动)仍能稳定完成任务。视频为单次拍摄、无剪辑、无人工遥控,展示了机器人从实验室走向真实场景的关键突破。Unitree 以四足机器人起家,此次 WVLA 2.0 是其向实用场景机器人迈出的重要一步,背后体现了国产机器人在技术封锁下的工程实力。该视频引发全球机器人社区热议,被视为未来办公室/家庭清洁机器人的雏形。AI产品Unitree机器人实用场景清洁机器人国产技术推荐理由:做机器人或关注 AI 落地的开发者,这个视频值得看——Unitree 用真实场景证明了机器人不是实验室玩具,而是能解决日常杂务的实用工具。原文
16:28rohanpaul_ai@rohanpaul_ai李飞飞在a16z视频中定义机器人不是按人形或汽车等形态,而是按功能:任何必须在物理3D空间中感知、理解并行动的“具身机器”。她提出“空间智能”是机器人的统一原则,使机器人能执行任务并与人类协作。她指出人类一直局限于单一物理地球3D世界,但结合3D生成与重建的新技术正在打破这一限制,创造出无限数字宇宙,可用于训练机器人、激发创造力、旅行和叙事。论文机器人空间智能3D生成具身智能a16z推荐理由:李飞飞讲机器人本质,清晰又启发原文
02:57Y Combinator@ycombinatorSynphony 公司部署机器人用于草莓采摘,瞄准加州 30 亿美元的市场。劳动力成本占草莓生产成本的 60%,且劳动力正在快速减少,机器人成本已与人工持平。草莓作为切入点,全球浆果市场达 150 亿美元,该技术可扩展到其他作物。创始人 Sean Wu 和 Saichi Fujimoto 已正式发布产品。AI产品机器人农业自动化草莓采摘劳动力替代Synphony推荐理由:农业自动化终于有了明确的商业拐点——机器人成本与人工持平,做农业科技或关注劳动力替代的创业者值得关注,草莓只是起点。原文
18:19向阳乔木@vista8一位前字节员工推荐了 Zara 开源的 lark-channel-bridge 工具,能将本地的 Claude Code 连接至飞书,使其成为飞书机器人。用户可在手机上通过飞书与 Claude Code 对话,完成复杂任务。该工具支持消息转发、可交互卡片、图片文件直接显示,以及全量搜索聊天记录。安装命令为 npx -y lark-channel-bridge @latest start,体验者反馈良好。AI产品飞书Claude Code开源/仓库机器人AI工作助理推荐理由:飞书用户和 Claude Code 重度使用者终于可以摆脱终端束缚,在手机上随时调用 AI 完成复杂任务,建议直接安装体验。原文
07:59Y Combinator@ycombinator精选General Instinct 公司成功将前沿 AI 模型部署到 Jetson、移动 NPU 和 ARM CPU 等受限边缘硬件上,使机器人及物理 AI 团队能够在离线环境下运行低延迟模型。这一突破解决了边缘设备算力不足的痛点,让 AI 模型在资源受限的场景中也能高效推理。该技术由 Bill Jiao 和 Guanming 领导,已获得 Y Combinator 支持。AI产品边缘计算机器人AI模型部署JetsonARM CPU推荐理由:做机器人或边缘 AI 的开发者终于有了靠谱的离线推理方案——General Instinct 让 Jetson 和 ARM 设备也能跑前沿模型,建议做嵌入式 AI 的团队点开看看。原文
03:24小互@imxiaohu精选该项目在GitHub上开源,复刻了Disney的BDX Droid小机器人。用户可以通过3D打印、组装和训练来制作属于自己的BDX Droid。项目提供了完整的硬件和软件指导,适合机器人爱好者。不需要专业设备,普通家用3D打印机即可完成。AI产品BDX DroidDisney开源机器人3D打印推荐理由:开源机器人,自己动手做原文
03:22小互@imxiaohu精选Open Duck机器人搭载了谷歌的Gemma 4模型,实现了视觉识别和自然语言对话。在演示中,它能识别书桌、水杯等物体并描述场景。机器人还能通过语音与用户进行多轮问答。该方案展示了40亿参数模型在边缘设备上的实时推理能力。AI产品Gemma 4Open Duck机器人多模态1 个信源在谈推荐理由:Gemma 4让机器人会看会聊原文