00:30Clement Delangue@ClementDelangue74°XDOF宣布完成7000万美元融资,投资方包括多家未披露的投资者。该公司由来自Covariant、Meta和Tesla的团队创立,专注于为机器人基础模型构建核心基础设施。同时,他们开源了ABC-130K数据集,这是目前最大的开源遥操作数据集,与UC Berkeley、CMU、MIT和Amazon FAR合作开发。该数据集可帮助研究人员和公司更高效地训练机器人基础模型。行业XDOFABC-130KHugging Face开源数据集机器人基础模型推荐理由:XDOF拿了7000万美金做机器人基础模型,还开源了130K的遥操作数据集,搞机器人训练的朋友赶紧去用。原文
09:07GitHub Blog@Natalie GuevaraGitHub发布了一个新的repository-level数据集,许可证为CC0-1.0,包含多语言开发者内容,涵盖README、issues和pull requests。该数据集旨在帮助研究人员和开发者训练或改进多语言AI模型。数据集中于2025年4月发布,可直接下载使用,无需额外申请。AI模型GitHub多语言AI开源数据集代码文档推荐理由:GitHub新出的多语言数据集,免费开源,里面各种语言的README和讨论都有,做多语言AI模型训练正好用上。原文