OpenAI Blog(博客/媒体)70OpenAI开发了一个通过自我对弈从零学习Dota 2的AI机器人,在1v1比赛中击败了世界顶级职业选手。该机器人不使用模仿学习或树搜索,展现了在复杂环境中通过强化学习完成目标的潜力。AI模型reinforcement-learningdota-2openaigame-aiself-play推荐理由:展示了强化学习在复杂游戏中的突破,对AI在现实世界应用有借鉴意义。