您现在的位置是:首页 >生活 > 2020-12-25 09:13:40 来源:
DeepMind可以在不知道规则的情况下掌握游戏
导读 人工智能的圣杯一直是使计算机学习人类的方式。但是,当今最强大的AI仍然依赖于某些已知规则,例如下棋或围棋的规则。然而,人类的学习在推
人工智能的圣杯一直是使计算机学习人类的方式。但是,当今最强大的AI仍然依赖于某些已知规则,例如下棋或围棋的规则。然而,人类的学习在推理上常常是混乱的,随着我们的前进学习生活规则。长期以来,DeepMind一直在尝试使用游戏作为其环境和测试套件来创建此类AI。谷歌专注于人工智能研究的姊妹公司刚刚在MuZero上展示了其最新成果,MuZero是一款无需事先学习规则即可掌握游戏的AI。
DeepMind以前的AlphaGo等AI已在媒体上广泛报道,以在各自的游戏中击败人类冠军。尽管令人印象深刻,但距离最终目标还有几步之遥。特别是,AlphaGo的优势是不仅了解Go的规则,而且了解人类玩家的领域知识和数据。它的继任者AlphaGo Zero和AlphaZero仍然可以依靠规则书来学习。
虽然这些AI在具有复杂策略但视觉效果简单的游戏中表现出色,但当应用于规则不易推断的视觉复杂的游戏时,它们就会失败。那就是新的MuZero AI出现的地方,它使用了一系列的Atari游戏,例如Pac-Man女士来测试其理论。
大多数AI研究人员使用两种策略来解决学习问题,其中一种是依靠获得游戏规则或知识来进行超前搜索。基于模型的计划通过创建准确的环境模型来学习,但是代价是过于复杂。MuZero的优势在于,它仅对重要的环境部分进行建模,例如知道伞将帮助您在雨中保持干燥,而不是对所有雨滴的运动进行建模。
即使只有很少的步骤需要预先计划,MuZero能够熟练掌握游戏的效率和速度也给DeepMind留下了深刻的印象。它希望这种新的AI学习方法将被用于杂乱的现实环境中,在这些环境中不能以明确的方式制定规则。