您现在的位置是:首页 >综合 > 2020-12-28 08:54:44 来源:

懒人利用GoogleAI部署强化学习导航系统

导读 隆恩(Loon)是一家致力于项目的公司,目的是使用浮在平流层中的超压气球来提供Internet连接。我们很少听到有关该项目的消息,有些人可能想知

隆恩(Loon)是一家致力于项目的公司,目的是使用浮在平流层中的超压气球来提供Internet连接。我们很少听到有关该项目的消息,有些人可能想知道它是否仍与已经在使用卫星的Starlink Internet服务进行试验的SpaceX相关。隆恩公司已经部署了一些非常有趣的东西,该公司称这是世界上首次部署强化学习航空航天系统。

该公司长期以来一直有一个目标,即有效地将气球引导到需要连接的位置。挑战在于,在平流层中导航超压气球有两种选择:向上或向下。导航非常复杂,并且该任务非常适合自动化。懒人气球跟随盛行的风。

卢恩(Loon)说,公司内部的一个小组与Google AI一直在合作开发利用深度强化学习(RL)的功能更强大的导航系统。RL是一种机器学习,它使代理能够通过在交互环境中通过自身行为和经验的反馈,通过反复试验来学习。该公司承认,尚不清楚早期的深度RL是否适用于其高空气球。

测试证明,RL对于平流层气球气球是可行的。当今使用的导航系统面临着一项复杂的任务,该任务通过一种算法解决,该算法通过计算机对气球导航进行仿真来学习。RL系统前面的任务非常复杂,因为气球通常缺乏理想机动所需的动力。

这意味着频繁的决策机会跨越了很长的规划期。尽管复杂,但强化学习已承诺比目前广泛使用的人工设计算法更有效地帮助Loon操纵气球。RL可以使导航系统快速管理新飞机并管理Loon机队的不同用途。到目前为止,RL控制器已导航了一组气球近3000个飞行小时,该公司称其为出色的结果。