不靠地图认路,AI靠强化学习看街景自行学会导航
2018-04-05 15:25:36 | 来源:ithome | 投稿:米阳 | 编辑:dations

原标题:不靠地图认路,AI靠强化学习看街景自行学会导航

图片来源:

DeepMind

DeepMind最近于官方博客公布最新的一项研究,靠着强化学习,让AI在没有准确的地图作为训练资料的情况下,只通过Google的街景图学会导航,就像人在学习认路的过程一样。

DeepMind表示,导航是人类和动物一项非常重要的认知能力,可以在复杂且遥远的距离范围中穿梭,而这项能力则是通过自我定位(Self-localisation)和目的地的认知所完成的,即是我在哪里和我要去哪里这2项认知。

DeepMind在这项实验中,提出一个用Google街景图当作第一视角的互动式导航环境,作为训练导航AI的资料,通过奖励的游戏方式,训练导航AI。

首先,DeepMind通过神经网络建立AI模型,来分辨多个城市街景图中的像素,程式如果成功到达目的地,就会得到奖励,DeepMind形容,就像是负责送货但是没有地图的快递员一样,经过反复的学习,程式可以穿梭于整个城市,并在不同的城市用相同的方式学习导航。

与过去的导航相比,DeepMind的方法是模拟了人类导航的方法,不使用既有的地图资讯、GPS或是其他定位工具,只通过视觉感知来观察环境,依据视觉观察,创建出对环境的认知,并通过强化学习加强点到点的训练,目前导航AI模型已经于伦敦、巴黎和纽约完成训练,能够穿梭于复杂的交叉路口、人行道、隧道等。(来源:DeepMind)

另外,DeepMind将训练完成的导航AI架构模组化,用于转移到其他新城市中,DeepMind将神经网络架构分成3个部分,首先是处理街景图像并抽取图像特征的卷积网络,接着通过特定的神经网络,让神经网络记住当前位置和目标位置,最后,产生导航的规则和策略。

模组化能够将AI模型学习到的导航知识迁移到新的城市中,省去不必要的学习过程,像是沿着街道前进或是在路口转弯等行为,因此,DeepMind建立MultiCity架构,先在多个城市中训练模型,之后将策略网络和视觉卷积网络、特定路径记录下来,方便加快之后在不同城市的训练过程。目前该项研究只限于知识上的导航,并没有实际用于任何交通工具上,像是自驾车系统。

tags:

上一篇  下一篇

相关:

Container周报第59期:十年催生容器浪潮第一人,Docker创办人Solomon Hykes闪电离职

此页面是否是列表页或首页?未找到合适正文内容。

AI趋势周报第34期:TensorFlow 1.7版上线,整合Nvidia的TensorRT、新增除错仪表板功能

TensorFlow△1.7版的除错仪表板,让使用者可以暂停或继续执行特定节点或几个步骤的工作,也会显示某段时间的张量质,还可以连接张量与Python中特定的几行程式码。 图片来源: Google 重点新闻(0330~0405)?TensorFl

传苹果挖角Google AI暨搜寻大将改进Siri

示意图,与新闻事件无关。 图片来源: Apple 纽约时报报道,苹果挖角Google△人工智能(AI)暨搜寻部门主管John△Giannandrea,借此加速Siri的技术提升。?而才在昨天,《The△Information》才报道John△Giannandrea

绝地求生4x4小地图测试资格怎么申请 [游戏攻略]

《绝地求生》4x4小地图于4月3日将正式开启测试,不过此次并不是更新在测试服,需要玩家申请激活码,下面给大家带来绝地求生4x4小地图测试资格申请方法,一起来看看吧。各位玩家大家好!正如之前的公告所述,我们即将开

Container周报第58期:今年第一个Kubernetes 1.10新版出炉

重点新闻时间:03/20~03/27今年第一个Kubernetes△1.10新版出炉,内建开发者会爱的容器除错机制火热的容器管理平台Kubernetes释出了今年第一次改版Kubernetes△1.10。第一个特色是,要作为Kubernetes标准储存介面的C

站长推荐: