不靠地图认路，AI靠强化学习看街景自行学会导航

首页 > 娱乐前沿 > 科技

2018-04-05 15:25:36 | 来源：ithome | 投稿：米阳 | 编辑：dations

原标题：不靠地图认路，AI靠强化学习看街景自行学会导航

图片来源:

DeepMind

DeepMind最近于官方博客公布最新的一项研究，靠着强化学习，让AI在没有准确的地图作为训练资料的情况下，只通过Google的街景图学会导航，就像人在学习认路的过程一样。

DeepMind表示，导航是人类和动物一项非常重要的认知能力，可以在复杂且遥远的距离范围中穿梭，而这项能力则是通过自我定位（Self-localisation）和目的地的认知所完成的，即是我在哪里和我要去哪里这2项认知。

DeepMind在这项实验中，提出一个用Google街景图当作第一视角的互动式导航环境，作为训练导航AI的资料，通过奖励的游戏方式，训练导航AI。

首先，DeepMind通过神经网络建立AI模型，来分辨多个城市街景图中的像素，程式如果成功到达目的地，就会得到奖励，DeepMind形容，就像是负责送货但是没有地图的快递员一样，经过反复的学习，程式可以穿梭于整个城市，并在不同的城市用相同的方式学习导航。

与过去的导航相比，DeepMind的方法是模拟了人类导航的方法，不使用既有的地图资讯、GPS或是其他定位工具，只通过视觉感知来观察环境，依据视觉观察，创建出对环境的认知，并通过强化学习加强点到点的训练，目前导航AI模型已经于伦敦、巴黎和纽约完成训练，能够穿梭于复杂的交叉路口、人行道、隧道等。（来源：DeepMind）

另外，DeepMind将训练完成的导航AI架构模组化，用于转移到其他新城市中，DeepMind将神经网络架构分成3个部分，首先是处理街景图像并抽取图像特征的卷积网络，接着通过特定的神经网络，让神经网络记住当前位置和目标位置，最后，产生导航的规则和策略。

模组化能够将AI模型学习到的导航知识迁移到新的城市中，省去不必要的学习过程，像是沿着街道前进或是在路口转弯等行为，因此，DeepMind建立MultiCity架构，先在多个城市中训练模型，之后将策略网络和视觉卷积网络、特定路径记录下来，方便加快之后在不同城市的训练过程。目前该项研究只限于知识上的导航，并没有实际用于任何交通工具上，像是自驾车系统。

tags：

此页面是否是列表页或首页？未找到合适正文内容。

AI趋势周报第34期：TensorFlow 1.7版上线，整合Nvidia的TensorRT、新增除错仪表板功能

TensorFlow△1.7版的除错仪表板，让使用者可以暂停或继续执行特定节点或几个步骤的工作，也会显示某段时间的张量质，还可以连接张量与Python中特定的几行程式码。图片来源: Google 重点新闻(0330～0405)?TensorFl

传苹果挖角Google AI暨搜寻大将改进Siri

示意图，与新闻事件无关。图片来源: Apple 纽约时报报道，苹果挖角Google△人工智能（AI）暨搜寻部门主管John△Giannandrea，借此加速Siri的技术提升。?而才在昨天，《The△Information》才报道John△Giannandrea

绝地求生4x4小地图测试资格怎么申请 [游戏攻略]

《绝地求生》4x4小地图于4月3日将正式开启测试，不过此次并不是更新在测试服，需要玩家申请激活码，下面给大家带来绝地求生4x4小地图测试资格申请方法，一起来看看吧。各位玩家大家好!正如之前的公告所述，我们即将开

Container周报第58期：今年第一个Kubernetes 1.10新版出炉

重点新闻时间：03/20~03/27今年第一个Kubernetes△1.10新版出炉，内建开发者会爱的容器除错机制火热的容器管理平台Kubernetes释出了今年第一次改版Kubernetes△1.10。第一个特色是，要作为Kubernetes标准储存介面的C

热点 / Hot

站长推荐：