脸书AI研究院战略大解密

2017-07-14 13:52:26 | 来源：ithome | 投稿：小柯 | 编辑：dations

原标题：脸书AI研究院战略大解密

脸书AI研究院在2013年12月成立，至今在全球设有3个据点，团队成员大约90人，致力于研究AI技术、电脑规画、电脑感知和自然语言理解等领域。（图片来源／脸书）

脸书早在2013年12月就设立了人工智慧研究院（Facebook△AI△Research，简称FAIR），加入了Google、IBM、微软、百度等软件巨头竞争的人工智慧竞赛，不只挖角苏联的统计学习理论之父Vladimir△Vapnik，甚至，还找来深度学习三大权威Yann△LeCun担任AI研究院院长，但3年多来，除了偶尔在脸书年度F8大会上揭露一、两项研究计划之外，就很少对外公开研究成果。

直到今年4月的F8大会，脸书一举发布了多项利用AI技术打造的应用，还发表了脸书第一个可以部署于正式环境的深度学习框架Caffe2，Yann△LeCun也亲自出马上台展示脸书AI研究成果，才让众人惊觉到脸书在人工智慧上的能耐。

但是脸书想做的到底是什么？脸书AI研究院院长Yann△LeCun近日终于在来台的一场座谈会中，揭露了FAIR在脸书的战略地位，“AI是脸书众多产品的中心！”他一语道出了FAIR研究成果，对脸书的重要性。

Yann△LeCun表示，脸书创办人祖克柏在2013年12月于加州的门洛帕克成立了FAIR，当时脸书成立即将届满10周年，祖克柏正思考著脸书在接下来的10年要投入哪一项技术研究，来发挥脸书主要的核心“沟通与连结”，并且持续保有市场竞争力。

祖克柏最后想出来的答案正是AI，他将AI视为“隐藏的知识”，期望将来将AI技术加入脸书创造更多新的应用，像是VR的应用、人脸识别技术等，另外，Yann△LeCun表示，即使脸书目前在全球拥有20亿的使用者，还是有许多地方的人没有办法使用脸书，其中一个主要的原因是有些未开发的国家网络是不普及的，因此，脸书也致力于在这些地区建立基础建设。

FAIR的主要任务就是要将AI技术推向下一个里程碑，Yann△LeCun表示，刚开始FAIR是由3个科学家和7个工程师组成的小团队，至今大约成立3.5年的时间，FAIR已经分别在加州门洛帕克、纽约、巴黎设有3个据点，每个办公室大约都有30个人的规模，成员大约60%为博士以上的研究学者，40%为工程师，其中包括博士后研究和就读博士中的研究学者，以及实习生。

研究团队3大工作原则

这个在脸书公司內才创立3.5年的新部门，有别于一般研究单位，部门內气氛相对活泼，Yann△LeCun表示，FAIR团队从事研究时的工作哲学包括了3大原则，就是开放（Open△Research）、由下而上（Bottom-up）和探索（Exploratory△Research），FAIR的研究不是单打独斗，而是经常与会大学和研究机构共同合作，也会公开所有的研究成果，不仅如此，还将研究成果开源释出，组织內不是只由管理阶层提出计划，大部分的计划反而是由研究学者自行发起，还有些计划是由开发团队，甚至是产品线的成员负责，再由工程师一同协助。

FAIR主要研究的方向大致可分为AI技术相关研究、电脑规划（Reasoning/Planning）、电脑知觉（Perception）和自然语言理解，AI的研究包含机器学习和深度学习的技术、非监督式学习和强化学习的方法，以及建立模型和研究因果推理，电脑规划则是研究游戏领域的应用，像是围棋、2D和3D的游戏，电脑知觉包含语音和视觉，自然语言理解则是聚焦于研究对话系统和Chatbot、文字辨识和翻译等。

目前脸书在GitHub上已开源释出多项专案，包含深度学习框架Torch、电脑围棋程式DarkForest以及采用卷积式神经网络的机器翻译FairSeq等。

在各个专案投入的预算经费上，FAIR也有一套独特的作法，Yann△LeCun表示，他对于各个专案经费的投入没有固定预算，而是采用弹性编列的作法，他认为，不能只投资应用导向的专案，应该也要投资研究导向的专案，因为研究就是驱动新技术、应用的动力，而从纯理论发起的研究专案，他会给予专案团队3到5年的研究时间，当一个专案慢慢壮大的时候，也会视情况投入更多的人力和预算。

另外，Yann△LeCun信任FAIR团队的专业，他认为，研究学者了解要致力于研究哪一个专案，并不会干涉团队的运作，“对一个团队管理太过严谨，会扼杀创意。”他说，因此，发起专案的人并不一定是管理阶级，且每个专案通常不会独立执行，而是会与2个以上的专案一同合作。

脸书利用AI技术发展出许多相关应用，举凡像是贴文的排序、过滤和翻译等，甚至是Chatbot都离不开AI技术，Yann△LeCun表示，其实脸书许多AI的应用都是由机器学习应用团队（AML）和FAIR合作完成的，AML的团队规模大约为FAIR的两倍，主要负责提供脸书AI软件的基础建设，像是深度学习引擎Caffe2和机器学习模型管理平台FBLearner△Flow，简单来说，AML团队就是负责将FAIR最新的研究技术产品化，创造出新的应用，举例来说，脸书可以利用AI技术来判断贴文的图片或是视频的主题、物体，还能判断出照片的拍摄场景是在室內还是室外等。

3大AI应用将带来根本性的变革

目前在各行各业都能见到AI应用的身影，Yann△LeCun认为，未来有3大AI的应用非常重要，会造成根本性的改变，第一是自驾车，他说明，自驾车的应用会改变整个城市的设计方式，包括交通和停车场的规划等，还能降低每年因交通事故意外身亡的死亡率。

第二则是医疗的应用，他举例，临床诊断上重要的核磁共振摄影（MRI）是因为医生要人眼辨识才生成影像，若是透过电脑辨识，则不需要产生影像，电脑直接读取像素的数据，分析完后就能马上提供病人检查报告，另外，医疗上有些较简单的医疗案例也可以交由机器处理，复杂的案例再由医生来判断，“AI是可以救人的，并不是终结者，”他表示，如此一来，也能让更多人获得医疗资源而拯救更多人命。

最后，Yann△LeCun认为，AI的应用让人类可以更快速且便利的获得知识，简单来说，像是Chatbot可以改变人类获取知识的形式，使用者可以用随身携带的手机、Amazon的Echo等智慧装置，随时随地询问Chatbot任何资讯，包含新闻、论文和文章等，还能即时翻译资讯，Yann△LeCun补充，目前AI已经可以达到同步翻译的能力，未来翻译的职位可能会渐渐地消失。

AI目前还无法成功模仿人脑运作

Yann△LeCun在众多演讲中提及，目前AI技术的局限就是无法拥有人类的“常识”，由于电脑程式和人类对于世界的学习方式不同，人类是借由观察和感知来建立对世界的理解，但是电脑程式所有的模型，都是由人类归內出一套逻辑所建立的，因此，他坦言，“要AI模仿人脑的运行模式，我们还差的很远！”他点出这是目前AI最大的障碍，且还没有任何办法可以解决此问题。

他指出，人类的学习是建立在与事物互动的过程，许多都是人类自行体会、领悟出对事物的理解，人类并不需要每件事都要经过教导就能理解。

“人脑就是推测引擎！”他说明，人类靠著观察建立內部分析模型，当人类遇到一件新的事物，就能用这些既有的模型来推测，因为生活中人类接触到大量的事物和知识，而建立了“常识”。

Yann△LeCun表示，这些常识可以让人类透过因果关系，来推测事情，举例来说，人类可以在被遮住大半的图像中，成功辨识出物体，也可以在没有获得完整的资讯下，从过去的事件推测未来。

他举例，若人类看到一张图片，一个男生拿着公事包夺门而出，即使没有其他资讯，大家都可以略知一二图片中的意思，人类因为知道整个社会和世界运行的规则，就可以依照因果关系自动补足空白的资讯，但是AI却没有办法。

同时身处学界与业界，保持研发新技术动力

被业界喻为“卷积式网络之父”的Yann△LeCun，不仅是FAIR的院长，同时也在纽约大学担任教职，他表示，FAIR的办公室和纽约大学距离很近，于是他可以常常往返两地，当Yann△LeCun被问到为什么还要持续教学，他的回答是：“教学让我更贴近我所做的研究！”他表示，他在纽约大学指导4个博士生，即使身为FAIR的院长，FAIR发表的众多论文中，他的名字却只有出现在2到3篇论文上，反而是他在纽约大学发表的论文数，远远超越在FAIR发表的论文，他解释，他只负责咨询和给予团队想法，完全不插手FAIR团队的研究。

“我认为有时候学术界比业界还要竞争。”Yann△LeCun说明，学术界注重研究伦理，对于研究的专利较为重视，学术界的竞争可以使他保持研究新的技术的动力，和产业接轨又能激发出新的应用，因此，他认为，学术和业界的合作关系将会越来越强，两项身份对他来说都是非常重要的。

?小档案 ?脸书AI研究院

● 成立时间：2013年12月

● 院长：Yann△LeCun

● 据点：加州门洛帕克、纽约、巴黎等地共3处

● 团队规模：大约90人，其中6成是博士级学者，而4成则是工程师

● 研究方向：AI相关技术、电脑规画（Reasoning/Planning）、电脑感知（Perception），以及自然语言理解等领域

● 目前专案：CommAI、Stack△RNN、bAbI、FastText、Torch等共5项

● GitHub开源专案数：22个

脸书AI研究院3大重点专案

脸书AI研究院身负研究AI新技术的重任，与机器学习应用团队（AML）密切合作，FAIR研究最新可用技术，再由AML团队负责将技术产品化，创造出脸书的新应用，目前FAIR底下有5个专案，包含CommAI、Stack△RNN、bAbI、FastText和Torch，主要聚焦于文字和影像辨识，目前已有一些应用渐渐在脸书上浮现。

目标1：让AI看“懂”多语发文

FAIR去年开发深度学习文字理解引擎DeepText，由于文字是脸书上沟通的普遍形式之一，理解文字语意能让脸书在动态墙精选出使用者感兴趣的內容、过滤掉不适当资讯，来提升使用者体验，DeepText每1秒从上千则的贴文中，理解出最贴近使用者表达的意思，且可分析高达20多种语言。

由于脸书使用者来自世界各地，且贴文用语较生活化，传统的自然语言处理技术备受考验，FAIR必须解决这些文字理解的挑战，传统的自然语言处理技术需要在语言的专业知识下，建立复杂的程式，当使用者使用不同语言、俚语，或是不同的拼法来表达相同意思时，程式的变数也不相同，于是，FAIR采用深度学习，可以减少程式设计依赖各语言知识的程度，如此一来，设计模组时只需要做些微的调整，就能快速套用到多种语言。

DeepText是由多个深度神经网络的架构所组成，包含卷积式神经网络（Convolutional△Neural△Nets）和递归神经网络（Recurrent△Neural△Nets），FAIR用机器学习模型管理平台FBLearner△Flow和深度学习框架Torch，针对词句和单词为单位来训练模型。

文字理解包含多项任务，举例来说，若是要辨识出贴文的主题是篮球，系统就要能够辨识与篮球相关的词汇，像是篮球员的名字、球赛的统计数据、术语，以及其他与篮球相关的资讯，但是，若是进一步研究，人类还能理解俚语、语句的言外之意等，举例来说，若有人说：“I△like△blackberry.”人类要能够判断是在说水果还是装置。

传统的自然语言处理方式是将文字对应为一个编号，也就是说，Brother和Bro在程式中是两个不同物件，这也表示，若要程式正确地辨识文字，贴文中的文字必须与训练样本一模一样，才能被程式识别出来。

FAIR使用一种数学概念Word△Embeddings，可以计算单字跟单字之间语意的关联程度，因此，若是计算正确，Brother和Bro两个字的距离就会很靠近，此外，不同语言也适用，像是英文和西班牙文的生日快乐距离也会是很近的，这样的方式就能让程式深入了解单字的语意。

DeepText已经应用在脸书的个人数位助理M，举例来说，DeepText可用来意图侦测，若使用者输入“我想坐车”，Messenger△聊天机器人能辨识意图、提供解决方案，像是建议“需要我叫车吗”或是整合Uber服务，表示“我帮你叫Uber”。

除此之外，也可以用于一般Facbook贴文，例如使用者贴文写道“我旧脚踏车想卖200美元，有人有兴趣吗？”DeepText就能侦测意图、以及理解销售物件及价格等资讯，建议用户透过Facebook使用适当的销售工具。

DeepText未来也会应用在动态墙的文章筛选，或是在贴文的留言板中，自动挑选出较相关的留言，来提供使用者个人化的使用体验，且DeepText若侦测到仇恨、不恰当的言论，必要时也能过滤或管制。

目标2：让盲人读“懂”照片

FAIR专注于所有关于AI的主题，从研究创造理论、演算法、应用、软件等知识，长远的目标是能够理解智慧，并建立智慧机器（Intelligent△Machine），其中，由于脸书的贴文都是由文字和照片所组成，FAIR多项研究也与影像辨识相关。

脸书和其相关服务如Instagram、Messenger和WhatsApp一天有超过20亿张照片上传，用照片互动已经成为人与人普遍的沟通形式，但是FAIR认为，全世界有3,900万人全盲、2亿多人视力严重受损，对他们而言，要从照片与他人互动是非常困难的。

今年2月FAIR推出自动文字替代（Automatic△Alt-Text，AAT）服务，能透过AI和影像辨识技术Lumos，自动解读动态强上的照片，可以辨识跑步、舞蹈等十多项动作，系统辨识完成后，就能自动产生对照片的叙述，并念给盲人听，让盲人也可以感受到脸书上朋友近况的分享。

脸书使用手上的数十亿张照片作为训练Lumos的样本，目前，已经建立超过200个视觉模型，可用于各种不良內容侦测、打击垃圾邮件以及自动为图片加图说等多种用途。

目标3：通用型AI框架

更长期的目标上，FAIR试图要打造出通用型AI框架称为CommAI专案，主要是为了开发出具有泛用性（General-purpose）AI，来协助人类日常生活，不仅如此，CommAI还是个提供AI系统训练和测试的平台，CommAI会要求程式中的学习者程式（Learning△Agent）来解决任务。

CommAI有几项特色，由于FAIR认为人类要能与AI沟通，AI才能发挥最大价值，因此CommAI专案把语言视为第一优先（Language-first），交付任务的目标、解决方案和回复给学习者，都必须用语言的方式表达，CommAI也建立了奖励回馈（Reward-based△feedback）机制，为了让AI有自主判断解决任务的意图，而不是每项任务都需要由人来赋予程式，FAIR决定提供学习者奖励讯息，若学习者在没有监督的情况下，成功地完成任务则给予奖励。

除此之外，FAIR也认为，AI要有终身学习（Life-long△Learning）的能力，有别于一般机器学习的方式，FAIR让CommAI执行持续解决任务的演算法，并估算平均累积的奖励分数，来培养出当人类需求改变时，也可以帮忙人类解决当下问题的AI，而且也因为AI可能需要处理多种不同的资料格式，因此，电脑和真实世界的沟通方式就必须是泛用的，电脑要能在没有人类手动调整程式的情况下，自动学习对不同的资料格式，要采取哪一个处理流程最方便。

?100项 IT人不可不知的AI发展?

No.020 脸书未来10年核心技术压宝AI

No.021 FAIR团队工作哲学：开放、由下而上和探索

No.022 3大关键AI应用是自驾车、医疗和知识获取

No.023 深度文字理解引擎可高速分析20种语言

No.024 200种视觉模型能自动描述图片特征

No.025 通用AI第一步先训练自主解题意图

tags：

相关：

传脸书将推出200美元的平价Oculus VR头戴装置

示意图，与新闻事件无关。图片来源: Facebook 彭博引述消息人士报道，为了提振在虚拟实境（Virtual△Reality）头戴装置的竞争力，脸书将打造200美元的无线Oculus△平价版产品??消息人士指出，脸书正透过一个代号为

突发！皇马全盘战略曝光：购4大球星仅花2.5亿！只差最后2拼图！ [生活]

据西班牙《每日进球》最新报道，在将J罗送到了拜仁慕尼黑后，皇家马德里接下来的球员转会交易动作将异常清晰，新银河战舰的组建，只剩下最后两块拼图。其一是莫拉塔离队，换取阿扎尔或者姆巴佩的加盟。莫拉塔的转会费

印度AI新创Halli Labs甫成立4个月就被Google买了

示意图，与新闻事件无关。图片来源: Google 4个月前才成立的印度人工智慧（AI）新创公司Halli△Labs本周三（7/12）宣布已被Google并购了，将加入Google的Next△Billion△Users团队，惟双方并未公布交易金额。Hall

微软砸2百万美元推AI for Earth计划，以AI维护地球环境资源

图片来源: 微软微软在人工智慧（AI）领域积极发展，本周三（7/12）除了公布已设立的AI研究室之外，也释出Seeing△AI行动App，更在同一天也揭露了新的人工智慧计划AI△for△Earth，预计在下个财务年度投入2百万美元推

议员踢爆“北市单一陈情系统HELLO TAIPEI”app未加密恐外泄民众个资

图片来源: 翻摄自谢维洲脸书台北市议员谢维洲今召开记者会，指台北市政府在去年推出“北市单一陈情系统HELLO△TAIPEI”app，因前端使用者资料传输未加密，可能导致陈情民众资料外泄疑虑。台北市资讯局表示，仅发现A

热点 / Hot

站长推荐：