脸书AI研究院战略大解密
2017-07-14 13:52:26 | 来源:ithome | 投稿:小柯 | 编辑:dations

原标题:脸书AI研究院战略大解密

脸书AI研究院在2013年12月成立,至今在全球设有3个据点,团队成员大约90人,致力于研究AI技术、电脑规画、电脑感知和自然语言理解等领域。(图片来源/脸书)

脸书早在2013年12月就设立了人工智慧研究院(Facebook△AI△Research,简称FAIR),加入了Google、IBM、微软、百度等软件巨头竞争的人工智慧竞赛,不只挖角苏联的统计学习理论之父Vladimir△Vapnik,甚至,还找来深度学习三大权威Yann△LeCun担任AI研究院院长,但3年多来,除了偶尔在脸书年度F8大会上揭露一、两项研究计划之外,就很少对外公开研究成果。

直到今年4月的F8大会,脸书一举发布了多项利用AI技术打造的应用,还发表了脸书第一个可以部署于正式环境的深度学习框架Caffe2,Yann△LeCun也亲自出马上台展示脸书AI研究成果,才让众人惊觉到脸书在人工智慧上的能耐。

但是脸书想做的到底是什么?脸书AI研究院院长Yann△LeCun近日终于在来台的一场座谈会中,揭露了FAIR在脸书的战略地位,“AI是脸书众多产品的中心!”他一语道出了FAIR研究成果,对脸书的重要性。

Yann△LeCun表示,脸书创办人祖克柏在2013年12月于加州的门洛帕克成立了FAIR,当时脸书成立即将届满10周年,祖克柏正思考著脸书在接下来的10年要投入哪一项技术研究,来发挥脸书主要的核心“沟通与连结”,并且持续保有市场竞争力。

祖克柏最后想出来的答案正是AI,他将AI视为“隐藏的知识”,期望将来将AI技术加入脸书创造更多新的应用,像是VR的应用、人脸识别技术等,另外,Yann△LeCun表示,即使脸书目前在全球拥有20亿的使用者,还是有许多地方的人没有办法使用脸书,其中一个主要的原因是有些未开发的国家网络是不普及的,因此,脸书也致力于在这些地区建立基础建设。

FAIR的主要任务就是要将AI技术推向下一个里程碑,Yann△LeCun表示,刚开始FAIR是由3个科学家和7个工程师组成的小团队,至今大约成立3.5年的时间,FAIR已经分别在加州门洛帕克、纽约、巴黎设有3个据点,每个办公室大约都有30个人的规模,成员大约60%为博士以上的研究学者,40%为工程师,其中包括博士后研究和就读博士中的研究学者,以及实习生。

研究团队3大工作原则

这个在脸书公司內才创立3.5年的新部门,有别于一般研究单位,部门內气氛相对活泼,Yann△LeCun表示,FAIR团队从事研究时的工作哲学包括了3大原则,就是开放(Open△Research)、由下而上(Bottom-up)和探索(Exploratory△Research),FAIR的研究不是单打独斗,而是经常与会大学和研究机构共同合作,也会公开所有的研究成果,不仅如此,还将研究成果开源释出,组织內不是只由管理阶层提出计划,大部分的计划反而是由研究学者自行发起,还有些计划是由开发团队,甚至是产品线的成员负责,再由工程师一同协助。

FAIR主要研究的方向大致可分为AI技术相关研究、电脑规划(Reasoning/Planning)、电脑知觉(Perception)和自然语言理解,AI的研究包含机器学习和深度学习的技术、非监督式学习和强化学习的方法,以及建立模型和研究因果推理,电脑规划则是研究游戏领域的应用,像是围棋、2D和3D的游戏,电脑知觉包含语音和视觉,自然语言理解则是聚焦于研究对话系统和Chatbot、文字辨识和翻译等。

目前脸书在GitHub上已开源释出多项专案,包含深度学习框架Torch、电脑围棋程式DarkForest以及采用卷积式神经网络的机器翻译FairSeq等。

在各个专案投入的预算经费上,FAIR也有一套独特的作法,Yann△LeCun表示,他对于各个专案经费的投入没有固定预算,而是采用弹性编列的作法,他认为,不能只投资应用导向的专案,应该也要投资研究导向的专案,因为研究就是驱动新技术、应用的动力,而从纯理论发起的研究专案,他会给予专案团队3到5年的研究时间,当一个专案慢慢壮大的时候,也会视情况投入更多的人力和预算。

另外,Yann△LeCun信任FAIR团队的专业,他认为,研究学者了解要致力于研究哪一个专案,并不会干涉团队的运作,“对一个团队管理太过严谨,会扼杀创意。”他说,因此,发起专案的人并不一定是管理阶级,且每个专案通常不会独立执行,而是会与2个以上的专案一同合作。

脸书利用AI技术发展出许多相关应用,举凡像是贴文的排序、过滤和翻译等,甚至是Chatbot都离不开AI技术,Yann△LeCun表示,其实脸书许多AI的应用都是由机器学习应用团队(AML)和FAIR合作完成的,AML的团队规模大约为FAIR的两倍,主要负责提供脸书AI软件的基础建设,像是深度学习引擎Caffe2和机器学习模型管理平台FBLearner△Flow,简单来说,AML团队就是负责将FAIR最新的研究技术产品化,创造出新的应用,举例来说,脸书可以利用AI技术来判断贴文的图片或是视频的主题、物体,还能判断出照片的拍摄场景是在室內还是室外等。

3大AI应用将带来根本性的变革

目前在各行各业都能见到AI应用的身影,Yann△LeCun认为,未来有3大AI的应用非常重要,会造成根本性的改变,第一是自驾车,他说明,自驾车的应用会改变整个城市的设计方式,包括交通和停车场的规划等,还能降低每年因交通事故意外身亡的死亡率。

第二则是医疗的应用,他举例,临床诊断上重要的核磁共振摄影(MRI)是因为医生要人眼辨识才生成影像,若是透过电脑辨识,则不需要产生影像,电脑直接读取像素的数据,分析完后就能马上提供病人检查报告,另外,医疗上有些较简单的医疗案例也可以交由机器处理,复杂的案例再由医生来判断,“AI是可以救人的,并不是终结者,”他表示,如此一来,也能让更多人获得医疗资源而拯救更多人命。

最后,Yann△LeCun认为,AI的应用让人类可以更快速且便利的获得知识,简单来说,像是Chatbot可以改变人类获取知识的形式,使用者可以用随身携带的手机、Amazon的Echo等智慧装置,随时随地询问Chatbot任何资讯,包含新闻、论文和文章等,还能即时翻译资讯,Yann△LeCun补充,目前AI已经可以达到同步翻译的能力,未来翻译的职位可能会渐渐地消失。

AI目前还无法成功模仿人脑运作

Yann△LeCun在众多演讲中提及,目前AI技术的局限就是无法拥有人类的“常识”,由于电脑程式和人类对于世界的学习方式不同,人类是借由观察和感知来建立对世界的理解,但是电脑程式所有的模型,都是由人类归內出一套逻辑所建立的,因此,他坦言,“要AI模仿人脑的运行模式,我们还差的很远!”他点出这是目前AI最大的障碍,且还没有任何办法可以解决此问题。

他指出,人类的学习是建立在与事物互动的过程,许多都是人类自行体会、领悟出对事物的理解,人类并不需要每件事都要经过教导就能理解。

“人脑就是推测引擎!”他说明,人类靠著观察建立內部分析模型,当人类遇到一件新的事物,就能用这些既有的模型来推测,因为生活中人类接触到大量的事物和知识,而建立了“常识”。

Yann△LeCun表示,这些常识可以让人类透过因果关系,来推测事情,举例来说,人类可以在被遮住大半的图像中,成功辨识出物体,也可以在没有获得完整的资讯下,从过去的事件推测未来。

他举例,若人类看到一张图片,一个男生拿着公事包夺门而出,即使没有其他资讯,大家都可以略知一二图片中的意思,人类因为知道整个社会和世界运行的规则,就可以依照因果关系自动补足空白的资讯,但是AI却没有办法。

同时身处学界与业界,保持研发新技术动力

被业界喻为“卷积式网络之父”的Yann△LeCun,不仅是FAIR的院长,同时也在纽约大学担任教职,他表示,FAIR的办公室和纽约大学距离很近,于是他可以常常往返两地,当Yann△LeCun被问到为什么还要持续教学,他的回答是:“教学让我更贴近我所做的研究!”他表示,他在纽约大学指导4个博士生,即使身为FAIR的院长,FAIR发表的众多论文中,他的名字却只有出现在2到3篇论文上,反而是他在纽约大学发表的论文数,远远超越在FAIR发表的论文,他解释,他只负责咨询和给予团队想法,完全不插手FAIR团队的研究。

“我认为有时候学术界比业界还要竞争。”Yann△LeCun说明,学术界注重研究伦理,对于研究的专利较为重视,学术界的竞争可以使他保持研究新的技术的动力,和产业接轨又能激发出新的应用,因此,他认为,学术和业界的合作关系将会越来越强,两项身份对他来说都是非常重要的。

?小档案 ?脸书AI研究院

● 成立时间:2013年12月

● 院长:Yann△LeCun

● 据点:加州门洛帕克、纽约、巴黎等地共3处

● 团队规模:大约90人,其中6成是博士级学者,而4成则是工程师

● 研究方向:AI相关技术、电脑规画(Reasoning/Planning)、电脑感知(Perception),以及自然语言理解等领域

● 目前专案:CommAI、Stack△RNN、bAbI、FastText、Torch等共5项

● GitHub开源专案数:22个

?

脸书AI研究院3大重点专案

脸书AI研究院身负研究AI新技术的重任,与机器学习应用团队(AML)密切合作,FAIR研究最新可用技术,再由AML团队负责将技术产品化,创造出脸书的新应用,目前FAIR底下有5个专案,包含CommAI、Stack△RNN、bAbI、FastText和Torch,主要聚焦于文字和影像辨识,目前已有一些应用渐渐在脸书上浮现。

目标1:让AI看“懂”多语发文

FAIR去年开发深度学习文字理解引擎DeepText,由于文字是脸书上沟通的普遍形式之一,理解文字语意能让脸书在动态墙精选出使用者感兴趣的內容、过滤掉不适当资讯,来提升使用者体验,DeepText每1秒从上千则的贴文中,理解出最贴近使用者表达的意思,且可分析高达20多种语言。

由于脸书使用者来自世界各地,且贴文用语较生活化,传统的自然语言处理技术备受考验,FAIR必须解决这些文字理解的挑战,传统的自然语言处理技术需要在语言的专业知识下,建立复杂的程式,当使用者使用不同语言、俚语,或是不同的拼法来表达相同意思时,程式的变数也不相同,于是,FAIR采用深度学习,可以减少程式设计依赖各语言知识的程度,如此一来,设计模组时只需要做些微的调整,就能快速套用到多种语言。

DeepText是由多个深度神经网络的架构所组成,包含卷积式神经网络(Convolutional△Neural△Nets)和递归神经网络(Recurrent△Neural△Nets),FAIR用机器学习模型管理平台FBLearner△Flow和深度学习框架Torch,针对词句和单词为单位来训练模型。

文字理解包含多项任务,举例来说,若是要辨识出贴文的主题是篮球,系统就要能够辨识与篮球相关的词汇,像是篮球员的名字、球赛的统计数据、术语,以及其他与篮球相关的资讯,但是,若是进一步研究,人类还能理解俚语、语句的言外之意等,举例来说,若有人说:“I△like△blackberry.”人类要能够判断是在说水果还是装置。

传统的自然语言处理方式是将文字对应为一个编号,也就是说,Brother和Bro在程式中是两个不同物件,这也表示,若要程式正确地辨识文字,贴文中的文字必须与训练样本一模一样,才能被程式识别出来。

FAIR使用一种数学概念Word△Embeddings,可以计算单字跟单字之间语意的关联程度,因此,若是计算正确,Brother和Bro两个字的距离就会很靠近,此外,不同语言也适用,像是英文和西班牙文的生日快乐距离也会是很近的,这样的方式就能让程式深入了解单字的语意。

DeepText已经应用在脸书的个人数位助理M,举例来说,DeepText可用来意图侦测,若使用者输入“我想坐车”,Messenger△聊天机器人能辨识意图、提供解决方案,像是建议“需要我叫车吗”或是整合Uber服务,表示“我帮你叫Uber”。

除此之外,也可以用于一般Facbook贴文,例如使用者贴文写道“我旧脚踏车想卖200美元,有人有兴趣吗?”DeepText就能侦测意图、以及理解销售物件及价格等资讯,建议用户透过Facebook使用适当的销售工具。

DeepText未来也会应用在动态墙的文章筛选,或是在贴文的留言板中,自动挑选出较相关的留言,来提供使用者个人化的使用体验,且DeepText若侦测到仇恨、不恰当的言论,必要时也能过滤或管制。

目标2:让盲人读“懂”照片

FAIR专注于所有关于AI的主题,从研究创造理论、演算法、应用、软件等知识,长远的目标是能够理解智慧,并建立智慧机器(Intelligent△Machine),其中,由于脸书的贴文都是由文字和照片所组成,FAIR多项研究也与影像辨识相关。

脸书和其相关服务如Instagram、Messenger和WhatsApp一天有超过20亿张照片上传,用照片互动已经成为人与人普遍的沟通形式,但是FAIR认为,全世界有3,900万人全盲、2亿多人视力严重受损,对他们而言,要从照片与他人互动是非常困难的。

今年2月FAIR推出自动文字替代(Automatic△Alt-Text,AAT)服务,能透过AI和影像辨识技术Lumos,自动解读动态强上的照片,可以辨识跑步、舞蹈等十多项动作,系统辨识完成后,就能自动产生对照片的叙述,并念给盲人听,让盲人也可以感受到脸书上朋友近况的分享。

脸书使用手上的数十亿张照片作为训练Lumos的样本,目前,已经建立超过200个视觉模型,可用于各种不良內容侦测、打击垃圾邮件以及自动为图片加图说等多种用途。

目标3:通用型AI框架

更长期的目标上,FAIR试图要打造出通用型AI框架称为CommAI专案,主要是为了开发出具有泛用性(General-purpose)AI,来协助人类日常生活,不仅如此,CommAI还是个提供AI系统训练和测试的平台,CommAI会要求程式中的学习者程式(Learning△Agent)来解决任务。

CommAI有几项特色,由于FAIR认为人类要能与AI沟通,AI才能发挥最大价值,因此CommAI专案把语言视为第一优先(Language-first),交付任务的目标、解决方案和回复给学习者,都必须用语言的方式表达,CommAI也建立了奖励回馈(Reward-based△feedback)机制,为了让AI有自主判断解决任务的意图,而不是每项任务都需要由人来赋予程式,FAIR决定提供学习者奖励讯息,若学习者在没有监督的情况下,成功地完成任务则给予奖励。

除此之外,FAIR也认为,AI要有终身学习(Life-long△Learning)的能力,有别于一般机器学习的方式,FAIR让CommAI执行持续解决任务的演算法,并估算平均累积的奖励分数,来培养出当人类需求改变时,也可以帮忙人类解决当下问题的AI,而且也因为AI可能需要处理多种不同的资料格式,因此,电脑和真实世界的沟通方式就必须是泛用的,电脑要能在没有人类手动调整程式的情况下,自动学习对不同的资料格式,要采取哪一个处理流程最方便。

?100项 IT人不可不知的AI发展?

No.020 脸书未来10年核心技术压宝AI

No.021 FAIR团队工作哲学:开放、由下而上和探索

No.022 3大关键AI应用是自驾车、医疗和知识获取

No.023 深度文字理解引擎可高速分析20种语言

No.024 200种视觉模型能自动描述图片特征

No.025 通用AI第一步先训练自主解题意图

tags:

上一篇  下一篇

相关:

传脸书将推出200美元的平价Oculus VR头戴装置

示意图,与新闻事件无关。 图片来源: Facebook 彭博引述消息人士报道,为了提振在虚拟实境(Virtual△Reality)头戴装置的竞争力,脸书将打造200美元的无线Oculus△平价版产品??消息人士指出,脸书正透过一个代号为

突发!皇马全盘战略曝光:购4大球星仅花2.5亿!只差最后2拼图! [生活]

据西班牙《每日进球》最新报道,在将J罗送到了拜仁慕尼黑后,皇家马德里接下来的球员转会交易动作将异常清晰,新银河战舰的组建,只剩下最后两块拼图。其一是莫拉塔离队,换取阿扎尔或者姆巴佩的加盟。莫拉塔的转会费

印度AI新创Halli Labs甫成立4个月就被Google买了

示意图,与新闻事件无关。 图片来源: Google 4个月前才成立的印度人工智慧(AI)新创公司Halli△Labs本周三(7/12)宣布已被Google并购了,将加入Google的Next△Billion△Users团队,惟双方并未公布交易金额。Hall

微软砸2百万美元推AI for Earth计划,以AI维护地球环境资源

图片来源: 微软 微软在人工智慧(AI)领域积极发展,本周三(7/12)除了公布已设立的AI研究室之外,也释出Seeing△AI行动App,更在同一天也揭露了新的人工智慧计划AI△for△Earth,预计在下个财务年度投入2百万美元推

议员踢爆“北市单一陈情系统HELLO TAIPEI”app未加密恐外泄民众个资

图片来源: 翻摄自谢维洲脸书 台北市议员谢维洲今召开记者会,指台北市政府在去年推出“北市单一陈情系统HELLO△TAIPEI”app,因前端使用者资料传输未加密,可能导致陈情民众资料外泄疑虑。台北市资讯局表示,仅发现A

站长推荐: