【英特尔AI策略彻底解析】延伸四大产品线,提供AI通用与高效能运算架构
2017-01-01 12:37:14 | 来源:ithome | 投稿:洛洛 | 编辑:dations

原标题:【英特尔AI策略彻底解析】延伸四大产品线,提供AI通用与高效能运算架构

【英特尔AI应用主打4种伺服器处理器】若要在资料中心环境当中建构AI系统,英特尔预计将提供4种运算平台:Xeon、Xeon Phi、Xeon搭配FPGA(Arria 10)、Xeon搭配Nervana(Lake Crest),分别主打基本用途、高效能、低延迟与可程式化、类神经网路加速等不同需求。

图片来源:

iThome

这一年来,除了云端服务、大数据、行动应用持续走红以外,人工智慧(AI)无疑是下一个即将起飞的热门IT技术,许多人已经开始积极投入机器学习、深度学习的开发与应用,绘图处理器大厂Nvidia今年的营收、获利、股价持续上涨,也与此有关,而同样是处理器大厂的英特尔,现在也对AI的发展寄予厚望,并正式宣布调整以AI为重的策略,全力发展软硬体技术,以支援相关的发展。

在11月18日举行的「Intel AI Day」活动当中,英特尔执行长Brian Krzanich提出了他们的愿景,并期盼能推动AI普及,将AI变得更平民化,进而引领AI运算时代的来临,使英特尔能够成为加速AI发展的催化剂。

而就更实际的产品而言,英特尔在伺服器端处理器平台上,也针对AI有所布局。在2017年,现有的Xeon E5、Xeon Phi处理器平台都将推出新一代产品,同时,除了以Xeon搭配FPGA(Field Programmable Gate Array)晶片Altera Arria 10之外,英特尔也将以Xeon搭配新开发的「Lake Crest」晶片,专攻类神经网路的加速应用。

值得注意的是,Lake Crest的形式是一张基于硅晶片的独立加速卡,技术源自于英特尔今年8月併购的新创公司Nervana Systems,该产品将于2017年第一季问世。之后,英特尔还将推出Xeon结合这种新型态加速AI处理机制的晶片,研发代号称为「Knights Crest」,届时,採用这颗晶片的伺服器直接具有系统开机的能力,无需搭配Xeon处理器。

英特尔AI伺服器平台的发布时程

在2016这一年,英特尔已经推出了FPGA的系统单晶片解决方案Arria 10,以及Xeon Phi x200系列(Knights Landing)。2017年他们将发表新的Xeon Phi(Knights Mill),以及深度学习专用的运算晶片Lake Crest,而在通用伺服器级处理器Xeon系列,基于Skylake微架构的产品也将问世。

强化平行处理与向量处理性能,Xeon与Xeon Phi支援新指令集

英特尔在2017年即将推出的伺服器产品,还包括採用Skylake微架构的新一代Xeon处理器,以及Xeon Phi(代号为Knights Mill)。

以现行的Xeon E5-2600 v4系列处理器而言,根据英特尔提供的效能测试数据,若执行大数据与AI领域经常会运用的Apache Spark软体环境,效能提升的幅度,可望达到18倍之高(以今年推出的Xeon E5-2699 v4搭配MKL 2017 Update 1程式库,对上Xeon E5-2697 v2搭配F2jBLAS程式库)。

英特尔表示,在初期出货给特定云端服务业者的「Skylake」Xeon处理器版本(preliminary version)当中,将会加入更多整合式加速运算的进阶特色。例如,新的进阶向量延伸指令集AVX-512,可针对机器学习类型工作负载的执行,提升相关的推理论断能力。至于Xeon新平台其他增益的功能与组态支援,预计将会在2017年中正式发布时,才会揭露。

若单看AVX-512这套指令集,目前只有今年6月推出的Xeon Phi x200系列处理器(Knights Landing)支援,接下来,英特尔的主力通用伺服器平台Xeon处理器,会在下一代採用Skylake微架构的产品当中支援。

因此,就目前而言,英特尔现有处理器所支援的AVX指令集,总共可分为三代:Sandy Bridge和Ivy Bridge微架构处理器,内建的是第一代AVX,Haswell和Broadwell微架构处理器改为AVX2,而Skylake微架构和Knights Landing是採用AVX512。基本上,前两代的AVX指令集,都是基于128位元SIMD暂存器,可延伸到256位元。

至于Xeon Phi的下一代产品 「Knights Mill」,英特尔表示,会把深度学习的应用效能,提升到现有Xeon Phi处理器(7290)的4倍,并同样具备直接记忆体存取(Direct Memory Access)的能力——最高可存取到400GB(Knights Landing是以384GB的DDR4记忆体,搭配16GB的MCDRAM)。

同时,在横向扩展到32节点的系统环境当中,目前的Xeon Phi也已经能大幅缩短机器学习的训练时间,成效差距可达到31倍之大。

基于FPGA可程式化硬体运算技术,推出深度学习加速卡DLIA

FPGA则是另一个英特尔近年来极力发展的重点,他们在2015年併购了专攻FPGA技术的Altera公司,并以此成立新的业务单位──可程式化解决方案事业群(Programmable Solutions Group)。

针对高效能运算(HPC)领域当中也相当热门的AI应用,英特尔在今年11月稍早举行的Supercomputing 2016大会期间,也宣布将于2017年初推出基于FPGA的AI加速解决方案,名为Deep Learning Inference Accelerator(DLIA),可用于影像辨识应用,并且具备大量的资料吞吐能力与高度的能源效益。

DLIA的硬体是英特尔FPGA 系列产品当中的Arria 10的介面卡,晶片之间传输率,最高可达到25.78 Gbps,最大浮点运算效能为1,500 GFLOPS,可因应卷积神经网路(CNN)的部署架构,提供最佳化效能。而且,Arria 10本身所採用的处理器,是20奈米製程的ARM系统单晶片(SoC)Cortex-A9 MPCore,比起前一代FPGA与SoC晶片,号称能节省4成的电力。

同时,由于DLIA是基于FPGA技术而成,所以秉持了可程式化的特性,用户能从远端对DLIA进行韧体更新,以便随时因应AI技术的改变,而且也能直接运用深度学习的软体开发框架,例如英特尔自己维护、发行的Caffe,以及MKL-DNN(Math Kernel Library for Deep Neural Networks)等程式库。

专为深度学习应用所设计的Crest系列晶片,预计将在2017年问世

英特尔2016年併购Nervana公司后,预计在2017年推出运算晶片Nervana Engine。

这颗代号为Lake Crest的处理器,是专为深度学习的工作负载所设计的,将提供极高的运算密度,大幅超越现行GPU的运算能力。

在资料存取的方式上,Lake Crest本身也配置了新一代的高速频宽记忆体技术HBM2,搭配的总容量为32GB,存取速度高达8Tb/s。而晶片之间进行互相沟通时,Lake Crest提供12个双向的连结通道,有助于在彼此互连的架构下,进行高速资料传输。

英特尔强调,Lake Crest能支援真正的资料模型平行处理作业,因为在这样的运算架构当中,每一个运算节点,都会配置专用的记忆体介面,如此一来,系统能够存取的资料模型大小较不受限,同时也可以藉此增进记忆体I/O效率。

而在Lake Crest之后,英特尔打算师法Xeon Phi x200系列处理器的作法,推出更进一步整合Xeon与Nervana加速技术的晶片,研发代号为Knights Crest。展望AI运算平台的未来目标,他们希望将现行AI应用耗费在深度学习训练的时间,尽可能地缩短,在2020年能做到即时训练,达到节省幅度100倍的目标。

Lake Crest的深度学习处理架构

Lake Crest是基于多维度资料阵列(tensor-based)的处理架构,而且,提供Flexpoint的作法,所能支援的平行处理层级是现行技术的10倍。这颗晶片内建的记忆体也很特别,是HBM(High Bandwidth Memory)的第二代技术,记忆体频宽是目前DDR4的12倍。

?

?相关报导? 英特尔AI四大策略彻底解析

tags:英特尔   运算   产品线   架构   高效能

上一篇  下一篇

相关:

【英特尔AI策略彻底解析】承诺AI应用效能最佳化,扩大支援AI软件开发环境

【英特尔强化AI软体应用的4大层面】英特尔对于AI应用的支援,首先是处理器内建低阶软体原始指令,例如MKL-DNN;针对深度学习软体框架,提供最佳化程式码;对于大数据分析应用平台,投入Hadoop、Spark的版本提供或贡

【英特尔AI策略彻底解析】拉拢云端服务业者,建立策略合作

在Intel AI Day的活动上,Google企业资深副总裁Diane Greene特别出席参加,她与英特尔执行副总裁暨资料中心事业群总经理Diane Bryant同台,宣布双方在AI应用上的策略联盟。 图片来源: 英特尔 在有意发展AI的企业当

【英特尔AI策略彻底解析】建立AI人才培育管道

基于英特尔既有的开发者专区网站,他们成立了Nervana AI学院的网页,并且统合在英特尔新设的AI专属网页上,这里针对开发者/资料科学家、学生,提供了多种学习的资源,像是线上课程、文件,以及与机器学习、深度学习

全球企业研发投资前三名:福斯、三星、英特尔,台积电夺台湾第一

图片来源: 台积电 欧盟产业研究与创新经济联合研究中心(IRI)发表2016年度全球产业研发投资计分卡研究报告,全球企业研发投资金额以福斯汽车(Volkswagen)居冠,三星(Samsung)电子、英特尔(Intel)紧追在后;台湾则有台

未雨绸繆,NIST对外征求超高强度加密法,对付量子运算破解

量子电脑运算力强大,NIST开始寻找加密对策,图为最新发表可用于打造量子电脑的原子等级时钟 图片来源: NIST 美国国家标準与技术研究院(National Institute of Standards and Technology,NIST)本周公开对外徵求

站长推荐: