【Nvidia显示卡Quadro两代GPU架构大比较】新一代GPU架构Turing为何比前代Pascal快6倍!
2018-09-11 12:32:38 | 来源:ithome | 投稿:阿呆 | 编辑:dations

原标题:【Nvidia显示卡Quadro两代GPU架构大比较】新一代GPU架构Turing为何比前代Pascal快6倍!

相较于Quadro前一代采用的16纳米制程Pascal架构GPU,Turing架构GPU晶片(图右)则采用了更先进的12纳米制程,晶片面积从更大达到754平方公厘,内有186亿个电晶体。(摄影/王宏仁)

在Nvidia今年3月GTC年度大会上,就曾展示过一段《星际大战》光线追踪特效示范视频Reflections,惊艳四座。这个视频利用即时光线追踪计算产生的阴影和反射、折射效果格外真实。3月当时利用了配备4个人工智能专用的Volta△GPU,以及价值7万美元的人工智能工作站DGX△Station来计算,但现在只需用单张新推出的光线追踪GPU卡Quadro△RTX△8000就能做到。

若以同样专攻影像特效处理的GPU产品线Quadro来看,Nvidia执行长黄仁勋指出,全新Turing架构的效能,是前一代Quadro△Pascal架构的6倍之多。

新一代Turing架构是全新的设计,除了GPU原有的SM(Streaming△Multiprocessor)模组外,还包括了AI计算用的Tensor△Core,以及光线追踪用的RT△Core,等于集结了Nvidia过去两大类GPU的特性,再增加一个新的特殊核心。

新增光线追踪专用核心RT△Core,每秒能处理到百亿道光线

Turing架构增加了一个全新的处理核心:专门处理光线追踪的RT△Core,用于计算光线在三角形间交互作用和不同边界间的往返作用,最高每秒可处理百亿(10 Giga)道光线的交互作用。

另外,Turing架构也内建了另一个人工智能系列产品线所使用的Volta△GPU架构上的AI计算专用核心Tensor△Core,不过,核心数比Volta产品线内建的640 Tensor△Core核心数略低,Turing架构目前最多只内建了576个(RTX△6000和RTX△8000两款),最高可以提供到125 TFLOPS的半精度浮点运算,或是500 TOPS△INT4计算(每秒可以处理500兆次整数计算)。

而Turning架构内建的SM模组也采取了新设计,除了浮点运算能力,还增加了可以平行执行的整数执行器,可以同时提供16 TFLOPS(Tera△Floating-point△Operations△Per△Second),再加上同样效能的16 TIPS(Tera△Integer△Operations△Per△Second)运算效能。

摄影/王宏仁

为了支援RTX△GPU,Nvidia在软件层上提供了多项新工具和API,包括了光柵化(Rasterization)计算API、光线追踪API、CUDA运算API、Tensor△Core用的AI△API等。

运算力达16 TFLOPS,双卡串连记忆体可达96GB

相较于Quadro前一代采用的16纳米制程Pascal架构GPU,Turing架构GPU晶片则采用了更先进的12纳米制程,晶片面积扩大到754平方公厘,内有186亿个电晶体,前Pascal架构GPU只有118亿个电晶体。在一般运算能力上,Turing架构GPU可提供到16 TFLOPS计算力,也远高于Pascal架构GPU的13 TFLOPS计算能力。记忆体支援也有很大的差异,Pascal架构的Quadro产品,可支援到24GB的GDDR5记忆体(时脉10GHz),但Turing架构GPU可支援到更高速的GDDR6记忆体(时脉14Ghz),单卡容量更是高达48GB。通过NVLink串连双GPU卡,记忆体还可以再倍增,例如串接两张RTX△8000,最大可提供96GB的全域照明计算(Global△Illumination) 。

用星际大战视频的光影渲染来做比较的话,黄仁勋指出,采用Pascal架构的GPU需要308毫秒,但Turing架构GPU搭配即将推出的Deep△Learning△Anti-Aliasing△(DLAA)技术,只需要45毫秒,等于Turing架构的光影渲染速度,可以达到Pascal架构的6倍。

为了支援RTX△GPU,Nvidia在软件层上提供了多项新工具和API,包括了光柵化(Rasterization)计算API、光线追踪API、CUDA运算API、Tensor△Core用的AI△API等,另外OptiX、DXR、Vulkan也可以支援新的Turing架构光线追踪加速功能,Nvidia还正式将材质定义语言MDL开源释出,另外RTX也支援Pixar的开发语言USD(Universal△Scene△Description)。开发者只要呼叫API,就可以利用RTX△GPU的光线追踪核心来计算。

?相关报道??GPU十年最大变革,即时光线追踪成真

tags:

上一篇  下一篇

相关:

一场2500亿美元的布局,图灵GPU新架构要掀起设计流程新变革

图片来源: 摄影/王宏仁 在Nvidia第八代GPU架构Turing(图灵)发表会中,主讲的GPU技术龙头Nvidia执行长黄仁勋从头到尾都异常兴奋,语调上扬,极力介绍世界第一款光线追踪RTX△GPU的诞生,更直言这个新架构,不只是G

eBay因应3年IT大转型,也要自建伺服器架构

图片来源: eBay 不只AWS、Google及脸书使用自制伺服器,现在全球拍卖网站龙头eBay也开始要推动自制硬件,支撑eBay来自全世界用户的流量。eBay平台工程副总裁Mazen△Rawashdeh表示,Kubernetes、Docker、Kafka等开源技

布局物联网,Cloudera联手红帽、Eurotech推动开源IoT架构

提供大数据服务的Cloudera,也开始要进入物联网市场了。该公司近日宣布,与红帽、意大利IoT方案供应商Eurotech结盟,推出开源的点对点IoT架构,兼具可扩充性、安全性时,也能减轻被单一厂商绑定的问题。Cloudera表示

苹果产品涨价 [热事件]

近日,面对美国新一轮的对中关税政策,苹果发文表示,未来将出现苹果产品涨价产品涨价的情况。虽然这是川普对中贸易政策下的一个缩影,但对于即将发布的新iPhone来说,那么苹果产品涨价,会出现在9月13号发布的新iPh

新一代地铁亮相 [热事件]

地铁成为了一线大城市上的客流运输的主力军,然而为我们的日常出行带来了很大的方便,不仅仅方便价格还很便宜。随着科技技术的不断发展,地铁也升级了,新一代地铁亮相了,最大的特点就是列车全部覆盖WIFI和LIFI可免

站长推荐: