nVidia 新 GPU 架构 Volta 发布,为人工智能注入一针强心剂

在今年的 GTC 2017(GPU Technology Conference 2017)中,Nvidia CEO 黄仁勋带来了全新的 GPU 架构 Volta。 1.5 倍的双精度浮点数计算效能提升以及采用特化架构所带来的 12 倍人工智能计算效能提升,为计算市场带来震撼的消息。
Nvidia 在 2016 年的 GTC 中,便发表了新的 GPU 架构 Pascal。其中,让人印象最为深刻的,莫过于采用 8 张 Tesla P100 的人工智能训练机 DGX-1。一台机器便得以带来以往需要由数台伺服器才能达到的效能,为人工智能发展带来新的气象。
然而,在短短的一年间,Nvidia 又带来新消息,新的 GPU 架构 Volta。强悍的 R&D 团队,将其主要竞争对手远远抛在后头。同时,也让世人见识到,在后摩尔定律的年代,GPU 将承接 CPU 的发展速度,推进电脑的计算效能。
新技术突破,奠定 Volta 于人工智能的王者之姿
这次的 Volta 架构带来数个新技术。其中,最为重要的莫过于 Tenser Core。其他的还有细部的硬体架构调整、第 2 代的 NVLink 以及新的软件支持,让 Nvidia 在人工智能中,扮演领导者。
首先,从硬体架构来看,这一次的GPU 架构和前一代的P100 相比,V100 将整数计算单元和浮点数计算单元独立出来,让整数计算和浮点数计算可以同时运行,物尽其用。此外,每一个 SM(Streaming Multiprocessor)中所新增的 8 个 Tensor Core。让 Volta 带来 12 倍的训练提升以及 6 倍的决策加速。
在新的 Tensor Core 中,由于一个 Tensor Core 是 4×4×4 的特化计算元件,让 GPU 可以同时执行 4×4×4 个矩阵相乘并相加,如下图所示。借此达到更多的计算加速。这就是 Nvidia 对于人工智能所发展的杀手锏。
那么 Volta 和 Pascal 究竟有什么差异呢,就让我们摊开所有的细节来比一比吧!
此外,在人工智能领域中,藉由 Tensor Processor,Volta 的计算能力更一举突破每秒百兆次运算的门槛。新 Volta GPU 的发表,让逐渐捉襟见肘的计算效能获得缓和。
转载自:https://technews.tw/2017/05/11/nvidia-gpu-volta/