» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] GA100规格公布

可以看到完整版的GA100拥有128组SM,每组SM中拥有4个最新第三代Tensor Cores,仍然是64个CUDA Cores/SM的结构。所以完整的GA100拥有8192个CUDA核心和512个第三代Tensor Cores,因为它是面向纯计算领域的核心,所以没有RT Core,可以说是Volta架构的直属继承者,面积高达826mm2,比GV100核心还要大,这还是换用了台积电的7nm工艺才达成的。

而此次发布的A100计算卡上面使用的GA100核心并不完整,被屏蔽了20组SM,所以它的规模是108组SM,6912个CUDA核心外加432个Tensor Cores,可以提供约19.5 TFLOPS单精度计算能力和9.7 TFLOPS的双精度计算能力。

Tensor Cores在Ampere架构上面进化到了最新的第三代,NVIDIA特别引入了全新的Tensor Float(TF32)数据格式,可以让Tensor Cores在没有改动代码的情况下提高20倍的单精度性能,另外,新的Tensor Cores加入了针对双精度浮点的支持,可以在诸多场景中发挥出更大的作用。

https://www.expreview.com/74220.html


TOP

发新话题
     
官方公众号及微博