您现在的位置是:首页 >要闻 > 2021-08-21 15:29:38 来源:
NVIDIA的安培A100已经成为有史以来最快的GPU 其速度比图灵快43%
在我们等待基于安培GPU架构的消费级显卡发布的同时,NVIDIA旗舰级安培芯片A100继续刷新世界纪录。全球最大的基于7nm工艺节点的图形芯片在5月份发布,在规格和性能方面都有很多支持。目前,安培A100张量核心加速器已经成为OctaBench上记录最快的GPU。
NVIDIA Ampere A100 HPC TensorCore GPU已经成为Octabonch有记录以来最快的GPU,其性能比RTX关闭时的图灵高43%
OTOY首席执行官Jules Urbach分享了这一壮举。OTOY是Octa Bench的开发人员,Octa Bench是一个基准测试工具,使用户能够使用辛烷渲染器评估GPU性能。OctaneRenderer本身就是一个GPU渲染引擎,支持NVIDIA的RTX光线追踪硬件加速,提供清晰的渲染场景。
据Jules统计,NVIDIA A100 Tensor Core GPU在OctaBench中的得分为446。他还指出,即使关闭RTX,该分数也比八进制中的图灵GPU平均快43%。这里比较的图灵结果利用了RTX。与导致帧率大幅下降的游戏不同,在OctaRenderer中启用RTX可以带来更好的性能,因为使用可用的光线跟踪硬件可以更快地渲染和完成场景。
没有说明用哪个图灵GPU来和NVIDIA Ampere A100 GPU做比较,但是看看所有测试卡的完整平均工作台,可以看到一系列有趣的结果。平均来说,A100的前身特斯拉V100的速度要慢20%左右,但出于某种奇怪的原因,泰坦V的速度只有11%,考虑到泰坦RTX比A100 GPU慢38%,这是令人惊讶的。
主要答案可能是Titan V使用了与特斯拉V100相同的GV100 GPU,可以针对这个数据中心和云规模基准进行优化,而Turing GPU则针对游戏和GP-GPU的使用进行了优化。不过,该公司CEO再次指出,这是特定工作负载下有史以来最快的GPU记录,这对于NVIDIA A100 GPU加速器来说是一大壮举。
NVIDIA A100是迄今为止生产的最大的7nm芯片,其特点是在单个管芯中封装了540亿个巨大的晶体管。因为产量高,A100的配置大大减少,但是和特斯拉V100一样,一旦产量增加,我们可能会看到更高的bin版本,有更多的内核,这将进一步提高这个特定基准的性能。
英伟达安培GA100图形处理器的完整实现包括以下单元:
每一个完整的GPU都有8个GPU、8个TPC/GPC、2个SM/TPC、16个SM/GPC和128个SM
每个完整的GPU有64个FP32 CUDA内核/SM和8192个FP32 CUDA内核
每个完整的GPU有4个第三代Tensor内核/SM和512个第三代Tensor内核
6个HBM2堆栈,12个512位内存控制器
英伟达安培GA100图形处理器的A100张量核心图形处理器实现包括以下单元:
7个通用分组码、7个或8个通用分组码/通用分组码、2个标准分组码/通用分组码、最多16个标准分组码/通用分组码、108个标准分组码
每个GPU有64个FP32 CUDA内核/SM和6912个FP32 CUDA内核
每个GPU有4个第三代Tensor内核/SM和432个第三代Tensor内核
5个HBM2堆栈,10个512位内存控制器
只能想象安培卡上市后启用RTX的性能指标。如果我们想达到这个特定的基准,我们可以看到安培GeForce RTX 30系列卡很容易被他们的高性能计算同行访问。