GPU延迟对比:AMD RDNA2完胜NVIDIA安培

珠江路在线   2021年4月20日  

  CPU缓存与内存延迟测试,相信大家都有所耳闻,然而GPU同样的测试却 几乎没人做过 。

  Chips And Cheese就做了一次特殊的测试,对照 考查了AMD、NVIDIA GPU架构的缓存、显存迟问题 。

GPU延迟对照:AMD RDNA2完胜NVIDIA安培

  首先是AMD RDNA2、NVIDIA Ampere两家最新架构的比拼,代表是RX 6900 XT、RTX 3090,前者在 几乎全部阶段都完胜 。

  RNDA2架构创新性地加入了Infinity Cache无限缓存, 晋升带宽的同时,延迟也可圈可点,二级缓存命中率上只添加了大概20ns的延迟,显而易见低于Ampere 。

  更惊人的是,RDNA2显存延迟和Ampere 几乎 如出一辙,然而别忘了,Ampere惟独两个层级的缓存,RDNA2却有四个 。

  Ampere的缓存架构更加传统,SM阵列私有一级缓存到二级缓存要添加超过100ns的延迟,RDNA2从零级缓存到二级缓存则只添加了约66ns 。看起来,GA102核心面积过大,也直接添加了延迟 。

  这正好 能够解释AMD RDNA2架构在低分辩率下性能、能效更优异,由于二级缓存、三级缓存延迟很低,更 合适执行较小的负载 。Ampere则相反,高负载下优势显而易见, 比方说4K分辩率 。

GPU延迟对照:AMD RDNA2完胜NVIDIA安培

  说完了GPU中间的对照,那么GPU、CPU放在一同怎么样呢?这里以RX 6900 XT、Intel四代酷睿i7-4770为例来看看 。

  CPU的缓存自然不是一个级别的,所以这里Y轴用了线性数据, 能够看到全程大大低于RDNA2,搭配DDR3-1600 CL9内存延迟惟独63ns,RX 6900 XT、GDDR6的组合则有226ns,另外末级缓存 均匀延迟分别是53.42ns、123.2ns 。

GPU延迟对照:AMD RDNA2完胜NVIDIA安培

  再看看前几代的NVIDIA GPU,包含Maxwell架构的GTX 980 Ti、Pascal架构的GTX 1080、Turing架构的RTX 2060 Mobile 。

  Maxwell、Pascal其实差不多,前者整体略高一些,可能是受制于芯片面积较大、核心频率较低 。

  Turing则已经有了Ampere的样子,一级缓存延迟低得多,二级差不多,奇怪的是显存延迟在32MB之后偏高,缘由未知 。

GPU延迟对照:AMD RDNA2完胜NVIDIA安培

  AMD 考查了TeraScale架构的HD 5850/6950、GCN架构的HD 7970,再外加RX 6900 XT,很显而易见在逐代减低,并且是各级缓存都在同时 遍及 。

GPU延迟对照:AMD RDNA2完胜NVIDIA安培