RDNA相比第一代GCN在架构层面进步了多少

2019-09-16 18:19发布

“数毛社”Digital Foundry(以下简称DF)前几天放出了一项对比测试的结果,他们用最新的RDNA架构产品——RX 5700去对比了GCN 1.0的最终产品——R9 280X,在一系列限制条件下面的测试最终得出AMD在架构方面的进步是非常惊人的。


首先来看对比对象:


Radeon R9 280X是AMD在2011年推出的采用GCN 1.0架构的最终产品,核心代号为Tahiti。GCN1.0架构下面最出名的产品可能就是Radeon HD 7970了,R9 280X用的和它其实是一样的GPU,不过频率方面上调了,它拥有32组CU,2048个渲染单元以及288GB/s的显存带宽,在1GHz的显存频率下,它具有4.1TFlops的运算能力。


而最新的RX 5700采用的是RDNA 1.0的架构,拥有36组CU,2304个渲染器,因为使用了最新的GDDR6显存,所以显存带宽高达448GB/s。

这两张显卡差距如此大,怎么进行架构层面的对比呢?DF引入了RX 570以及RX 580。


首先RX 570是采用GCN 4.0的架构,也就是RX 480上面的北极星,拥有32组CU、2048个渲染器,不过显存频率稍弱于R9 280X,但是主要规格达成了一致。


然后是同样采用GCN 4.0架构的RX 580,它拥有与RX 5700一致的36组CU以及2304个渲染器,不过在显存带宽上与RX 5700有比较大的差距。


这样通过GCN 4.0架构的两张卡的加入,RX 5700就可以与R9 280X进行间接对比,算法是这样的:RX 5700相对于R9 280X的领先幅度=RX 570相对于R9 280X的差距*RX 5700相对于RX 580的差距,比如在一个项目中RX 570领先R9 280X 38%,而RX 5700领先于RX 580 36%,那么RDNA 1.0相比GCN 1.0的架构领先幅度就是1.38*1.36=1.8768,约领先88%。

为了比较客观地反映出架构上面的差距,DF采用了工具将四张卡的一些规格限制到相同的水平,比如核心频率都为1000MHz,通过降低显存频率把几张卡的显存带宽限制到一个相对平衡的位置等。


废话不多说,直接来看测试结果。

首先是3DMark的理论测试。


DX11的FireStrike结果显示对于DX11应用,架构层面上面领先了45%。


而DX12的TimeSpy就更加明显了,差距达到88%。


使用GFXBench来测试在OpenGL上面的差距,计算方面领先62%。


而曲面细分则达到了恐怖的745%,主要提升是GCN架构迭代的时候发生的,可以看到Polaris领先了Tahiti 540%。

然后进入实际游戏环节,首先是DX11游戏,上来就是《刺客信条》在本世代主机上面的第一款作品:《刺客信条:大革命》,为了避免爆显存,降低了部分画质设定。


通过架构在两个分辨率下基本都领先了30%。

于去年3月份发售的《孤岛惊魂5》,比较新。


两个分辨率下架构领先幅度分别为38%和34%。

在当年有着“显卡危机”之称的《孤岛危机》的第二部正传续作《孤岛危机3》,发售于2013年。


在今天看来它已经算不上是“显卡杀手”了,不过领先的更加明显,1080p下面达到了50%的架构领先,1440p也有44%。


《幽灵行动:荒野》,发售于2017年3月。同样领先幅度很大,达到59%和55%。


在《猎魔人3》中,采用Ultra画质的时候应该是有地方出bug了,1080p下RDNA领先了115%,这其中61%是由GCN架构内部迭代达成的。


而通过把画质降低到与主机相似的程度,数据结果正常了许多,1080p下领先59%,1440p有46%。

开始测试可以直接与底层硬件交互的API,比如DX12和Vulkan。


先是《重返德军总部2:新巨像》这款采用Vulkan API的游戏,领先GCN 1.0达137%,大部分优化是由GCN架构内部迭代达成的。


去年发售的《古墓丽影:暗影》,采用DX12 API,可以看到RDNA架构的领先优势很大程度上是继承了GCN架构内部优化所致。领先GCN 1.0达89%,但是领先GCN 4.0仅为28.9%。


2018年的《极限竞速 地平线4》,采用DX12 API,同样的,GCN架构迭代的时候对于DX12和Vulkan这样的新API优化非常明显。1080p下面, RDNA领先GCN 4.0仅有27%,而GCN 4.0领先GCN 1.0足足有101%。

再来看一个同时提供DX11和DX12模式的游戏,比如《战地1》。


两个分辨率下DX12模式分别拉开82%和91%的差距,而DX11则小一些,分别领先55%和58%。右上角的帧数显示GCN 4.0对于GCN 1.0在DX12模式下的提升非常明显。
最后是一个支持DX12与Vulkan两个新API的游戏:《Strange Brigade》。


DX12下面,差距还是如此之大,两个分辨率都接近或超过100%。


而用R9 280X单独运行两个API模式,这张卡在两个模式中差距不大。

通过以上的理论和游戏实际测试,可以看到在架构层面上,RDNA 1.0相较GCN 1.0进步是非常大的,尤其是对于DX11游戏。而在更为底层的DX12和Vulkan游戏上面,差距则更多是由GCN架构迭代产生的,也就是这几年中,GCN架构内部进化的幅度也是相当大的,而AMD在设计RDNA的时候显然吸取了在迭代GCN架构时候非常多的经验,最终性能提升不仅仅来自于7nm制程带来的频率提升,架构也贡献了相当一部分力量。

我们知道下一世代索尼和微软两家的主机都将使用基于RDNA架构的图形核心,让人不禁期待起下一世代的主机到底会有多强。

文章来源: https://www.toutiao.com/group/6737047483697857027/