NVIDIA“恶补”显卡这门课

2019-05-10 13:00发布

凭借AI人工智能,这家显卡公司的股价在过去的三年飙涨至少10倍,并在2018年10月创下股价历史最高点——每股289.36美元,市值一度超过IBM和麦当劳。

然而高潮过后,滑铁卢式的股价大跌让NVIDIA不得不面对现实,显卡始终是其主要收入来源,AI也并不能让其摆脱“显卡公司”的标签。

随着AI、挖矿、数字货币热潮的褪去,NVIDIA也“冷静”下来,AI是未来,这固然重要,但是显卡在NVIDIA“心”中的地位依旧不可撼动,全球第一显卡厂商NVIDIA开启了显卡在游戏领域的新一轮布局。

老黄的未来 光线追踪技术深度解析

2018年8月,新一代Turing图灵架构显卡在德国科隆游戏展前首次亮相,老黄(NVIDIA创始人兼CEO黄仁勋)手中拿起了他的全新“核弹”——RTX 2080Ti。

随后的日子里,NVIDIA陆续推出了搭载图灵架构的RTX 2080/2080Ti、RTX 2070、RTX 2060、GTX 1660/1660Ti、GTX 1650桌面级显卡,以及RTX 2080、RTX 2070、RTX 2060、GTX 1660Ti、GTX 1650移动端显卡。

提起新一代图灵架构显卡,就不得不提老黄的“光追大计”。自首次提出后,“光线追踪”便成为了显卡和游戏行业的高频词汇,“光追是未来”似乎已经成为了一个肯定的结论。

什么是光线追踪?目前网上对于它的相关解释已经非常多了,从实际游戏角度来说光线追踪是一种能够有效改善/提升游戏画面品质的技术,能够为游戏玩家提供更加真实的光影效果,沉浸感更强,其直观效果有点类似HDR技术,而光线追踪与HDR的结合也将成为未来游戏硬件的最优解决方案之一。

为了让现阶段用户更好享受光线追踪带来的游戏增益,NVIDIA同时推出了两项核心技术RT Core和DLSS,RT Core简单来说是NVIDIA专为光线追踪打造的一个处理核心,其可以让游戏画面发生质的改变,但对硬件性能要求很高;而DLSS是在硬件性能无法达到要求时提供的AI算法优化,通过Tensor Core(张量计算核心,针对AI深度学习)提升游戏性能,二者互补。

RT Core:专为光线追踪计算服务

NVIDIA方面表示,此前不支持光线追踪时,显卡是不需要提供与光线追踪相关的BVH(Bounding Volume Hierarchy)算法的,因此以前光线追踪方面相关的算法都是通过CUDA核心来实现的;而如今,光线追踪的加持会让这部分算法量级显著增加,成为显卡核心中的重点之一,NVIDIA为此专门设计了RT CORE来完成这项工作。

在游戏的3D世界中,每一个物体都是由三角形组成的(3D世界中,三角形是最基本的图形),RT Core要去计算光线和三角形的交汇点,并判断光线如何反射。同时,在自然界中光线数量是无数条的,而计算机不可能完全模拟现实世界的光影,但它却会尽可能模拟更多的光线,只有当光线数量足够多的时候,最后输出的游戏画面才会越平滑,噪点也会越少。此外,这其中还会融入很多AI降噪技术以实现更接近现实世界的光影。

每个游戏光线追踪的应用效果都不同

值得一提的是,光线追踪在不同游戏中的应用效果是不一样的,“我们现在其实是一个混合渲染”,NVIDIA方面强调,“有部分场景应用了光线追踪反射(高级反射和普通反射,其中高级反射会反射很多次,需要更大的计算力)、阴影的效果,但是有些地方还是用以前传统的光栅化方式,拥有很多不同的模式。我们追求的是画面显示效果和最终性能的平衡,在不同游戏中游戏开发商也可以选择加入不同光线追踪的效果,每一个游戏都不太一样。”

不同光线追踪效果的应用往往影响游戏对于显卡性能的要求,目前NVIDIA提供的主要光线追踪效果包括全局光照、反射、阴影、环境光遮蔽等,其中全局光照能够把整个游戏场景渲染得更逼真,也是对显卡性能要求是最高的光线追踪效果。

已经上市的几款支持光线追踪的游戏中,《地铁:离去》采用的便是全局光照,这是目前光影效果营造比较好的游戏之一,但是对于硬件性能要求也极高。“GTX显卡基本运行不了,GTX 1080Ti只有16帧,而RTX 2060则可以跑到30帧以上,可以运行”,NVIDIA产品经理解释道。

《战地 V》融入的光线追踪效果只是反射(包括高级反射),其展现的效果包括水面、汽车、以及武器上的反射等;而《古墓丽影:暗影》只采用了阴影,虽然阴影的计算量也很大,但是其带来的直观感受并没有反射那么震撼,这也是很多游戏玩家表示其光影效果展示并不是很好的主要原因。而即将支持光线追踪的《原子之心》则采用了反射和阴影两大效果。

从目前NVIDIA提供的解决方案来看,针对多重复杂光线追踪效果和光线数量较多的游戏,NVIDIA推荐显卡为RTX 2060及以上,而对于基础光线追踪效果或者光线数量较少的游戏,NVIDIA推荐显卡则为采用帕斯卡或图灵架构的GTX显卡,以及VOLTA架构的TITAN V显卡。而DLSS技术也将帮助一些性能不足的显卡提供光线追踪方面的优化。

DLSS(深度学习超级采样):性能不足时的补偿

对于DLSS,NVIDIA给出的解释是,DLSS的收益是和游戏帧数成反比的,当显卡的性能较差时DLSS会提供更好的效果。简单来说,DLSS是NVIDIA针对硬件性能不足时提供的一种AI算法优化。

举个例子,一款游戏在2K分辨率开光线追踪后的游戏帧数只有30帧,无法流畅有运行,此时开启DLSS后显卡会将游戏原始的分辨率降低以提升游戏帧数,并通过Tensor Core把降低的这部分分辨率补回来,最终实现性能提升。

NAS:更节省Shader资源的图像渲染

此外,NAS(自适应着色技术)的加持也能够显著提升游戏性能。我们知道图像渲染是需要利用Shader(着色器,集成于DX12)中的资源,一个画面里并不是所有的部分都需要用百分之百的精度去做渲染,比如阴影部分用百分之百的精度和百分之八十的精度看上去没什么区别。NAS技术便是根据每一帧画面中的场景利用不同的精度做渲染,在保证输出图像和原始画质完全相同的前提下节省了40%左右的Shader资源,以实现游戏性能的显著提升。

图灵架构GTX显卡:电竞类游戏的深度布局

不同以往,NVIDIA将图灵架构显卡划分了两条产品线——RTX和GTX,二者显著差异就是RTX是搭载RT Core和Tensor Core两个硬件加速核心,而GTX没有。

这遭到了很多网友的质疑,“既然光线追踪这么好,NVIDIA为什么还要将RT Core和Tensor Core拿掉?”

显然,这是NVIDIA的又一策略。市场调研数据显示,目前PC端最火的五款游戏分别为《英雄联盟》、《CS:GO》、《堡垒之夜》、《绝地求生》、以及《守望先锋》,这些游戏大多都是电竞类游戏。这些游戏的共同特点是,没有加入过多的新技术,但玩家数量又非常庞大,而且对游戏硬件要求也不是很高,可能很老的平台游戏帧数也很高,NVIDIA希望通过技术上的改进让这类游戏玩家(电竞选手)获得更多利益。

NVIDIA显卡产品经理表示,“对于所有电竞选手来说,游戏响应延迟是非常关键的,因为他们每一个操作都非常迅速,基本上每200毫秒就会有新操作(正常人大概是300毫秒),他们需要更低延迟的画面。为此,电竞选手需要两大硬件支持,一是更快、延迟更低的显卡,而是更高刷新率的显示器。

举个简单的例子,《CS:GO》在英特尔核显、和NVIDIA以前老显卡GTX 750Ti都能够流畅运行,但是相比目前图灵架构的GTX显卡,还是有很大延迟的,这会对玩家的游戏成绩造成影响。

同时,NVIDIA的调研报告显示,随着时间的积累,电竞游戏玩家在更好的硬件支持下能够更快的提升游戏成绩,硬件越好,游戏成绩提升的幅度也越大。不过,每个人的情况都有所不同,但总体趋势是这样。

NVIDIA表示,尽管GTX系列显卡没有加速核心,但是它依然属于图灵架构,依然可以获得图灵架构带来的游戏增益。

以《古墓丽影:暗影》为例,游戏过程中每100个指令集里大概有38个是做整数的,62个是做浮点的。如果用以前帕斯卡架构显卡来做处理,它的整数和浮点是没有办法同步执行的,只能先做浮点,再做整数,在做浮点的时候,整数的那部分就要闲置,这无疑是浪费时间。在新的图灵架构中,GTX 1660Ti只需要62个指令就可以把所有100个指令全部完成,实际执行效率提升38%,一定程度上提升了游戏性能。

图灵架构移动端GTX显卡:性能全面提升的新游戏平台

2019年4月23日对于科技圈来说注定是一个不平凡的日子,NVIDIA图灵架构GTX移动端显卡与Intel第九代酷睿移动端处理器的同时解禁,令全球游戏玩家能够同时享受到新处理器和新显卡带来的全面游戏性能提升,而游戏本的基础性能也将被带入一个新的高度。

NVIDIA公布的数据显示,全新图灵架构移动端显卡GTX 1660Ti拥有媲美GTX 1070的性能,但是却支持更多的新技术(包括DXR光线追踪),并拥有更低的功耗。对于《绝地求生》、《堡垒之夜》、《Apex》这类游戏,GTX 1660Ti在游戏本1080P分辨率高画质下都能跑到100帧以上,能够带来非常良好的游戏体验,相比GTX 1060拥有30%左右的提升。

在与帕斯卡架构GTX 1060显卡游戏性能对比的数据中,移动端GTX 1660Ti显卡在新游戏上的性能表现会更出色,越是新发布的游戏,图灵架构领先的百分比越高。当然,2015年的老游戏也有很多人玩,但是随着时间的推移,游戏玩家更多的都会去玩新游戏,而图灵架构会因此带来更多的游戏性能收益。

图灵架构中,NVIDIA还更新了直播部分的一个编码,该编码可以在不影响CPU性能的前提下提供更优秀的直播画质。实际体验过程中,CPU占用率只有2%,也不会额外占用显卡资源,而这完全仰仗于图灵架构中的一个专门的Encoder(解码器)。

OPTIMUS也是新一代图灵架构笔记本中非常棒的技术加持,OPTIMUS技术可以帮助游戏玩家在游戏和视频上网模式下自由切换独显和核显,令日常上网等模式能够自动关闭GEFORCE、独显,选择核显,进入省电模式,带来更持久的续航时间。

此外,另一款入门级移动端显卡GTX 1650相比GTX 950M拥有2倍的性能提升,相比台式机GTX 1050拥有1.7倍的性能提升,主流游戏都可以达到60帧,适合入门级玩家。

NVIDIA表示,搭载全新图灵架构GTX 1660Ti显卡的游戏本是针对三到四年游戏本更换周期推出的产品,相比之前的GTX 960M,GTX 1660Ti拥有大约4倍的性能提升,同时处理器、内存、硬盘、以及屏幕刷新率都有了大幅度提升,机身也更加轻薄。

文章来源: https://www.toutiao.com/group/6689249744029483524/