耕升RTX 4070 Ti星极皓月OC显卡评测耕升显卡怎么样( 七 ) _生活百科

不过好在这么实用的功能并不是RTX 40系的专利，它是一个易于集成的SDK，目前需要游戏开发商集成在游戏中。另外由于它是一个通用的逻辑，后续也有可能直接集成在Windows的API中，这样游戏开发者就无需特意引用，直接调用系统API即可。

文章插图

文章插图

可以说SER对于手持RTX 20系及以上（能够开启光线追踪）的N卡用户来说，是极大地福音。毕竟免费提升的光追性能，谁不喜欢呢。
第三代 RT Cores
RT Core的作用在于更快的光线追踪计算能力，如果说在RTX 30系显卡中，想要畅享4K高帧率游戏有点吃力，那么RTX 40系显卡中，将显得轻而易举。

文章插图

文章插图

在GeForce RTX 4090这张显卡上，达到了191 RT-TFLOPs的处理能力，而RTX 30系显卡最快处理能力为78 RT-TFLOPs，足足为2.4倍。并且根据NVIDIA的官方说法，第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍。而这只能说明，这张4090并非Ada Lovelace架构的最终形态。
Opacity Micro-Map Engines
在第三代RT Cores中引入了两个重要的硬件单元，首先是Opacity Micro-Map Engines，可以理解为微映射透明度引擎，它主要的作用是优化光线追踪渲染，可大幅减轻着色器的工作负担。
比如树叶之类的复杂物体，不同的光线都会影响它的表现状态，以及树叶之间的光线反弹，所以对于光线追踪的计算量是巨大的。

文章插图

文章插图

不过Opacity Micro-Map Engines可以将光线追踪特性烘焙到不透明蒙版中，所以那些不规则形状和半透明的对象，也就能够更快更精准的渲染出来，从而极大减轻着色器的工作负担。
Displaced Micro-Mesh Engines（DMM）
Displaced Micro-Mesh Engines可理解为微网格置换引擎，它构建光线追踪的BVH（Bounding volume hierarchy）的速度提高了10倍！所使用的的显存减少了20倍！

文章插图

文章插图

DMM由第三代RT core本地处理，与前几代相比，它只使用基本三角形渲染复杂几何图形，极大减少了存储和处理需求。
具体的工作原理从图中一目了然，新的DMM可以将面数非常多的复杂图形做简化，创造出简单的模型，但整体的光线追踪效果不变。

文章插图

文章插图

通过一些模型数据我们可以具体看到，新的DMM将模型简化了多少。原本1100万三角面的模型，经过简化后，只有15万左右的微网格，BVH的构建速度提升了8.5倍，小了6.5倍。
而这还不是最夸张的，越复杂的模型往往优化的效果越好，在官方展示的这几组对比示例中，最快可提升大于15倍的速度，容量简化20倍的模型。
第四代 Tensor Cores
除了光追单元的升级外，第四代张量核心的升级更加恐怖。它采用了新的FP8张量引擎，在GeForce RTX 4090这张显卡上，吞吐量达到了1.32 Tensor petaFLOPs，提高了5倍。
注意这里的单位——petaFLOPs 。以往的TFLOPs为万亿次浮点运算，而petaFLOPs则为千万亿次浮点运算。

文章插图

文章插图

DLSS 3
本次推出的DLSS 3也是RTX 40系一大卖点，从DLSS 2.3直接迈入了DLSS 3版本，也能看出此次的升级之大。而DLSS 3也被NVIDIA官方称为神经网络渲染新时代。
全新的DLSS 3在原有的DLSS超分辨率的基础上，添加了光学多帧生成技术，以生成全新的帧，而不像原来只能生成像素。