不过好在这么实用的功能并不是RTX 40系的专利,它是一个易于集成的SDK,目前需要游戏开发商集成在游戏中 。另外由于它是一个通用的逻辑,后续也有可能直接集成在Windows的API中,这样游戏开发者就无需特意引用,直接调用系统API即可 。
文章插图
文章插图
可以说SER对于手持RTX 20系及以上(能够开启光线追踪)的N卡用户来说,是极大地福音 。毕竟免费提升的光追性能,谁不喜欢呢 。
第三代 RT Cores
RT Core的作用在于更快的光线追踪计算能力,如果说在RTX 30系显卡中,想要畅享4K高帧率游戏有点吃力,那么RTX 40系显卡中,将显得轻而易举 。
文章插图
文章插图
在GeForce RTX 4090这张显卡上,达到了191 RT-TFLOPs的处理能力,而RTX 30系显卡最快处理能力为78 RT-TFLOPs,足足为2.4倍 。并且根据NVIDIA的官方说法,第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍 。而这只能说明,这张4090并非Ada Lovelace架构的最终形态 。
Opacity Micro-Map Engines
在第三代RT Cores中引入了两个重要的硬件单元,首先是Opacity Micro-Map Engines,可以理解为微映射透明度引擎,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担 。
比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的 。
文章插图
文章插图
不过Opacity Micro-Map Engines可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担 。
Displaced Micro-Mesh Engines(DMM)
Displaced Micro-Mesh Engines可理解为微网格置换引擎,它构建光线追踪的BVH(Bounding volume hierarchy)的速度提高了10倍!所使用的的显存减少了20倍!
文章插图
文章插图
DMM由第三代RT core本地处理,与前几代相比,它只使用基本三角形渲染复杂几何图形,极大减少了存储和处理需求 。
具体的工作原理从图中一目了然,新的DMM可以将面数非常多的复杂图形做简化,创造出简单的模型,但整体的光线追踪效果不变 。
文章插图
文章插图
通过一些模型数据我们可以具体看到,新的DMM将模型简化了多少 。原本1100万三角面的模型,经过简化后,只有15万左右的微网格,BVH的构建速度提升了8.5倍,小了6.5倍 。
而这还不是最夸张的,越复杂的模型往往优化的效果越好,在官方展示的这几组对比示例中,最快可提升大于15倍的速度,容量简化20倍的模型 。
第四代 Tensor Cores
除了光追单元的升级外,第四代张量核心的升级更加恐怖 。它采用了新的FP8张量引擎,在GeForce RTX 4090这张显卡上,吞吐量达到了1.32 Tensor petaFLOPs,提高了5倍 。
注意这里的单位——petaFLOPs 。以往的TFLOPs为万亿次浮点运算,而petaFLOPs则为千万亿次浮点运算 。
文章插图
文章插图
DLSS 3
本次推出的DLSS 3也是RTX 40系一大卖点,从DLSS 2.3直接迈入了DLSS 3版本,也能看出此次的升级之大 。而DLSS 3也被NVIDIA官方称为神经网络渲染新时代 。
全新的DLSS 3在原有的DLSS超分辨率的基础上,添加了光学多帧生成技术,以生成全新的帧,而不像原来只能生成像素 。
推荐阅读
- 英伟达RTX 3090矿卡评测 3090显卡是什么东西
- 关于4070发售时间及参数分析 4070显卡是什么
- RTX3060和3060TI性能差距详述 3060和3060ti哪个性价比高
- GTX1080与RTX3060对比 1080ti和3060哪个好
- GTX1060和RTX2060性能对比 2060比1060强多少
- RTX4060游戏本性能实测 4060显卡相当于什么级别
- RTX显卡与 GTX显卡性能表现测试 gtx显卡好还是rtx显卡好
- i5 13490F搭RTX3060装机方案来看看 5000元电脑配置推荐高性价比
- ROG幻16经典版怎么样 ROG幻16经典版评测
- RTX2060全方位体验 rtx 2060显卡什么级别