一、引言
随着全新NVIDIA Ada Lovelace 架构的发布,从2023年开始,NVIDIA GeForce RTX 40系列显卡按部就班的相继发布,从4060到4090基本实现了全价位、全场景覆盖。虽然价格并不美丽,但乌烟瘴气的显卡市场总算迎来了一道曙光。
在CES 2024上,NVIDIA继续发力,推出RTX 4080 SUPER、RTX 4070 Ti SUPER和RTX 4070 SUPER三张新卡,进一步细分和完善了 40系显卡阵营。这三张40系SUPER显卡不仅带来游戏娱乐、生产力创作等应用方面更强劲的性能提升,更重要的是加入了生成式 AI功能,成为NVIDIA平台转换的关键节点。
从发售价看,RTX 4070 Ti SUPER和RTX 4070 SUPER的发售价和之前发布的RTX 4070 Ti和RTX 4070相同,RTX 4080 SUPER的发售价甚至比RTX 4080低了约16.7%,妥妥的加量不加价。
目前各大PC硬件厂商相继发布了自家RTX 40系SUPER显卡,本文带来的是索泰 GeForce RTX 4070 SUPER-12GB X-GAMING OC 欧泊白的深度测评。(以下简称:索泰 RTX 4070 SUPER 欧泊白)
二、NVIDIA Ada Lovelace 架构有要点分析
40系显卡阵营最核心的部分当属NVIDIA Ada Lovelace 架构,在正文开始前,我们先了解一下NVIDIA Ada Lovelace 架构有哪些先进之处。
(1)GPC-TPC-SM层级架构
从完整的架构核心图看,Ada Lovelace依然沿用了GPC-TPC-SM层级架构,最大核心的GPC规模从Ampere架构(30系显卡架构)的最大7个增加至12个,Ada Lovelace的二级缓存规模是Ampere的16倍,这些暴增的参数意味着性能的巨大提升。
Ada Lovelace架构的每组GPC包含6组TPC(每组TPC包含2组SM)、1个独立光栅引擎(Raster Engine)、2个ROP分区(每个分区包含8个ROP单元)。这样,Ada Lovelace架构的TPC和SM单元数量分别增长到最多72个和144个。
SM的结构也与Ampere架构一样,有4个计算模块,1个RT CORE光追核心(第三代)以及128KB L1缓存。每个计算模块包含64KB寄存器文件、零级缓存指令、16个FP32单精度浮点CUDA核心、16个FP32/INT32单精度浮点和整数混合CUDA核心、1个Warp调度器、1个分配单元、1个Tensor Core张量核心(第四代)、4个载入存储单元以及1个特殊功能单元(SFU)用于执行图形差值指令。
除了在架构核心方面的提升,Ada Lovelace对游戏性能的支持主要体现在三个部分:第三代RT Core、第四代 Tensor Core、NVIDIA DLSS 3。
(2)第三代RT Core
RT Core核心在视频、游戏中实现实时光线追踪,专为处理性能需求密集的光线追踪工作负载而设计。 全新的第三代RT Core不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。RT Core 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。
Opacity Micro-Map引擎将光线追踪的Alpha-Test几何性能提升2倍;Displaced Micro-Mesh引擎可动态生成微网格产生额外的几何图形,从而实现几何复杂场景的实时光线追踪,同时所占用的显存只有之前的二十分之一。
(3)第四代 Tensor Core
Tensor Core可实现混合精度计算,动态调整算力,从而在保持准确性的同时提高吞吐量。第四代Tensor Core新增了Hopper FP8 Transformer Engine,可提供1400 TFLOPS的张量处理性能,性能是上一代的5倍。
(4)DLSS 3.5
DLSS 是 AI 驱动图形领域的革命性突破,通过第四代 Tensor Core 和光流加速器提供动力支持,可利用 AI 创建更多帧并提高图像质量,提升GPU游戏性能,其中包含DLSS帧生成、
DLSS超分辨率、深度学习抗锯齿 (DLAA)等技术。
2023年8月底NVIDIA正式发布了DLSS 3.5,加入了全新的DLSS光线重建技术,主要功能是借助 NVIDIA 超级计算机训练的 AI 网络取代需要人工设计的降噪器,在被采样的光线之间生成更高质量的像素,从而提升光线追踪的图像质量。
《赛博朋克2077》支持光线重建技术,在游戏中,只有开启超级光追才会出现光线重建的选项,它最主要的功能是强化光追的效果,充分释放光线追踪的优势。
第一组树叶的对比,虽然右图(关闭光线重建)的树叶有高光,但画面没有立体感,几乎没有光影;仔细观察左图(开启光线重建)的画面,虽然是夜晚但依然能看到清晰的明暗阴影,细节到位,有立体感。
第二组对比应该更明显吧,左侧树干有质感、更真实;而右侧黑了一大半,基本看不到树干的纹理细节。
三、基准性能测试与对比
先贴上本次测试平台,以intel i5-13600KF为核心组成的,配合NZXT N7 Z790主板和1200W电源基本能确保索泰 RTX 4070 SUPER 欧泊白全力发挥。
RTX 4070 SUPER的核心参数已经在文章开始时贴出来了,这里不做过多赘述,直接开始测试,随后会和RTX 4070进行一轮对比。
(1)基准测试
3DMARK Time Spy是针对2K分辨率 DirectX 12 游戏的基准测试,测试结果19699分,显卡得分21436分,CPU得分13501分。
Time Spy测试预估了几款游戏大作的帧率。
Time Spy Extreme 是针对4K分辨率 DirectX 12 游戏的性能测试,测试结果9131分,其中显卡测试10222分,CPU测试5692分。
Port Royal实时光追性能测试,得分13289分。
NVIDIA DLSS功能测试如下:
4K分辨率:关闭DLSS帧率28.46FPS,开启DLSS帧率提升到101.07FPS,提升约255%
2K分辨率:关闭DLSS帧率61.61FPS,开启DLSS帧率提升到155.78FPS,提升约153%
由此可见,DLSS对游戏帧率的影响有多大。尤其开启光线追踪后的效果更明显,这里先卖个关子,后面我会结合游戏表现更直观的讲解光线追踪和DLSS的相互作用。
▼ 4K分辨率
▼ 2K分辨率
(2)对比测试
自从RTX 4070 SUPER发布以来,很多人都在查询它的性能与RTX 4070Ti相比有多大差距,我把前文参数表格中两者的核心参数摘出来对比,RTX 4070Ti的CUDA核心数量比RTX 4070 SUPER多了约7.1%,TGP高了约29.5%,显存规格相同。
刚好我这里有一块索泰RTX 4070Ti欧泊白,对比两张显卡的3DMARK基准测试结果,正在纠结这两张显卡的小伙伴可以参考一下。NVIDIA DLSS帧率高出约2%,其它基准测试高出约5%左右。
时间原因没有对比应用场景的表现,以后有机会再写一篇详细的对比测评吧。
四、游戏体验
关于光线追踪与DLSS的技术理论在前面已经做了简单科普,接下来通过索泰RTX 4070 SUPER看看它们会给游戏带来怎样的提升。
(1)光线追踪和DLSS的关系
光线追踪是NVDIA RTX系列显卡的独有技术,在40系显卡提升到第3代,大幅提升运算能力与应用性能。光线追踪通过模拟真实世界的光线特性渲染出更逼真的游戏画面,创造身临其境般的游戏体验。《赛博朋克 2077》游戏中的一组画面对比可以非常明显看出光线追踪对画面质感、细节表现、光影效果的加成。
开启光追后画质和细节的表现力有非常大提升,但这也意味着占用更多显卡资源,导致游戏帧率大幅下降,这时就轮到NVDIA DLSS出场了。DLSS的作用是在不影响画质和响应速度的前提下,利用AI技术创造更多高质量帧,从而提升画面流畅度。
《巫师3》中,2K分辨率开启光追,关闭DLSS时的帧率98 FPS,开启DLSS后帧率133 FPS,提升了约35.7%。
(2)《巫师3》
看一下《巫师3》光追的视觉效果。
从下图对比中可以看出,未开启光追时,虽然是超高画质,但和开启光追后的画面相比,植物看着单薄,毫无立体感可言;开启光线追踪后,画面质感有了非常明显提升,近处的花草、远处的房屋在细节丰富度和颜色的质感方面都是肉眼可见的提升。
▼ 超高画质(未开启光线追踪)
▼ 开启光线追踪
2K分辨率:
超高画质(关闭光追)、关闭DLSS,游戏帧率 140 FPS;
超高画质(关闭光追)、开启DLSS,游戏帧率210 FPS;
开启光追、关闭DLSS,游戏帧率98 FPS;
开启光追、开启DLSS,游戏帧率132 FPS。
有了光追+DLSS的加持,画质和流畅度可以鱼和熊掌兼得,提升画质的同时保证游戏的流畅度,代价是显卡一直处于近乎满载的工作状态。
值得一提的是,DLSS的功能主要提升游戏帧率,对画质的影响微乎其微,几乎看不出来。
▼ 开启光线追踪、关闭DLSS
▼ 开启光线追踪、打开DLSS
(3)《赛博朋克2077》
4K分辨率,开启光追+DLSS,平均帧率73FPS,最大帧率89 FPS;
2K分辨率,开启光追+DLSS,平均帧率135 FPS,最大帧率165 FPS。
(4)《荒野大镖客2》
4K分辨率,最高画质:
开启DLSS,游戏帧率125 FPS;
关闭DLSS,游戏帧率84 FPS。
2K分辨率,最高画质:
开启DLSS,游戏帧率119 FPS;
关闭DLSS,游戏帧率118 FPS。
(5)《GAT5》
4K分辨率高画质帧率148 FPS,2K分辨率高画质帧率184 FPS。
(6)《刺客信条:英灵殿》
4K分辨率高画质平均帧率87 FPS,最高帧率196 FPS;
2K分辨率高画质平均帧率151 FPS,最高帧率219 FPS。
五、生产力和AI创作
平时我常用的Adobe生产力三件套(PS+PR+AE)这种强度的任务对索泰 RTX 4070 SUPER 欧泊白来说小菜一碟。
以AE为例,渲染一条14s、1080P、H.264、30帧特效视频,共耗时约1分32秒,期间显卡资源的占用率最高60%左右,多数时间在20%-40%之间。
除了拥有出色的游戏性能外,RTX 40 系列显卡的另一项重要任务是提升PC上的AI性能以及AI方向的应用场景,例如:AI创作、AI游戏、AI聊天、AI直播等。
Stable Diffusion是最近非常热门的一款AI绘画生成工具,只需要输入一句话、一组关键词即可生成一张你想要得到的图片。RTX 40系显卡负责渲染,性能越强、显存容量越大,生成图片的分辨率越高、渲染速度越快。
来看看索泰 RTX 4070 SUPER 欧泊白的AI绘图性能:10张1080 x 1080的高清图片(采样方法Eular a、迭代步数为50、随机数种子13)共耗时约168s,每分钟约3.5张,这效率你们满意吗?
六、散热与功耗表现
室温26℃左右,FurMark 2K分辨率烤机15分钟后各项参数趋于稳定,平均帧率222 FPS,显卡核心温度76.7℃左右,显存温度66.3℃,显卡功耗220W,与官方TGP相符。满载风扇转速1289 RPM,噪音控制的相当不错。
值得一提的是,索泰 RTX 4070 SUPER 欧泊白支持风扇智能启动技术,通过AI管控可以在高/低温和负载之间智能启停,有利于降低功耗、减小噪音。
七、外观与细节展示
最后,为大家介绍一下本文主角索泰 RTX 4070 SUPER 欧泊白的外观设计和卡身细节。
对索泰显卡有一定了解的小伙伴应该对“欧泊白”这个配色方案有印象, 外观设计灵感来源于“白欧泊石”,主打年轻和个性,清新淡雅的白色导风罩,表面镀了一层变色膜,迎着光线会看到灰色涂鸦变成了淡淡的蓝色,如同欧泊变彩效应的视觉效果。
显卡的背板是高强度合金材料一体成型而成,起到保护PCB的作用,同时,背板表面布满了灰色涂鸦,时尚、有趣又有点张扬,比较符合年轻人的审美。
显卡使用了全新升级的高效能冰芯散热系统,配备三把暗影极夜风扇叶、冰镜导热模组、冰脉2.0符合热管和厚重的散热鳍片,有效提升热效率,轻松应对严苛的散热挑战。
扇叶的弧度和倾斜角度都做了优化设计,不仅能带来更大风压和风量,还能有效降低风阻和噪音。
供电接口是全新的12VHPWR接口,需要使用新款ATX 3.0电源或者转接线。
标配3个DP 1.4接口+1个HDMI 2.1接口,能满足多数人的使用需求。
帅气的LOGO灯,在FireStorm软件中支持1600万色自由调控。
索泰 RTX 4070 SUPER 欧泊白尺寸303 x 121 x 61 mm,安装需占用3个槽位。
索泰 RTX 4070 SUPER 欧泊白的上机效果非常漂亮,稳稳的拿捏了我这枚理工男的审美。
八、总结
得益于NVIDIA Ada Lovelace架构的升级,索泰 RTX 4070 SUPER 欧泊白能轻松驾驭各种3A大作、AI创作、生产力等任务,画质、流畅性都有非常好的表现。之前看到有小伙伴担心RTX 4070 SUPER 4K分辨率时的游戏体验,凭借光线追踪和DLSS的加成,即便4K分辨率也能无压力畅玩3A游戏,有这方面顾虑的小伙伴完全可以放心啦。
所以,如果你预算不足以让你一步到位到RTX 4090顶配,但又想获得畅快淋漓的游戏体验,在显卡的选择上,5000元价位以内,索泰 RTX 4070 SUPER 欧泊白是个非常有性价比的选择!
OK,以上就是本次分享的全部内容,感谢大家观看。同时,期待您动动发财的小手帮我点点关注,这是我持续创作的动力,感谢大家!
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有