前言:艺术是有门槛的,"第九艺术"也不例外
2011年5月9日,美国国家艺术基金会正式宣布"电子游戏是一种艺术形式"。同年6月28日,美国最高法院大法官安东尼·斯卡里亚引援"电子游戏是艺术"的观点,宣布游戏和其他艺术形式拥有相同的传播权利,判决不得禁售电子游戏。
是的,虽然世界上第一个有专利记录的"电子游戏"诞生至今,已经过去了快80年的时间,但无论是对于游戏公司、普通玩家还是专业的游戏鉴赏家来说,将游戏与"艺术"划等号,是差不多最近十余年才有的概念。
为什么会这样?其实一个很最简单的原因就在于,游戏的表现形式天生就受到了存储载体、运行和显示设备的制约。早期的示波器游戏、像素游戏固然可以很"好玩",但它们却很难去讲好一个情节曲折、动人心弦的故事,更难以用引人入胜的画面去真正让玩家"沉浸"在其所展现的世界里。
虽然我们不否认,如今依然有许多出色的、基于"像素风"的游戏在不断推出。但与此同时,追求更高清画面、更拟真的光影、更细腻建模的"3A大作",也在引领着电子游戏行业相关技术的持续进步,甚至因此造就了诸如"游戏摄影"、"游戏影视"这类衍生艺术形式。
如此一来,对于醉心于"第九艺术"的玩家朋友来说,他们自然也了解,要想充分体验到游戏制作方所希望传达的思想、氛围,并尽可能地沉浸于游戏世界,就必然不能在游戏画质设定上有所妥协。而为了能够毫无顾忌地"全最高画质全开",一台足够高配置的电脑、一款顶级显示器,特别是一块能够轻松应对现存甚至是未来游戏性能需求的显卡,也就成为了不可或缺的。
今天我们三易生活的评测对象,也正是迄今为止最新、最强,同时更是万众瞩目的顶级游戏显卡,"第九艺术"的终极动力——NVIDIA GeForce RTX4090。
设计解析:这一次,GPU规格提升终于"重回正轨"
众所周知,自RTX 20系列以来,NVIDIA就高调地祭出了"光线追踪"和"AI计算"这两个以往极少在图形领域被提及的功能。时至今日,许多游戏开发企业和玩家也已习惯了光追技术所带来的画面真实感,并将"支持光追"作为了顶级3A大作所必须具备的技术特征之一。
在将从GeForce GTX 1080 Ti到GeForce RTX 4090(下文简称为RTX 4090)这四代NVIDIA旗舰显卡的相关规格汇总后不难发现,RTX 4090在"基础设计思路"上其实发生了一些有趣的转变。
首先,从最基础的晶体管数量对比中可以看到,RTX 4090这次"堆"的相当猛,直接达到了上代架构近270%的规模。这在最近几代的旗舰GPU里,都是从未出现过的情况。
但在晶体管数量大涨接近2.7.倍的同时,RTX4090的ALUs(也就是俗称的"流处理器")数量,相比上代却只增加了不到60%。这就产生了一个矛盾,晶体管数量是前代的近2.7倍,流处理器却只有前代的1.5倍多一点,那么这些晶体管被"消耗"到哪里去了呢?
进一步横向对比这四代旗舰GPU之间的差异可以看到,从GTX 1080 Ti进化到RTX 2080 Ti时,NVIDIA几乎是过于片面地强调了"光线追踪"和"AI计算"这两个当时的最新卖点。换句话说,RTX 2080 Ti在"非光追、不开启DLSS"的老游戏里,基础的多边形、纹理生成性能真未必能比上代强出多少。
但到了RTX 3090这一代,NVIDIA意识到当时主流游戏对于GPU的"单精度浮点"需求非常强烈,因此RTX 3090大幅变革了流处理器的基础设计,直接将单精度浮点单元的数量翻倍,同时对其他的功能单元也进行了一定程度的增强。以结果而论,这就使得RTX 3090哪怕是在"非光追"、或者说不开启光追的游戏里,也能得到相比RTX 2080 Ti、GTX 1080 Ti明显高出一截的帧率表现。
明白了这一点,再来看这次的RTX 4090。没错,其流处理器数量虽然"仅仅"比上代提升了56%,但一方面大幅提升的主频让RTX 4090的单精度浮点性能,相比上代提升了超过100%;另一方面,在"传统"的纹理和多边形生成性能上,RTX 4090也进行了久违的大幅度增强,这就意味着哪怕是在古早游戏、或是DX9、DX10时代的老游戏里,也有望带来翻倍的帧率表现。
这还没完,在RTX 4090上,NVIDIA也终于"从善如流"地使用了当前流行的超大L2缓存设计,而大缓存实际上会进一步增大显存的等效带宽。因此RTX 4090在实际使用中的显存吞吐量性能,其实是有望大幅领先于RTX 3090的,决不会只有表面上看起来的那么一点差异。
这也就意味着,相比于RTX 20系专注"光追"、RTX 30系专注新游戏的设计思路,RTX 4090的基础设计思路可以说是实现了全方位的、无论是最新3A大作、还是早前的DX10甚至DX9游戏,都能带来数倍帧率提升的规格进步。很显然,这让它看起来非常地"有诚意",也着实令我们对它有了更高的期待。
功能解析:多项新技术加持,重点在于效率提升
讲完了RTX 4090在基础架构上的设计思路改变,接下来我们来看看它此次在功能层面带来的一些新玩意。
首先,RTX 4090不只是重新重视起最基础的多边形、纹理生成性能,将自身基本的3D绘图能力提升了超过100%。还成为了业界首个支持"着色器执行重排序"功能的GPU。在NVIDIA方面公布的信息显示,这项功能的重要性几乎可以等同于CPU上的乱序执行技术,特别是在现代光线、场景、材质极为复杂的大型游戏中,光是这一个功能就能让光线追踪的着色效率提升100%、或是让游戏帧率提高1/4。
其次,RTX 4090的RT Core(光追单元)也进化到了第三代架构,内部增加了Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎两个新的功能模块。其中,OMM引擎专为树叶、颗粒和围栏等镂空材质的光追计算进行了专门优化,而DMM引擎则专门负责构建光线追踪边界体积层次结构。其计算速度相比过去的设计提高了9倍,同时显存占用更是仅有前代的1/20,大幅提高了显卡在应对复杂场景光追游戏时的计算效率。换句话来说,与上代的RTX 20、RTX 30系相比,RTX 4090在开启光追后的帧率损失将会更少,特别是在本身画质就很高的游戏里,更是有助于玩家享受"满配视觉体验"。
而在AI计算能力上,大家都知道RTX 4090的ADA Lovelace架构脱胎于专业计算卡上的Hopper架构。自然这也就意味着,它的Tensor Core也采用了Hopper同款的第四代架构,拥有4倍于前代的数据吞吐量。
最后,在第四代Tensor Core以及新架构所独有的"光流加速器"的加持下,NVIDIA为RTX 40系带来了全新的DLSS 3深度学习抗锯齿功能。事实上,此前DLSS本质上是GPU先进行低分辨率渲染,然后再由Tensor Core进行AI超分画面缩放,从而在降低显卡实际负载、提升游戏帧率的前提下,让画面看不出太多的损失。而DLSS 3如今已不只是对单帧画面进行无损超分放大、AI填充细节这么简单了,它甚至可以让RTX 40系显卡直接生成完整的、具有实际画面内容的中间帧。如此一来,这也就意味着RTX4090此次在适配了DLSS 3的游戏里,几乎可以"凭空"提升帧率到原本的3-4倍之多。对于特别重视帧率的玩家(比如FPS、竞速游戏爱好者)来说,这个功能显然值得感到兴奋。
外观鉴赏:全金属巨型散热器,无光污染是优势
讲了这么多技术上的、功能上的话题,相信大家已经等不及要进入实际的产品测试环节了。
这就是我们三易生活此次拿到的评测对象,影驰RTX 4090金属大师OC。不得不说,从图片上大家可能感受还不是太深,但实际上这个几乎有半米高的包装盒从一开始,就给了我们极大的震撼。
拿掉封套、打开又大又厚的包装盒,显卡本体被静电袋和厚实的防震棉所包裹着,除此之外还有一些附件也都放在了与显卡平行的显眼位置上。很显然,它们也正是造成包装盒如此巨大的"元凶"。
而在影驰RTX 4090金属大师OC的包装盒中,除了说明书外,主要就分别是显卡本体、12VHPWR转4*8Pin延长线,以及一套金属材质的显卡支撑杆套件。
是的,最近这段时间关注显卡的朋友想必已经知道,自公版RTX 3090Ti之后,NVIDIA的公版卡如今已全面换用了基于PCIe 5.0标准的12VHPWR供电接口。这也就意味着,玩家要么需要购入新的、支持ATX3.0标准的新电源,要么就需要使用转接线,才能将旧电源连接到新款显卡上。
不过,这里面其实存在三个问题。一是目前市面上能买到的、特别高端(铂金或钛金级别)的ATX3.0新标准、大功率的电源还不多。二是根据目前公开的信息显示,12VHPWR转接线的寿命着实不算太好看。
第三个、同时也是最为重要的一点在于,此次RTX 40系列都是不支持多卡互联的。这不只是其PCB上没有了NVLink接口这么简单,而是核心层面就直接去掉了NVLink功能模组。
这意味着什么呢?也就是说如果你手头本就已经有定位高端的大功率电源(比如钛金1600W、铂金2000W),那么再去更换新标准的电源其实意义不大。因为即便是RTX 4090,在公版单卡TGP默认450W、超频上限只有480W的前提下,一颗旧标准的大功率高端电源也是绝对"保险"的。
当然,有的朋友可能会说,"我的PC配置没这么简单,CPU用的线程撕裂者/至强铂金,机箱里还有好几块氦气硬盘,而且打算入手的是顶级的非公版RTX 4090,日常还需要超频使用"。那么在这种情况下,我们不太建议你使用转接线和老电源的。此时购入一款真正符合ATX3.0标准,能够使用原生12VHPWR显卡供电线材的电源,就很有必要了。
比如我们三易生活就为此次评测准备了一款来自海韵的TX-1000旗舰钛金电源,这也是目前能够买到、为数不多在性价比和用料上均能让人放心的ATX3.0电源之一。当然,对于顶级发烧友来说,海韵也有提供TX1600这类顶级产品,而且长达十二年的保修、说"传家"也不过分。
接下来,我们将视线重新回到显卡身上。前文中就已提及,RTX 40系列此次全系取消了多卡互联功能,再加上默认TGP提高到了450W,于是体现在造型上,就是现在大家见到的、史无前例的厚重堆料散热器设计了。
根据官方公布的相关参数显示,影驰 RTX 4090 金属大师 OC的尺寸为352*153*69mm(含挡板)。而从显卡的侧面也不难看出,其此次所使用的"寒光星δ"散热器,有着足足超过三卡槽的厚度。
那么如此厚度的大型散热器,内部的用料水准又如何呢?首先从显卡背部就不难发现,RTX 4090此次的公版PCB实际上采用了与前代RTX 30系一样的镂空设计。换句话来说,其散热器鳍片部分的面积,实际上是要远大于PCB本身的。
透过散热器背部的"开窗"可以清楚地看到,其内部全镀镍的细密鳍片,以及贯穿其中的多条粗壮热管。
据悉,"寒光星δ"散热器实际上使用了8热管的配置,其中四根直径为8mm、另外四条直径则是6mm,并且所有的热管和鳍片间都采用了回流焊进行固定。所以无论是从热管的堆料、还是焊接工艺上来说,这确实都是目前的顶尖水准。
而在散热器正面,影驰则采用了三颗并排的102mm大尺寸风扇,并且值得一提的是,风扇本身的厚度达到了20mm,同时扇叶具备显眼的弯折降噪造型。也就是说其采用的是高风压取向,注重"吹透"厚实的散热器、能将热量切实带走的设计。
考虑到影驰 RTX 4090 金属大师 OC本身采用的是沿袭公版的前后贯通式散热器,这样的设计显然比起各种带有"正反转"、"大小扇"的风量向设计,更具实用意义。
最后还有一个设计是必须要好评的,那就是影驰 RTX 4090 金属大师 OC的整个散热器在使用全金属外壳的同时,完全没有任何"光污染"的元素。对于不喜欢"RGB"、只想安安静静享受游戏乐趣,或是想要配一套不引人注目的旗舰PC的朋友来说,这样的设计显然很对他们的胃口。
性能测试:跑分提升超100%,4K满画质畅玩无压力
最后,一起来看看影驰 RTX 4090 金属大师 OC的跑分和游戏实测成绩吧。
首先,介绍一下我们此次的测试平台。由于在收到这款显卡时,英特尔的13代酷睿和AMD 7000系锐龙都还没有准备好,所以我们搭建了一套基于酷睿i7-12700K的主流平台。
由于是新搭建的平台,所以正如前文中曾提及的那样,我们"一步到位"地选择了海韵的TX-1000旗舰钛金作为这套平台的电源解决方案。
虽然这款电源并没有自带新规格的显卡接口,但超低的波纹和足量的8pin接口,带动450-480W级别的RTX 4090还是绰绰有余的。
同时为了保证确保IO性能不会成为游戏、理论测试的瓶颈,所以还使用了频率高达6400 MT/s的Kingston FURY叛逆者(Renegade)DDR55 RGB内存16GB*2,以及一款5000MB/s级别的影驰HOF Pro 30 PCIe 4.0 SSD作为存储解决方案。
关注DDR5内存的朋友可能知道,目前DDR5内存频率是从4800MHz起跳的,但对于发烧友来说,这样的内存频率显然不足以"带动"旗舰平台的CPU和游戏性能。正因如此,我们此次也直接选择了当前能买到、频率最高的DDR5内存模组之一——Kingston FURY叛逆者(Renegade)DDR5 RGB内存,具备最高6400 MT/s、且带RGB灯的"顶配版本"。
当然,对于我们此次的测试来说,之所以选择这款内存原因显然不是RGB等。事实上,Kingston FURY叛逆者(Renegade)DDR5 RGB内存的CL32低时序、内置ECC校验机制,以及默认6000/6400两档XMP3.0可编程超频设置,才是我们看重的地方。
毕竟并不是所有的主板和CPU都能确保稳定跑满6400 MT/s的内存,在这种情况下,更低的时序以及一个备选的、潜在稳定性更好的6000MT/s,对于绝大多数既想要体验顶级性能、(主板的)预算又不是那么充足的玩家来说,其实是很有意义的。
Fire Strike Ultra 图形得分24719、总分22933
Time Spy Extreme 图形得分18950、总分15426
Port Royal成绩:25845
首先,是3DMARK基础测试成绩。可以看到,与此前的RTX 3090相比,RTX 4090无论是在较为古老的4K DX11测试、新的4K DX12测试,还是最新的光线追踪场景测试中,图形部分的得分提升幅度均超过了100%。
并且从GPU-Z的监测数据来看,我们手头这款影驰 RTX 4090 金属大师 OC正如其命名所示,是有轻度"出厂超频"的。默认最高主频可达2565MHz,略高于公版的2520MHz。
但是在跑分软件的监测数据中可以看到,影驰 RTX 4090 金属大师 OC在跑分过程中的峰值频率达到了2715MHz,不仅超过了公版RTX 4090的默认主频范围,也超过了出厂的BOOST频率。
很显然,这与NVIDIA显卡最近这几代基于温度的频率调控策略,有着很大的关系。所以与其说是影驰"出厂官超"的功劳,不如说是因为这款显卡散热做得不错,所以能够发挥出默认水准以上的性能。
接下来,我们还用几款流行的游戏对影驰 RTX 4090 金属大师 OC的性能进行了测试。需要注意的是,由于我们测试时使用的是相对早期的测试版驱动版本,其并没有完全适配最新的Windows 11 insider系统的WDDM 3.2新版驱动模式(此前NVIDIA已经发布了支持新版系统的530分支驱动,但这款驱动尚未适配RTX 4090,因此无法用于此次测试)。当然,它也就可能存在游戏优化不完全的问题,所以此次游戏测试成绩仅作参考。
首先,我们使用了目前公认最"烧机"的3A大作《赛博朋克2077》。在4K分辨率下,直接将所有画质选项拉到顶、开启光线追踪,并将光追光照级别设置为"变态"。
可以看到在这样极端的条件下,即便是RTX 4090,在游戏自带的Benchmark中也仅跑出了39.53的平均帧率。虽然最高帧率达到了60以上,可最低帧也不足30,整体画面虽然极致华丽,但也确实不能说很流畅。
因为暂时我们手上的《赛博朋克2077》不是支持DLSS 3的最新版本,所以无法在游戏中开启DLSS 3,只能使用DLSS 2。接下来,我们开启游戏内的DLSS选项,并先后将DLSS级别设置为"自动"和"性能"。可以看到,RTX 4090在这两个DLSS设置下的帧率表现差不多,其最小、平均和最大FPS均提高了50%左右。此时整体画面观感在维持极致光影表现的前提下,流畅度有了非常明显的提升,肉眼可见地拉高了"沉浸感"。而根据官方公布的相关数据显示,在适配DLSS 3后,帧数还能有着350%左右的提升。
接下来,我们选择了看似场景不复杂,但对帧率、微小卡顿极其敏感的《F1 2021》进行高帧率场景的游戏性能测试。同样,既然是要体验"第九艺术",那么全部的画面选项必须先拉满。
首先在不开启DLSS时的情况,只能说不愧是新一代的"卡皇",RTX 4090在没有任何"助力"的前提下,硬生生靠着自身的光栅性能,在4K+全部画面选项最高的《F1 2021》里跑出了113帧的平均帧率,而且没有出现严重的掉帧或卡顿情况。
接下来,开启DLSS、并选择"质量"模式后可以看到,所有的帧率数据都应声涨了近40%。而且更重要的是,在开启DLSS后,最小帧时间和最大帧时间之间的差距明显缩小,说明此时帧率不仅更高,还变得波动更小、更稳定了。
如果将DLSS调整为"性能"模式呢?此时,游戏测得的帧率相比不开启DLSS时,则有了50%以上的提升幅度,帧率稳定性再次显著提升。并且最为关键的是,在4K分辨率+最高级别光影画质设定的加持下,即便是"性能"档位的DLSS,也确实看不到肉眼可见的画质损失,几乎可以说是"白赚"了50%的游戏性能。
除了单机大作,我们也测试了RTX 4090在网游中的表现。当然,普通的网游对于这款"卡皇"是没办法构成太多压力的,所以我们使用了支持DX12和光线追踪的《逆水寒》来尝试"压榨"RTX 4090的潜力。
很遗憾,即便是画质选项全开、连光追也拉满了的《逆水寒》,在目前最强的这款显卡面前,也没有办法造成什么威胁。除了极其偶尔的掉帧外,游戏绝大部分时间都跑满了60帧,无论是人头攒动的场景,还是即时演算的战斗,都没有办法造成哪怕略微显著的降帧现象。
软件渲染:14分17秒
使用RTX 4090进行硬件加速渲染:6分30秒
除游戏性能外,考虑到RTX 4090此次配备了24GB的超大显存,再加上还内置了具备AV1硬编码能力的第八代NVENC编码单元,这也使得我们很好奇它在高清视频剪辑、渲染场景下的生产力性能。为此,我们用一段4K分辨率的高清视频、在关闭/开启RTX 4090硬件加速的情况下,进行了渲染用时对比测试。可以看到,开启RTX 4090的硬件加速后,相同的4K视频渲染速度比不开启硬件加速时,足足快了一倍都不止。
最后,我们也使用大家喜闻乐见的Furmark"甜甜圈",对手头这块影驰 RTX 4090 金属大师 OC进行了4K分辨率下的满载拷机测试。需要说明的是,此次测试过程中我们使用的并非开放式测试架,而是更接近普通用户真实使用环境的一款普通ATX机箱来容纳整套平台,并且机箱仅设置了被动散热,前后都未安装额外的风扇。
但是在这样的"不利条件"下,影驰 RTX 4090 金属大师 OC在长达30分钟的拷机后,软件显示其核心温度仅76℃。然而要知道,RTX 4090的TGP默认好歹也高达450W,比RTX 2080 Ti、RTX 3090都要高得多,所以能够维持在如此低的满载温度下,确实也说明影驰的散热设计做得相当不错。
总结:最强卡皇登基,"画面党"终迎救赎
说实在的,在测试RTX 4090前我们并没有想到,NVIDIA的新款"卡皇"会是一款如此令人惊喜的产品。它不只是从本身的性价比、面向最新游戏的优化方面做足了功课,更重要的是,其整个设计思路,真正体现了显卡行业久违了的、从传统3D光栅性能到光追性能,再到AI性能的一次翻倍级的巨大进步。
对于游戏玩家来说,这意味着无论他们是追求最新最强3A大作的"画面党",还是依然沉浸于老游戏、喜欢打MOD,体验经典感动的的怀旧玩家,这一次都能从RTX4090这里得到100%,甚至是更大幅度的帧率提升。
在这个基础上,作为首批RTX 4090中的一员"得力干将",影驰 RTX 4090 金属大师 OC更是在我们的实测中表现出了极为优异的散热性能,同时还有着"性能党"最爱的扎实用料和无光外观设计。再加上它本身的产品定位注定会带来相当美丽的价格,如果你也与我们一样,只是想要追求极致的画质、享受"第九艺术"的完整魅力,那么它很有可能是现阶段相当值得考虑的极致性能选择。
原文地址:http://www.myzaker.com/article/6346c5538e9f0972cf5543e2