矿难来袭、玩家盘算何时下山之际,老黄带着他的40 系显卡来了!

首发三款高端型号,RTX4090 24GB、RTX4080 16GB 和 12GB 显存两版。
话不多说,直接上规格:

三款游戏帧数测试,在 4K 分辨率、全高设置、开启光追与 DLSS 情况下,4090 提高到上代旗舰 3090Ti 的2-4 倍,4080 与 3080Ti 对比也提高到原来的2-3 倍。


来看一组实机画面对比,来自《微软模拟飞行》。

另外英伟达还与波兰蠢驴合作,给《赛博朋克 2077》开发了 " 全极致光线追踪模式 ",软硬协作榨干所有性能,帧数直接 x4。

要达成这些效果,靠的是全新 GPU 在制程工艺、硬件架构、软件算法上的一系列改进。
台积电工艺、DLSS3 放大招
全新架构Ada Lovelace,切换到台积电 4N 定制工艺(5nm),专为生产 GPU 优化的那种,而 Ampere 时代用的还是三星 8nm。
新工艺加持下,RTX4090 塞进了 760 亿个晶体管、1.8 万个 CUDA 核心,比上一代增加 70%。
同时与上一代架构 Ampere 对比,能效比也有较大提升。

一个重头戏是DLSS3,这一次 AI 能力不仅用于超分辨率,还会用于插帧。
老黄说,以后你看到的游戏画面中大部分像素都不是直接渲染出来的,而是 AI 预测的。

接下来,英伟达把新架构下的 SM 多单元流处理器、负责 AI 计算的 Tensor Core 与负责光追的 RT Core 都升级至新一代。

SM 多单元流处理器方面,最大的更新是 "Shader 执行重排列 " 技术(Shader Execution Reordering)。
老黄讲到,光追吃性能的主要原因是 GPU 内部高度并行化、擅长做大量重复性高的工作。而光追场合下光线不断反射与全场景内不同材质交互并不能发挥 GPU 优势。
这项技术负责动态调度工作负载、合理安排计算资源,能给光追带来 2-3 倍性能提升,光追之外的综合游戏性能也提升 25% 左右。
这是与 CPU 乱序执行同等重要的计算革新。

张量核心 Tensor Core,用了数据中心 GPU H100 的同款,新增 FP8 精度数据格式支持,吞吐量增加 5 倍。
光线追踪核心 RT Core方面, ray-triangle 交叉吞吐量提高两倍以上,还新增了 Opacity Micromap 引擎专攻树叶、粒子和栅栏这种光线通过缝隙的场景。

总的看下来,新显卡架构主要性能提升都是围绕光追,还有那么多不支持光追的老游戏怎么办?
为解决这个问题,英伟达推出游戏 MOD 开发工具RTX Remix。
一边玩游戏一边打开它,就能直接从 GPU 渲染指令里拦截游戏的图形资产,包括几何建模、材质、灯光、摄像机位置等。

在 AI 辅助下给这些资产增加细节、超分辨率、增加物理性质、添加光追和 DLSS 支持都不在话下。
还能一键打包成 MOD 发布,让老游戏也能焕发第二春,比如让 20 年前的《上古卷轴 · 晨风》画质超过最新的《上古卷轴 · 天际》。

英伟达官方为经典解谜游戏《传送门》制作了光追 MOD,将以免费 DLC 的形式稍后发布。

全在讨好玩家,除了价格
相较于 RTX30 系列,40 系列显卡的性能增强够有诚意了,那么价格如何呢?
直接来看黄老板给出的价格:
RTX 4090 定价 1599 美元
RTX 4080(16GB)定价 1199 美元
RTX 4080(12GB)定价 899 美元。
在国内,目前给出的售价是:
RTX 4090 12999 元起
RTX 4080(16GB)9499 元
RTX 4080(12GB)7199 元。
为了方便比较,也顺便把之前国内 RTX30 系列的官方售价摆上来:
RTX 3090 11999 元
RTX 3080 5499 元
RTX 3070 3799 元
从给出的定价来看,90 系列的变化幅度并不是很大,国内售价在原来的基础上涨了一点,算得上是 " 高性价比 "(但这价格依旧是普通网友可望不可及)。
对比之下,80 系列新出的两款显卡涨价就比较明显,RTX 4080(16GB)相较于 3080 涨价近 50%,被外界认为是对标 RTX 3070 的 RTX 4080(12GB)也涨了近 50%。
网友直呼:这根本没想让我们买 40 啊。

(看来黄老板饱受矿难其害,不知道手里还有多少 30 系显卡)
不过游戏发烧友们也可以再等等。
在得知英伟达要发布 40 系列显卡后,AMD 也坐不住了,后脚就透露消息称:11 月 3 日会发布 RX 7000 系列显卡。
并且还放出了一张性能对比图,称其性价比高,能效好。

值得一提的是,虽然这次 RTX40 系列相较于 30 系列性能翻倍,但功耗方面却没有很大的涨幅。
RTX 4090 功耗正如之前传言一样为 450W 与 3090Ti 持平,RTX 4080(16GB)为 340W,RTX 4080(12GB)为 285W.
对于 RTX4090,英伟达建议使用 850W 的电源,12GB 的 RTX 4080 需要 700W 的电源,16GB 需要 750W 的电源。
不仅如此,英伟达此次还升级了散热系统,进一步优化了双轴流通系统,将风扇尺寸和翅片体积增加了 10% ,并升级为 23 相电源。

(这尺寸倒是越来越大了)
甚至有网友调侃称:

除此之外,大家的 AI 导师李沐也第一时间给出了自己的看法。
4090 相比 3090Ti,AI 训练来说重要的参数都没增强,增强多卡并行的 NVlink 还给砍了,不如再等等 4090Ti。

这次的 40 系新卡,你冲吗?
原文地址:http://www.myzaker.com/article/632aacd08e9f09056a3fd65b