NVIDIA在4月12日发布了面向中高端用户的GeForce RTX 4070 GPU,其搭载了AD104核心以及12GB GDDR6X显存,售价方面也更为接地气。面对这款中流砥柱之作,AIC厂商也自然各显神通推出了花样繁多的非公版显卡,比如索泰就推出了RTX 4070-12GB天启OC、RTX 4070-12GB X-GAMING OC欧泊白以及RTX 4070-12GB X-GAMING三款产品。在这之中,索泰GEFORCE RTX 4070-12GB天启OC也是提前抵达了《微型计算机》评测室,那么它的表现到底如何,用料、规格方面是否同样遵循天启系列的高标准呢?
索泰GEFORCE RTX 4070-12GB天启OC产品参数
核心架构:Ada Lovelace
核心代号:AD104
制程工艺:TSMC 4N定制
SM单元:46
展开全文
CUDA核心数(流处理器):5888
光追核心数(RT Cores):46
AI核心数(Tensor Cores):184
核心频率:1920MHz~2580MHz
显存容量:12GB GDDR6X
显存速率:21Gbps
显存位宽:192bit
显存带宽:504GB/s
支持DLSS版本:DLSS 3
TGP:215W
建议搭配电源额定功率:700W
产品尺寸:334mm×131mm×64mm
首发参考价格:5399元
Ada Lovelace与其新特性、新功能
在开启索泰GEFORCE RTX 4070-12GB天启OC评测之前,如果有读者朋友们对Ada Lovelace架构以及它的新特性、新功能不太清楚或是认知不是特别深刻,可以参考一下这部分的内容,这些特别剔出来的知识点同样也是RTX 4070与上代产品的不同之处。当然,如果读者朋友们早已了解了RTX 40系显卡以及Ada Lovelace的特点,也可自行跳过这一部分,直接开始索泰GEFORCE RTX 4070-12GB天启OC的评测内容。
Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。
更强的SM
AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。
第三代光追核心
第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。
Shader Execution Reordering着色器执行重排序
着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
DLSS 3与OFA光流加速器
基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:帧生成技术、超分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。
新一代NVIDIA编码器(NVENC)
RTX 40系高端GPU实现了双第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。不过对RTX 4070来说,搭配的则是单个的第八代NVENC编码器和第五代NVDEC解码器。
更强的Studio性能
除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。
同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。
●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 2倍。
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。
●Modder可以重制经典游戏,并通过RTX Remix开启RTX。
可以带翅膀的显卡,它独一份
和设计细腻、优雅的AMP系列不同,索泰GEFORCE RTX 4070-12GB天启OC的整体风格更显硬派,它的正面穿上了厚实且棱角多样的装甲,并且装甲之上多有夸张的折线,拥有分明的视觉层次,黑、银色相辅相成的装点也为其带来了不错的质感,将科幻气息展露无遗。而在正面的三个散热风扇中间,“天启”系列Logo跃然之上,也表明了该显卡的从属与定位。将视野移动到显卡的顶部,我们可以看到它中置了一块面积不小背光Logo,加上正面的“启世之环”,足以为玩家带来非常抢眼的ARGB背光效果。
▲索泰GEFORCE RTX 4070-12GB天启OC正面设计了独特的“启世之环”,它在装机点亮之后将呈现出非常炫酷的ARGB灯效,并支持1600万色和数十种灯效循环模式。
▲索泰GEFORCE RTX 4070-12GB天启OC的顶部Logo处同样支持ARGB幻彩灯效,能够进一步提升产品颜值。
▲索泰GEFORCE RTX 4070-12GB天启OC的输出面板上设有3个DP 1.4a接口和1个HDMI 2.1接口
▲这款显卡采用支持PCIe 5.0规范的ATX 3.0标准16Pin供电接口
将索泰GEFORCE RTX 4070-12GB天启OC翻过身来,我们可以看到它的背面配备了一块印刻了大面积纹路的高强度一体铸型金属背板——花纹主要绘制了对称展翅的天使战甲造型,并且在一旁预留了两个孔洞,旨在为“天启之翼”背板风扇服务。当然,如果玩家想要得到真正的完全体索泰GEFORCE RTX 4070-12GB天启OC,还需要额外购入“天启之翼”背板风扇填入其中。除了装饰效果非常吸引眼球之外,索泰GEFORCE RTX 4070-12GB天启OC的一体铸型金属背板还能够有效保护PCB,防止显卡在移动、安装、使用中,PCB出现弯折的情况。而且它的尾部还采用镂空设计,搭配两个背板风扇之后能更快速地导出GPU和供电电路部分的废热。
▲索泰GEFORCE RTX 4070-12GB天启OC的一体式金属背板印上涂装了羽翼纹理,并预留了两个孔洞用以填装“天启之翼”。有需要的玩家可以额外购入两个可拆卸的“天启之翼”来使得索泰GEFORCE RTX 4070-12GB天启OC成为完全体。
在接通电源之后,索泰GEFORCE RTX 4070-12GB天启OC顶部的Logo、正中风扇处的“启世之环”以及后背处的“天启之翼”能够亮起绚丽的全景背光——由于这些部件采用半透明导光材质打造,因此在白天时分也能带来高亮度的背光效果,并且它们支持1600万色和数十种灯效循环模式,能满足玩家自由调节灯效色彩、灯光模式的需要,带来更具个性化的光效调校,为显卡颜值再加一分。
高规格用料,提升性能上限
作为面向中高端玩家打造的显卡,索泰GEFORCE RTX 4070-12GB天启OC除了在外观设计上挖空心思之外,其散热与内部用料同样值得肯定。散热方面,这款显卡的正面选用了了三个尺寸为90mm的“盾鳞风扇”——该风扇拥有11张采用独特的设计扇叶,上面的条形纹路搭配正反转设计,能够带来更大风压和更多的进风量。同时,三个散热风扇均支持智能启停功能,从而能够在低负载的情况下尽可能地降低风扇噪音对玩家的影响。
▲显卡正面采用三个尺寸为90mm的“盾鳞风扇”,它的11张散热片表面拥有特殊设计,能够带来更大的风压。
而在散热器内部,索泰GEFORCE RTX 4070-12GB天启OC搭配了5根镀镍的“冰脉复合热管”,搭配加厚加高的镀镍鳍片以及镜面抛光的铜底,能够与显卡PCB进行更好地贴合,并且显存和供电电路部分也均配备高导热系数的导热帖进行辅助散热,因此能够更好地控制各个性能内部元件产生的废热。
▲散热器内部拥有5根冰脉2.0导热管搭配直触式冰镜铜底,能够加速显卡内部热量逸散,并且显存和供电电路部分均采用导热贴片进行降温处理。
▲索泰GEFORCE RTX 4070-12GB天启OC采用非公版PCB,并且预留了充足的空间,且拥有12+2相高规供电。
▲索泰GEFORCE RTX 4070-12GB天启OC搭载了拥有5888个CUDA核心的AD104-250-A1核心。
▲AD104-250-A1核心周围围绕着6颗美光2GB GDDR6X显存,总显存容量为12GB。
在PCB方面,索泰GEFORCE RTX 4070-12GB天启OC采用了超公版的用料与设计,比如它采用了松散的PCB布局,使得元件与元件之间预留了冗余的空间,避免热量堆积。同时,PCB上的顶级DRMOS能够为显卡带来更稳定高效的供电保障,让显卡释放全部潜能,12+2相高规供电,并搭载多种精选定制电子元器件,从而增强其负载能力,保证显卡内部的供电稳定性,因此能让索泰GEFORCE RTX 4070-12GB天启OC最高上拉250W TGP,具备更高的性能上限。当然正是基于以上设计,索泰也对这款显卡进行了预超频处理,使得其Boost频率达到了2580MHz,能够拥有出色的性能表现。同时,它在显存方面与RTX 4070 Ti保持了一致,搭载了6颗来自美光的2GB GDDR6X显存,其总显存容量达到12GB。
RTX 4070 GPU一共搭配了4个GPC,不过其中一个GPC砍掉了1个TPC,也就是减少了2组SM单元,所以RTX 4070一共拥有23个TPC,46组SM单元。RTX 4070就拥有46个光追核心(RT Core)、240个AI核心(Tensor Core)以及5888个CUDA核心。在核心规格配置上,相比RTX 4070 Ti精简了大约四分之一,也就是25%。不过在显存方面仍然保持了RTX 4070 Ti的12GB GDDR6X配置,显存位宽仍然为192bit,总带宽为504GB/s,与RTX 4070 Ti保持一致。
▲从索泰GEFORCE RTX 4070-12GB天启OC的GPU-Z截图我们可以看到,其核心基于TSMC 4N工艺且Boost频率达到2580MHz,相比公版指导频率有小幅提升。
测试平台
GPU:索泰GEFORCE RTX 4070-12GB天启OC、RTX 3070 FE、RTX 3070 Ti FE、RTX 2070 SUPER FE、七彩虹战斧RTX 4070 Ti(部分测试)
CPU:英特尔酷睿i9-13900K
主板:英特尔Z790
内存:芝奇皇家战戟DDR5 6000 32GB
电源:鑫谷昆仑冰山1250W(ATX 3.0)
显示器:戴尔UP3218K(7680×4320@60Hz)
操作系统:Windows 11 Pro 22H2
显卡驱动:NVIDIA Game Ready Driver 532.41
GPU基准性能测试
在这部分测试中,索泰GEFORCE RTX 4070-12GB天启OC将RTX 3070 TI轻松“斩下马来”,整体来看索泰GEFORCE RTX 4070-12GB天启OC领先22%。事实上,采用新架构,拥有第三代光线追踪模块的索泰GEFORCE RTX 4070-12GB天启OC确实在这些测试中面对上代产品有着更大的优势。相比同系列的RTX 4070 Ti,索泰GEFORCE RTX 4070-12GB落后约20%,符合我们的整体预期。那么具体到实际测试中是否仍旧存在这种情况?
传统光追游戏性能测试
在传统光追游戏性能测试环节,索泰GEFORCE RTX 4070-12GB天启OC的风头正盛,完全压倒了RTX 3070与RTX 3070 Ti。在对显卡性能要求较高的1440p分辨率下,分别领先35%与24%。特别是在某些对显卡性能要求更为严苛的游戏大作中,基于Ada Lovelace的索泰GEFORCE RTX 4070-12GB天启OC优势更大。不过在面对同架构的RTX 4070 Ti时,索泰GEFORCE RTX 4070-12GB天启OC综合游戏帧率落后30%左右。
在对显卡性能要求负载更低的1080p分辨率下,索泰GEFORCE RTX 4070-12GB天启OC在应对RTX 3070、RTX 3070 Ti的挑战时,依然得到了34%、23%以上的性能领先。
接下来看看RTX 40系的核心技术DLSS 3测试的相关情况。
DLSS 2/3对比性能测试
Ada Lovelace架构带来的性能优势使得索泰GEFORCE RTX 4070-12GB天启OC可以轻松应对时下3A大作的性能需要,而再搭配拥有帧生成技术的DLSS 3之后,游戏实测的帧率还会得到进一步提升,并且还不会影响整体画质,这也意味着索泰GEFORCE RTX 4070-12GB天启OC具备“越级打怪”的能力。
具体到实际游戏测试项目中时,两代DLSS技术带来的帧率差异也有着非常明显的差距。在同等级设置的DLSS模式下,1440p游戏环境下DLSS 3的实际帧率表现相较于原生帧率平均提升在150%左右,而DLSS 2的实际帧率表现相较于原生帧率平均提升约为73%左右。以《赛博朋克2077》为例,在开启DLSS 3的情况下,索泰GEFORCE RTX 4070-12GB天启OC分别在1080p分辨率、1440p分辨率下分别得到了190fps、124fps,而在开启DLSS 2的情况下仅有117fps、82fps,DLSS 3确实能够在DLSS 2的基础之上再次大幅度提升游戏帧率。
在将对比对象替换为RTX 3070 Ti之后,由于上代产品仅支持DLSS 2,所以在帧率方面,开启DLSS 2的RTX 3070 Ti与索泰GEFORCE RTX 4070-12GB天启OC的差距更为悬殊,后者的平均游戏性能领先达到了70%以上。
PCL及1% fps测试
由于集成了NVIDIA Reflex功能,在开启DLSS 3的情况下,玩家还能够享受到系统延迟更低的游戏时刻。那么在开启DLSS 3之后,索泰GEFORCE RTX 4070-12GB天启OC对降低延迟以及提升1% fps到底有何等帮助,从我们通过Frameview抓取的实际测试数据就能看出结果。在今年的现象级游戏《霍格沃茨之遗》中,开启DLSS 3之后,1440p分辨率下系统延迟从107ms降低至44ms,1%L fps从30提升至82;将画面分辨率降低到1080p之后,在开启DLSS 3的情况下,系统延迟从71ms降低至34ms,1%L fps从42提升至97。除了这款游戏之外,我们本次所有的参测游戏均有这样的趋势,可以预见的是,随着未来越来越多的游戏大作在加入DLSS 3功能之后,拥有RTX 40系显卡的玩家,可以享受到更流畅、更顺滑的游戏福利,这是RTX 30、20系等老旧产品不具备的优势。
Studio创作性能测试
RTX 40系显卡对Studio、Racer RTX以及RTX REMIX进行了相关升级,进一步提升了生产力,索泰GEFORCE RTX 4070-12GB天启OC同样具备这样的特点,因此它在应对RTX 3070 Ti、RTX 3070的挑战时,也是很轻松地战胜了曾经“卖座”的前辈们。从我们的实际测试来看,无论是面向模型渲染,还是针对图像处理、视频转码,索泰GEFORCE RTX 4070-12GB天启OC都有着更明显的优势。比如在Blender Opendata的Monster、Junkshop、classroom三项测试中,索泰RTX 4070Ti-12GB天启OC分别得到了3118 1567 1593分,而RTX 3070分别得到了1787、1107、963分,RTX 3070 Ti分别得到了1953、1202、1003分。在Blender 3.5、davinci resolve 18、ON1 Resize AI 2022中,索泰GEFORCE RTX 4070-12GB天启OC的耗时也是最少。从整体测试成绩来看,索泰GEFORCE RTX 4070-12GB天启OC相比RTX 3070 Ti在3D渲染性能上领先40%左右,领先RTX 3070则达到了55%左右。在视频转码性能上也有25%左右的领先幅度。
Stable Diffusion AI图片生成计算
如果拥有高性能显卡,你除了玩玩新游戏大作、完成工作需要之外还想做什么?如果想不到,那么不妨尝试一下AI图像生成计算,那种填写关键词之后就能“开盲盒”的方式完全让人欲罢不能,就像是踏入了一个新世界一样。当然,AI绘画的原理自然也不是单纯地对多个图片的数据进行拼接,它的过程主要是通过对训练数据的学习,让AI能够理解和提取图像的基本特征、结构和样式,从而再组成新的图片,所以它非常考究显卡性能。为此,我们选择了Stable-Diffusion,通过输出特定的关键词,生成相关图像,从而测试一下索泰GEFORCE RTX 4070-12GB天启OC在这方面的实力。
当然,索泰GEFORCE RTX 4070-12GB天启OC也确实没有让我们失望,更高的渲染效率以及出片效率成功超越了RTX 3070与RTX 3070 Ti,领先幅度约为30%以上。如果你有购入RTX 4070的需要,完全可以尝试通过索泰GEFORCE RTX 4070-12GB天启OC生成这些乐趣无穷的图片。
RTX VSR帮忙,抓住更多视频细节
在游戏、创作之余,大家常常选择在各大视频平台,观看一些有趣的鬼畜视频或者电影大片,取材或是放松,而NVIDIA也是为了切合用户的需要,在新驱动里添加了RTX Video Super Resolution功能(简称RTX VSR)。需要说明的是,该功能目前仅允许RTX 30系以上的GPU开启,且还要搭配支持RTX VSR功能的浏览器或播放器(目前支持VSR技术的浏览器主要是最新版的Chrome和Edge)。而从我们专门抓取的视频来看,RTX VSR确实能够减少视频纹理损失、锐化边缘和丰富细节,从而提升画面清晰度。也就是说,拥有索泰GEFORCE RTX 4070-12GB天启OC的用户,完全可以在更新新驱动之后,在NIVIDA控制面板开启该功能,体验更清晰的在线视频。
在使用RTX VSR功能之前,用户需要打开NIVIDA控制面板,选择调整视频图像设置,并在其中勾选RTX视频增强选项下的“超分辨率”(框选的内容),就能在支持VSR功能的浏览器中开启RTX 视频增强。
通过使用RTX VSR功能,在线视频在播放时能够更好地凸显画面细节,比如截图处的框选位置,字样轮廓明显更清晰一些。右图为Chrome浏览器播放VSR增强,左图为FireFox浏览器播放原生视频。
散热、超频测试
最后我们测试了索泰GEFORCE RTX 4070-12GB天启OC几个重要指标——功耗、散热与超频性能。在《赛博朋克2077》《原子之心》《生死轮回》(1440p分辨率、最高画质、RTX ON)这三个典型的光追游戏中,索泰GEFORCE RTX 4070-12GB天启OC的能耗比表现非常出色,功耗上不仅低于RTX 3070 Ti和RTX 3070,并且性能反而表现更好,而且其功耗相比TGP略低。事实上,除了Furmark满载烤机的情况之外,其余应用中索泰GEFORCE RTX 4070-12GB天启OC在提供超高性能的同时,功耗表现都远低于215W TGP的设定,实际测试其平均游戏功耗约为185W左右。而RTX 3070在多数应用下的功耗都达到了215W~230W,RTX 3070 Ti更是在部分测试中超出了300W的功耗,加上性能强弱对比,索泰GEFORCE RTX 4070-12GB天启OC的高能耗比自然呼之欲出。
▲我们最终将索泰GEFORCE RTX 4070-12GB天启OC的Boost频率稳定至2780MHz
▲在超频状态下,索泰GEFORCE RTX 4070-12GB天启OC经过了3DMark Time spy Extreme测试,且得到了8973显卡分数。
散热方面,在室温25℃的情况下,经过半小时的Furmark严苛测试之后,索泰GEFORCE RTX 4070-12GB天启OC的核心温度保持63℃,散热效果还算是控制得不错,这款显卡的冰脉复合热管以及镜面抛光直触铜底在其中功不可没,毕竟按照索泰的官方资料来看,它的最大功耗可是能Boost到250W。
我们还对索泰GEFORCE RTX 4070-12GB天启OC进行了手动超频,用以探究它的更高潜力。在经过多次调校之后,这款显卡的核心bosst频率最终稳定到了2780MHz,较超频前高出200MHz。同时,在这一设置下,它通过了3DMark Time spy Extreme及其他稳定性测试,且得到了8973的显卡得分,较超频性能又有小幅上升。在电源配备方面,有鉴于超频版产品带来的额外功耗,我们建议大家在使用这款显卡时最好为其配备一台额定功率为700W的高品质电源。
小结
从全部的测试数据分析可以看出,新一代RTX 4070在性能表现上还是比较不错的。索泰GEFORCE RTX 4070-12GB天启OC在传统游戏性能上相比前一代的RTX 3070 Ti和RTX 3070领先达到了22%和30%左右,而在开启DLSS 3之后,索泰GEFORCE RTX 4070-12GB天启OC相对RTX 3070 Ti在性能上更是领先达到了70%~75%。
其次想要提醒玩家们关注的是能耗比问题,这往往容易被大多数人所忽视。从测试结果来看,索泰GEFORCE RTX 4070-12GB天启OC在不到200W的平均应用功耗下爆发出的性能却比250W左右平均应用功耗的RTX 3070 Ti性能更好,这也很好地印证了RTX 40系GPU能耗比超高的特点。在面对前一代产品时,索泰GEFORCE RTX 4070-12GB天启OC的能耗比数据完全呈现出了碾压的姿态。
当然,也许会有玩家吐槽RTX 4070的性能距离RTX 4070 Ti实在“有些远”。这是硬件规格直接导致的纸面实力差距,应该也是NVIDIA为了拉来Ti系列与非Ti系列性能与价差差距匹配而做出的调整,所以其实也不用太纠结这问题了。
从产品本身来看,扎实的做工以及超规格的用料让索泰GEFORCE RTX 4070-12GB天启OC在实际测试中的表现颇为抢眼,哪怕是在最高画质和极致光追的设置下,它都能在1440p轻松应付当前绝大多数3A大作,大多数游戏中开启DLSS之后都达到了100fps+光追全特效游戏的效果,算是符合NVIDIA对RTX 4070 GPU的预期。另外DLSS 3无疑也是它的最大加分项,开启之后在保证画面细节的同时,能够让游戏帧率更高,操控延迟更低,游戏体验更优异。而在面向Studio创作应用方面的需要方面,它也能游刃有余地处理它们的需要,模型渲染、图片生成、视频转码,它都表现出远超RTX 3070 Ti以及RTX 3070的素质。同时,优异的超频以及散热能力扩宽了它的性能上限,保证了它在使用中的稳定性。在外观设计方面,承袭了天启一贯特点的它具备硬派且设计感出色的外观,将其放置在“海景房”机箱中,会是无比吸引眼球的存在。有鉴于此,我们认为索泰GEFORCE RTX 4070-12GB天启OC是当前非公版RTX 4070产品中一款非常均衡的产品,兼具设计感、性能的它,很适合多数装机预算在万元左右的玩家选择。
特别声明
本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。