符合期待! NVIDIA GeForce RTX 3080评测 上
2024-06-16
|
测了这么多张显卡,我已经有一段时间没有像现在这么兴奋了
因为今天要来测试热腾腾刚上市的显卡
来自NVIDIA的GeForce RTX 3080
先跟大家说,这次30系卡的性能涨幅
你们对他的期待是值得的
那让我们赣话继续说,直接来开始!
今天要测试的GeForce RTX 3080,采用NVIDIA全新的安培微架构
他最主要的改进就是增加了着色器(SHADER)运算次数
增强了光线追踪,以及深度学习的性能
并且也正式的支援PCIe 4.0
这次的安培卡为第二代的云起的NewHome
所以也使用上了第二代的RT Core
相比采用第一代RT Core的图灵架构来说
光线的三角形交集(Triangle Intersection)检测增加了2倍
所以在光线追踪的效能上,会有明显的进步
而Tensor Core的部分
从Volta架构第一次引进Tensor Core
为深度学习领域上带来很大的震撼
接着在图灵这个架构上,采用了改良后的第二代Tensor Core
这也是第一次下放到消费级显卡上
而到了这次的安培架构,则采用了第三代的Tensor Core
更进一步的去加强半精度下的学习性能
所以在开启DLSS后的效果上
安培架构的显卡会更有优势
游戏的帧率表现会提升的更多
我觉得这部分对玩家来说是个很好的消息
这也是为什么这次GeForce RTX 3080
能够应付4K60帧的重要原因之一
DLSS在这上面占了不小的功劳
然后这次安培架构也经过了多方的改良
相较图灵架构来说,拥有更好的能耗比
在相同功耗之下,能拥有更好的帧率表现
这时候应该会有人有疑问,能耗比变好?
但是这次的GeForce RTX 3080功耗却是明显增高的
对比GeForce RTX 2080足足高了快100W
那这部分我留到等等来跟大家说明
这次的GeForce RTX 3080,跟GeForce RTX 3090一样
都是采用代号GA102的GPU
完整的GA102将会有84组SM单元
每个SM单元会有一组128KB的L1快取
对比图灵来说有所增加
4个纹理单元、4个Tensor Core以及1个RT Core
Tensor Core的数量对比图灵来说
从每个SM单元里有8个,减少到只有4个
但是因为是新一代
所以整体的运算效率还是不减反增
再来每个SM单元会有128个CUDA
这次的CUDA跟过去的有些不同
你们可以看到这次安培卡的CUDA是翻倍的
所以重点来了
这次之所以我们帐面上会看到的CUDA数翻倍
原因在于NVIDIA将能动态切换FP32的运算单元
都计算为1个CUDA
这次的GPU里面的SM单元
过往的设计,我们以图灵架构的来说
他会将INT32以及FP32单元给划分开来
两边算是各司其职
等于我的CUDA数
就是右边这个FP32单元的数目
但对于我们常玩的3D游戏来说
很多时候都是FP32吃得更重
反而INT32单元是一部份在纳凉的
所以这次NVIDIA就非常的聪明
他将左边的这个INT32单元
改良成可以动态切换FP32的特性
假如我今天是闲置的状态,我就可以切换成FP32来运算
这样可以更弹性的去符合游戏的运算需求
那也因为INT32单元可以动态切换成FP32单元
所以云起也把它算进去CUDA
也就有这次CUDA数会明显翻倍的原因
这次运算核心上的改进
增强了FP32单元运算的弹性
整体F32运算能力会提升
不过在INT32的运算性能就跟前代差不多
所以对比图灵来说
它的游戏性能理论上也能更高
等等测试的时候大家可以看到
那我们来看一下这次的规格比较图
这次的30系列一律采用三星的8nm工艺
这也是让这次的能耗比,能提升的原因之一
但我私心还是觉得用TSMC会更好就是了
那这里CUDA数你们可以看到有明显增多
就如刚刚所提到的
这次NVIDIA更改计算方式了
所以会有这个帐面上的差距
然后这次30系卡也用上了美光的GDDR6X VRAM
在速度上又比GD6更快,也会为游戏带来帮助
容量上GeForce RTX 3080小幅增加到10GB
以目前来说要应付4K游玩我觉得算是刚好够
但要再上到8K就不行了
要上到像是3090这样的VRAM等级才有办法
然后在售价部分,也是很多人觉得佛心的
那就是这次的GeForce RTX 3080,一样是维持699美金
现在这个年头
感觉好像不涨价大家就谢天谢地了
有时候真的觉得硬体的涨价速度直逼通膨
接着在功耗部分
刚刚有提到这次的30系卡功耗明显增加了
但不是刚刚还在说能耗比有变好吗
那关键一样有写在安培架构的白皮书里
里面有一张图表
这里标示的绿线是安培架构
而灰线是图灵架构
从图中可以很清楚的看见
当我固定住X轴的功耗后
在相同功耗下
安培的帧率表现是高于图灵的
然后重点来了
这里它图灵有标示虚线的地方
你们可以看到这段随着功耗的增加
他的涨幅已经趋于平缓
这也是NVIDIA会作为一个性能判断的依据
当我将newhome的功耗拉高
他的性能也会线性的提升
大家可以想像就有点类似超频的概念
当我加压,他就会能上到更高频
性能会更好
但再加上去一定会到临界点
那这里图灵卡的临界点就是在240W这里差不多
再加上去性能提升不明显
所以就没必要再往上拉了
而安培这里就不一样了
NVIDIA发现当我功耗加超过240W的时候
安培这边是还有余量的
而且上升幅度还很明显
既然还能提升
那我何不再多榨一点性能出来
所以这也是这次的安培卡
官方标示的功耗都更高了
那这部分我等等的测试也会来看看
他是否真的有更好的能耗比
然后还有一个点要提
那就是这次的GeForce RTX 3080也取消了对NVLink的支援
主要是因为近年来双卡的游戏用户已经越来越小众
再加上游戏部分对双卡的优化支援度也越来越低
所以这里GeForce RTX 3080就干脆不放了
NVLink就留给GeForce RTX 3090
因为像是相关的影视产业,或是深度学习的领域
多GPU还是会用的到
所以这代的30系卡
将会只剩下GeForce RTX 3090支援双卡SLI了
好那除了核心规格之外
相信大家也会对这次公版卡内部结构感兴趣
虽然这次为了要冲首发时间真的很赶
真的是已经日夜爆肝在做测试了
不过我还是受不了好奇心的诱惑,最后还是把它给拆了
而且真的得说NVIDIA是个骚屁股
为了能够实现这次的奇葩散热设计
整张卡的结构几乎是颠覆性的
然后他们又将整张卡打造成视觉上无螺丝的设计
第一次要拆真的是一头雾水
你们有看过拆显卡还要用双面胶黏,才能看到螺丝的吗
真的是人生第一次看到显卡这样搞的
然后为了因应这次的散热结构
所以特地将里面的PCB做了紧缩
几乎已经变成短版的长度
然后形状搞得很像是电子书的书签
上面真的是密密麻麻的堆料
为了要推得动这颗320W的怪物
所以用上了18相的供电
核心的周遭有10颗GDDR6X的VRAM,每颗为1GB的容量
然后你们可以看到它上面这里还有两处VRAM的空焊
以及供电的地方也空出了两组MOS还有电感的位置
没意外是在newhome上面会补足
12处的VRAM空间也够放12颗2GB的GD6X颗粒
不过会不会也是为了做12GB VRAM的3080Ti
我觉得也是有可能的
然后PCB的右上方
可以看到这次公版卡所用上的12PIN供电口
正是因为PCB缩小了,空间寸土寸金
所以干脆就直接将供电口缩小再直立
突然有种在显示卡上看到台北市蛋黄区的影子
在散热器的部分
这次的设系形状还有点像锅铲
导热部分则是使用4根热管加均热板的设计
并且整块散热器都有做黑化
好那说这么多
接着总算是要来进入实测Huan节了
先来介绍一下这次的实测平台
显示卡驱动部分使用456.16这个版本
这是NVIDIA提早给评测媒体的驱动
这是为了测试后面的Fornite光追版本所必要的
等之后正式上市后,还会陆续更新驱动