當前位置:主頁 > 電腦 > 臺式機 >

RTX 3080跨時空PK十年旗艦:完虐2080 Ti 性能是GTX 480的16倍!

時間:2020-10-19 | 欄目:臺式機 | 點擊:

看過我們之前十年旗艦N卡橫評(點擊這里可以跳轉)的朋友,可能都會感慨半導體行業的神速發展,從GTX 480到RTX 2080 Ti,性能提升到了1298%!

也有朋友吐槽RTX 20對比GTX 10提升不大,但是,在老黃發布RTX 30后,那價格,那性能,真香!

NVIDIA GeForce RTX 3080

同時這也引發了圈內一大波的連鎖效應,RTX 2080 Ti二手價格一夜腰斬,相關的段子和弔圖也鋪得滿天都是,不過關于RTX 3080的評測相信大家已經看過不少,今天我們就帶來更為直觀的RTX 3080評測視頻。

視頻不僅有3080的全面測試,還有對比十年前GTX480等特別的項目,大家耐心看就知道啦。

當然了假如你不喜歡看視頻,或者流量捉雞,我們也有文字版本~

NVIDIAAmpere架構解析-CUDA流處理器翻倍提升的秘密

有的朋友可能想到了,那么晶體管翻倍是不是就是流處理器翻倍的原因呢?你答對了一點點,晶體管暴增讓GA102核心擁有84組SM計算單元,比上一代的TU102多了12組,但我們這次評測的3080和2080 Ti SM單元一樣僅有72組,但CUDA核心數目還是翻倍了

根本原因是這次老黃改變了N卡流處理器的運算模式。

想搞清楚這點我們首先要知道顯卡運算一般分為整數運算(Integer)和浮點運算(floatingpoint)兩種,而浮點運算可以分為半精度(FP16)、單精度(FP32)、雙精度(FP64),整數運算也可以這樣劃分。

與游戲最密切相關的就是FP32運算,其次是INT32,從費米架構以來NV就把顯卡專門做FP32的運算單元叫做CUDA核心,因此以往我們可以根據CUDA核心的數量來比較N卡性能,但是做其他運算的流處理器數量NV并沒有統計

那么總流處理器數怎么算的呢?

以2080 Ti TU102核心圖為例,完整的TU102有6組GPC圖形簇,每組GPC有12組SM單元。

再放大一點這里我們能看到每組SM又能劃分為四個小組,每個小方格代表一個運算單元,因此一個模塊有16個進行FP32運算的cuda單元,和16個進行INT32運算的單元,還有個Tensor Croes,一個SM總共64個CUDA運算單元和64個INT32運算單元,4個tensorCores和1個RTCores,這是圖靈架構的細節,所以TU102總共有64*12*6共4608個cuda核心和4608個INT32運算單元。

到了NVIDIAAmpere架構,大家能發現這里原本的16個INT32單元也能進行FP32運算,右邊的FP32單元保持不變,所以這樣一個小分區里一個運算周期內顯卡可以選擇做16個FP32運算+16個INT32運算或者做16FP32+16FP32共32個FP32運算。

因此按照N卡能做FP32運算的單元就是CUDA核心的算法,這里一個SM單元的CUDA流處理器數目就翻倍到128個了。

這樣做能讓顯卡在單純跑FP32浮點運算時性能翻倍,但是顯卡在游戲中是不可能只做浮點運算的,這也是為什么3080對比2080 Ti CUDA數目翻倍,但游戲性能并不會翻倍的原因。

除了CUDA核心數目提升,顯存帶寬提升也是RTX30性能暴漲的一大原因,3080和3090采用了鎂光新一代的GDDR6X顯存,新顯存加入PAM4信令機制,讓每周期傳輸的數據量翻倍,大家可以理解為SLC到MLC那樣的升級。

新的顯存其速率達到了19Gbps和19.5Gbps,根據顯存帶寬等于顯存速率 x 位寬除以8,3080的顯存帶寬達到了760GB/s,3090更是達到了驚人的936GB/s,對比2080 Ti提升了24%和52%。

其他方面呢,比如PCIE4.0與RTXIO、HDMI2.1這些就不詳細介紹了。

但是這次公版設計,還是獲得我們的一致好評, 不得不佩服NVIDIA的工業設計能力,看到官方渲染圖的時候,我們都嘖嘖稱奇,有人說沒必要,也有人說這是藝術品。

直到我們看到它滿載78℃與裸機48分貝噪音的測試結果的時候,整個猛男團隊都跪服了,這個異形PCB實在是太有必要了。也只有這樣的設計,才能用上這種雙軸流通式散熱器。

第二部分,為什么這次它叫RTX 3090,而不是RTX3080 Ti?

這部分單純是我們的猜測,如有雷同實屬巧合,以后發現猜錯了再回來打我們臉吧

猜測1:雖然AMD遲遲沒有出招,皮衣刀客老黃的實力可不是蓋的,這次算了算差不多是AMD再怎么蓄力都觸碰不了的高度,出了張新卡,直接給它命名90吧,既能給AMD一個震懾作用,又能把價格定得更高,畢竟是90嘛,怎么也得比80Ti賣貴一些呀,好了,大家乖乖掏錢。

猜測2:在頂級位置安排一個高定價的RTX3090,能顯得RTX3080性價比很高,畢竟看規格有80%的性能,可價格還不到一半,是不是很香?預計第一批貨會秒沒。

猜測3:在RTX3090和3080之間還有很多刀的空間,比如RTX3080可以加點流處理器,加點顯存,做成RTX3080Ti或者3080S作為后手招呼AMD10月28日要發的大Navi,畢竟這5499和11999之間還有6000多塊錢的差價。

而且從老黃在發布會上的說法來看,RTX3090很可能就是用來取代在此之前TITAN定位的產品的,這對于需要巨大算力的專業機構來說,簡直是天賜的福利。

對了,就算是RTX3090也不是完整版,參照我們前面的算法,完整版GA102是有10752個流處理器的,老黃只開了10496個。

反正無論如何,老黃還留了個超級后手,…真不愧是皮衣刀客,刀法如此精妙,猛男團佩服佩服。

第三部分,十年顯卡性能增長多少?

3090還沒解禁,目前3080也算是這十年來NVIDIA游戲顯卡市場中最強的單芯卡了,立馬實測一波

測試平臺和項目與上期一致,大家看表格就好。

評測平臺操作系統Windows 10 1909 Pro Workstations 18363.720CPUi7-10700K主板華碩ROG M12E內存影馳HOF EXTREME 設置在3600MHz8GB X 2SSD三星 970 Evo Plus 1TB電源昆侖KL-1080W電源水冷散熱器超頻三凌鏡GI-CX360水冷散熱器

理論性能測試方面RTX3080平均四項對比2080Ti提升了28%,對比2080提升了65%。

在游戲方面,麻煩又來了,因為3080性能實在太強,即使我們開了全高畫質,很多游戲比如吃雞在1080P下CPU還是出現瓶頸了,3080對比2080Ti的提升只有幾幀。

很多小機靈鬼在上期視頻曾經質疑我們,怎么不用10900K呢?其實看過我們十代酷睿評測這期的網友就知道和10700K差不多性能的9900K游戲對比10900K也就弱了7%,不能根本性解決問題該瓶頸還是瓶頸。

這也側面說明了,目前CPU的游戲性能增長已經趕不上GPU游戲性能的增長了,大家手動艾特牙膏廠進來挨打!

最后剔除掉有問題的數據,最終3080對比2080 Ti提升22%,對比480提升到了1584%,整機平臺功耗上漲了133W。

但是顯然用這種測試方法來給RTX 3080對比RTX 2080 Ti的提升下結論,是不夠全面的,主要有三個槽點。

RTX30系顯卡是支持PCIe 4.0的顯卡,你這里用PCIe 3.0的平臺會不會限制顯卡性能發揮?

剛剛也說了1080P下很多游戲中CPU已經成為瓶頸,而且買這個性能顯卡的玩家大部分也不會在1080P下玩游戲了,對比2K游戲和4K游戲性能會更為靠譜。

第三,我們這里為了讓10年前的顯卡都能和3080在同一條賽道上比賽,用的都是老游戲,但是DX12新游戲,特別是包含光線追蹤和DLSS支持的新游戲才是兩者差距所在,才能體現30系第二代RT Cores和TensorCores的威力。所以我們再來個加時賽,專門讓3080、2080Ti、2080SUPER和2080和進行PK。 

第四部分:PCIe4.0顯卡用在3.0平臺有沒瓶頸?

其實在老黃開發布會官方演示的PPT中,他們就是使用酷睿i9進行測試的,光是這點,你們就不用擔心PCIe3.0夠不夠用的問題了。但猛男抱著實事求是的態度,還是拿支持PCIe4.0的AMDRyzen93900XT與X570作為平臺再測一遍對比一下。

雖然兩者跑3DMark的帶寬測試有差距,但是多個理論性能測試項目中,兩者都沒有明顯的差異,因此我們可以得到結論PCIe3.0×16的帶寬是完全能滿足RTX3080對帶寬的需求的。

但是,我這個結論只針對單卡用途啊,因為RTX3080是不支持雙路SLI的,而RTX3090則是支持SLI的,如果在Z490這種消費平臺PCIe3.0主板上進行雙路SLI的話,那每路就只能拿到PCIe3.0×8的通道了,在那個時候就可能出現瓶頸了。

第五部分,加入DX12游戲,更全面的性能測試

針對第二點我們先追加了三項理論性能測試,分別是更嚴苛的DX12測試場景TimeSpyExtreme、光追性能測試PortRoyal和DLSS測試,這里3080對比2080Ti也是保持30%左右的性能優勢。

除此以外我們還準備了6個新游戲進行測試其中有5個支持光線追蹤和DLSS,這里只看它們在2K和4K分辨率下的表現,各項測試中3080對比2080Ti都有明顯的優勢。

在毀滅戰士4k分辨率測試時優勢最明顯,達到43%,平均下來也有30%左右的提升,而對比2080提升最大則在德軍總部4k分辨率測試中,這里顯然2080和2080SUPER就爆顯存了,幀數只有30801/3。

結合此前6個舊游戲中這四張顯卡在2K、4K分辨率的成績,最后我們就能得到這張全面的性能百分比圖表。

12個游戲,兩個分辨率,9項理論性能測試,這33項測試得出的這張性能百分比圖表應該算非常全面和具有參考價值的了,RTX3080對比RTX2080Ti提升為28%,對比2080SUPER提升56%,對比2080提升足足有71%。 

第六部分,對比目前最強A卡,簡直是屠殺..

雖然現在市面上的A卡比較弱雞,但作為NV目前唯一的對手,這里我還是要象征性拿出幾張A卡出來鞭尸,這里我們選用了RadeonVII和5700XT兩張顯卡,因為我們發現雖然理論性能RadeonVII是目前最強的A卡,但是GCN架構實在太老了,在很多新游戲中RadeonVII的表現反而不如5700XT,因此我們索性兩張顯卡都加入測試。

測試項目是12項游戲中不涉及光追和DLSS的7個游戲,最終3080比RadeonVII強了82%,對比RX5700XT強了93%,接近翻倍

測試結果看完,相信每一個A粉都壓力山大,不過蘇媽給了大家點信心,根據泄露的消息,BIGNAVI采用RDNA2架構,命名6800或者6900XT,10月28日發布,屆時我們再來看看紅綠兩家的PK。

第7部分,功耗溫度測試、噪音測試、延遲測試

RTX30系使用的是三星特制8nm工藝,顯卡的功耗表現如何呢?這里我們使用了一套很牛逼的設備,由NVIDIA提供能通過PCIe插槽供電和外接供電直接讀出顯卡單獨的功耗,3080的功耗比2080Ti要高了30~60W,能耗比對比2080Ti高了7%。

這樣看新顯卡的工藝還是有點拉跨,其實三星8nm工藝確實在密度上是比不上臺積電的7nm工藝的,老黃用它也是勝在便宜,最后3080的價格也確實讓人驚喜。

顯卡的噪音也非常不錯,50分貝以下根本沒有感覺。

在RTX30系發布會上老黃還提到了一個降低顯卡延遲的技術Reflex這里我們也檢測了一下新顯卡在堡壘之夜游戲中的延遲情況,打開Reflex后在畫面延遲確實有所降低,而且分辨率越高療效越明顯,對職業電競玩家的確實是個好東西,只是對于曉邊我來說可能就感知不強了。 

總結

3080的性能提升足夠讓人驚喜,當然最令我驚訝的是價格,畢竟此前的消息一直都說RTX30系要繼續漲價,唯一的槽點就是功耗也增長了不少,但前面也說了,假如不是用三星8nm工藝,新顯卡的價格也不會那么出人意料,算是一把雙刃劍吧,大家記得選購靠譜的電源就好。

再從十年提升的曲線也能看出,在RTX20劃了兩年水之后,在心疼買了20系的小伙伴之余,也能欣慰地看到這代RTX 30系的提升開始回到了正軌,而對于RTX 3090顯卡,性能從它的規格來看也大致推算出會比3080強20%左右,八九不離十了。

如果說英偉達圖靈架構的RTX20是試水光追的一代,那么英偉達安培架構的RTX30就是揚帆起航的一代了。本次實測可以看到,在同時開啟DLSS和光線追蹤功能之后,RTX 3080已經足以支持4K60幀的游戲體驗了。

我們曾經猜測過光追可能是未來,但沒想到這個未來來得這么快!如果說光追導致幀數低是你曾經拒絕它的原因,那么這一代,這個理由已經不成立了。

當然,這也還得老黃去大力把這技術普及到更多的游戲制作公司、游戲引擎上,才能有足夠豐富的游戲來讓玩家買單。不然我猜到你還能說:才那么幾款游戲支持光追,有什么用呢?

拋開光追不說,RTX 30的絕對性能、以及定價,也已經足夠排除掉你其他的選項了。

您可能感興趣的文章:

相關文章