七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

作者:愛極物

在NVIDIA公版Founders Edition解禁一天後,又到了非公版全面開花的時間點。GeForce RTX 4090 FE可以千篇一律,但使用旗艦級顯示卡的使用者卻有著各種各樣的要求,這時候就是該AIC廠商發揮實力的時候了。那麼有沒有一款RTX 4090定位與FE公版相同,但更容易買到,且沉穩低調的型號呢?眼前的七彩虹戰斧GeForce RTX 4090豪華版似乎就給了一個很好的例子。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

雖然沒有iGame那般張揚的外形和RGB,但七彩虹戰斧GeForce RTX 4090依然是實打實的三槽設計。厚重的散熱模組設計,時刻都在暗示裡面裝載著當下最強GPU,搭配經典的戰斧系列紅黑配色,有了一種西裝暴徒的即視感。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

那麼與Founders Edition看齊的七彩虹戰斧GeForce RTX 4090豪華版表現究竟如何?現在就讓我們獻上首發評測。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

來自Ada Lovelace的“核”動力

Ada Lovelace名字背後多少帶著一些傳奇色彩,她是英國數學家,以及拜倫之女,整理闡述分析機文章後,建立了沿用至今迴圈和子程式概念,並在180年前預言了計算機用途將不限於計算,同時也成為了世界上第一個編譯器發明者,被譽為程式之母。用來作為新一代的消費級GPU代號,也正好與商業CPU+GPU的Grace Hopper遙相呼應。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090正是使用的是代號Ada Lovelace,型號AD102-300-A1的GPU,NVIDIA利用臺積電4N定製工藝和改良的電路設計進一步擴大了晶片規模,時鐘頻率為2。52GHz,是以往NVIDIA GPU都未曾達到的高度。但同時TGP功耗則可以做到與GeForce RTX 3090 Ti相當,同樣為450W,相當於GeForce RTX 4090的每瓦效能是GeForce RTX 3090 Ti的2倍。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

從整體上看,完整的AD102包含了12個圖形處理叢集(Graphics Processing Clusters,GPC),72個紋理處理簇(Texture Processing Clusters,TPC),144個流式多處理器(Streaming Multiprocessors,SM),以及搭配了12個32-bit控制器的視訊記憶體介面,共計384-bit。

但由於AD102-300-A1禁用了1個GPC核心,七彩虹戰斧GeForce RTX 4090總共包含了11個GPC,64個TPC,128個SM,16384個CUDA Core,512個第四代Tensor Core,128個第三代RT Core。這裡不妨讓我們放出GeForce RTX 4090與GeForce RTX 3090 Ti,GeForce RTX 3090的規格進行對比:

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

在核心結構上,Ada Lovelace最大的變化是相對Ampere架構增大了L1和L2快取,其中L1快取可以達到18,432KB,比Ampere的10,752KB多出71。4%。總共98,304KB的L2快取,也比Ampere的6144KB提高了16倍,這讓光線追蹤,尤其是路徑追蹤從中獲得巨大收益,最終讓第三代RT Core的射線/三角形求交測試模組數量直接翻倍。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

NVIDIA增大快取容量是有原因的。我們知道從GeForce RTX時代開始,RT Core與Tensor Core效能成為了GPU實現實時光線追蹤技術以及DLSS深度學習超取樣技術的關鍵。

第三代RT Core在第二代RT Core的基礎上,再次將射線/三角形求交測試吞吐量。意味著射線/三角形求交測試模組由原來的2個再次增加到4個,相對Turing架構的1個射線/三角形求交測試模組翻了4倍,並額外增加了下圖左下角的透明度微圖引擎(Opacity Micro-Map,OMM)和右下角的位移式微型網面引擎(Displaced Micro-Mesh,DMM)。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

其中透明度微圖引擎(Opacity Micro-Map,OMM)讓第三代RT Core擁有2倍速度的透明度遍歷(Alpha Traversal),OMM透過減少幾何圖形透明度(Alpha)測試數量,最終減少著色器的透明度計算。這個新功能可以讓開發人員緊湊的描述不規則形狀,或者半透明物體,比如蕨類植物、柵欄等等。如果用下圖舉例,OMM可以讓RT Core有效避免第二張圖藍色部分的的計算,從而更有效的執行光線追蹤效率。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

位移式微型網面引擎(Displaced Micro-Mesh,DMM)則可以用10倍的速度執行BVH。DMM也是全新的單元,它用來處理RT Core本地微求交結構網格,透過使用較少的基本求交三角形來描述比以往更復雜的幾何形狀。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

第三代RT Core還引入了著色器執行重排序(Shader Execution Reordering,SER)技術,透過與遊戲設計團隊配合,更有效的分配次級射線的排序權重,從而獲得更高效的執行緒排序執行,避免光追運算陷入無意義的次級射線運算的等待中      。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

第四代Tensor Core的FP16、BF16、TF32、INT8、INT4效能相對前一代提升兩倍以上,並增加了商業Hopper GPU架構中出現的FP8 Transformer Engine。得益於AD102 GPU中SM處理器增加,每個SM包含了4個第四代Tensor Core數量自然也同步增加,最終實現了AI計算效能的顯著提升,並衍生出了效能提升神器DLSS 3,之後我們會分單獨一個章節詳細說明。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

戰斧裝甲參上

如果開頭所言,為了支撐AD102-300-A1效能持續輸出,七彩虹戰斧GeForce RTX 4090同樣使用了三槽設計的超大散熱模組,並覆蓋經典紅黑撞色裝甲,在保持低調的同時展現出力量感。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

這樣的力量感同樣延續到顯示卡背板,戰斧GeForce RTX 4090使用了鏤空設計,配合側面露出大面積散熱鰭片,更利於熱量的快速釋放。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

為此,散熱模組與GPU的相接處使用了真空冰片技術,透過扁平密閉腔體內充冷凝液,在吸收熱量後透過相變原理快速匯出熱量。而在鰭片與熱管之間,沿用了一套“迴流焊”工藝,使熱管與鰭片間緊密相連。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

最後配合98mm直徑的三風扇設計,搭配2*Φ6+4*Φ8熱管,組成了戰斧GeForce RTX 4090眼前這套散熱系統。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

由於使用了16pin(12VHPWR)介面,供電相數為14+3,戰斧GeForce RTX 4090隨機提供了一套3x8pin轉16pin電源轉接線,相對公版的4x8pin轉16pin少了1個8pin,但從實際表現來看,戰斧GeForce RTX 4090並沒有與4x8pin的RTX 4090產生明顯差距。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

在壓力測試中,戰斧GeForce RTX 4090,能夠看到通道供電接近500W,GPU功耗450W,與公版表現相當。與此同時,GPU最高溫度為65,相對公版的68更低一些。

這裡放上紅外線散熱圖,可以看到最高溫度集中在扇熱鰭中段。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

順帶一提,在介面配置上戰斧GeForce RTX 4090與公版保持同步,包括1個HDMI 2。1和3個DisplayPort 4。1a。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

加速AI創作

又到了喜聞樂見的測試環節,由於戰斧GeForce RTX 4090更注重創意內容製作上的表現,我們也準備了一套記憶體和容量更大的測試平臺,比如32GB DDR5-4800 X2,共64GB。以及2TB PCIe SSD,並使用24執行緒的Core i9-12900K處理器,Z690主機板,1250W電源等,參考配置如下圖,除此之外,作為對比我們使用GeForce RTX 3090、GeForce RTX 3090 Ti進行陪跑。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

在基礎效能測試中,慣例引入檢測DirectX 11和DirectX 12的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal和VRMark Blue Room進行檢測。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

可以看到,相比GeForce RTX 3090 Ti,戰斧GeForce RTX 4090能夠輕鬆提升50%到80%,特別是4K效能和光線追蹤效能差距明顯,第三代RT Core以及更多的CUDA Core、GPU快取起到了顯著的作用。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

為了考驗GPU的實際水平,我們也是用了幾個常見的3A遊戲作為參考,其中包括《地鐵:離鄉》,《古墓麗影:暗影》,《邊境》,《光明記憶:無線》,《Wolfenstein: Youngblood》等,測試主要聚焦於4K最高畫質最高光追效果。

可以看到,戰斧GeForce RTX 4090幀率能夠輕鬆跨越4K 100FPS大關,4K最高畫質拉滿光追對於GeForce RTX 4090不再是問題。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

簡單的熱身之後,讓我們進入內容創作實戰環節。從引數上看,戰斧GeForce RTX 4090的GDDR6X視訊記憶體仍然為24GB,但實際上透過與美光合作實現了電路設計以及訊號上的最佳化,視訊記憶體峰值視訊記憶體頻寬已經提升到了1TB/s,24GB視訊記憶體容量將能夠更輕鬆的構建4K乃至8K的內容。這也是為什麼接下來的我們的內容創作測試都會圍繞更高解析度的內容創作形式作為參考。

不僅如此,GeForce RTX 4090也首次加入AV1雙編碼器。AV1編碼是由英特爾、微軟、亞馬遜、谷歌、網飛等網路巨頭組成的開放多媒體聯盟AOMedia所推出的免費編碼格式,在國內已經獲得了嗶哩嗶哩、愛奇藝支援。它的特點是能在相同檔案體積下擁有更高畫質的畫質,或者相同清晰度的畫質下擁有更小的體積。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

如果與GeForce RTX 30系列進行對比,GeForce RTX 40系列的AV1編碼器能比H。264編碼器效率高出40%。這意味著AV1編碼器能夠利用現階段可以進行1080p串流影片的頻寬,實現1440p甚至更好的畫質。如果影片平臺支援AV1實時直播推流,在同樣的頻寬佔用下,可以輕鬆播放2K或者4K的影片,而播放4K的頻寬也將可以用來播放更高解析度的內容。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

得益於24GB的視訊記憶體容量,戰斧GeForce RTX 4090融入了2個AV編碼器,組成了雙編碼的形式,這是12GB以上RTX 40系列GPU才擁有的特權,能夠實現同時處理4個4K 60FPS影片,1臺電腦完成多路4K畫質60FPS輸出等以前不敢想象的玩法。

在實際測試中,我們先使用了Resolve 18對4K 30FPS和8K 30FPS的影片進行編碼,由於GeForce RTX 3090不支援AV1編碼,這裡使用H。265替代。能夠看到,戰斧GeForce RTX 4090的效率加速了將近60%。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

渲染能力則主要圍繞Blender Benchmark進行。Blender Benchmark主要測試了GPU的渲染輸出能力,在Moster、Junkshop、Classroom按個場景中,戰斧GeForce RTX 4090相對GeForce RTX 3090最高提升了102%的效能。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

而在V-Ray 5 Benchmark中,則會考驗到GPU的CUDA效能和光線追蹤效能,能夠看到戰斧GeForce RTX 4090提升也是翻倍的。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

在經常被利用於建立模型的Octane Render RTX會對GPU的光線追蹤效能以及渲染輸出有著很高的要求。在複雜測試場景下,會考驗GPU每秒產生的樣本率。可以看到戰斧GeForce RTX 4090最高效能提升也能達到110%以上。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

Tensor Core的AI效能也已經成為GPU測試專案之一,利用AI實現低解析度圖片無損向高解析度圖片輸出變得更為常見。這裡我們使用了ON1 Resize AI 2022作為參考,分別將五張9MB左右,4000x6000解析度圖片,輸出成更大的8000x12000圖片,也就是將圖片橫向與縱向解析度放大一倍,容量也達到了將近60MB。這裡讓我們先來看一下輸出的最終效果。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

如果戰斧GeForce RTX 4090與上一代GeForce RTX 3090比較,可以看到實際執行時間壓縮了40%以上。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

最後在放出測試常客SPECviewperf 2020,這是一款包含3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等諸多專業軟體,由於SPEC組織基於工業標準的OpenGL圖形顯示卡效能測試分析軟體。測試本事使用C語言編寫,主要用於測量執行在OpenGL API下的3D圖形效能。

能夠看到戰斧GeForce RTX 4090相對GeForce RTX 3090最低提升40%左右,最高可達130%以上。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

簡而言之,更多數量的CUDA,強勁的第三代RT Core和第四代Tensor Core,以及更快的24GB GDDR6X視訊記憶體,都讓戰斧GeForce RTX 4090在創作效能上有了成倍的提升,鑑於售價與上一代GeForce RTX 3090想等,甚至更低,戰斧GeForce RTX 4090在內容創作環節已經突出了強有力的價效比。

必殺:DLSS 3

對於一款旗艦級顯示卡而言,創作效能爆表遠遠不夠,因為戰斧GeForce RTX 4090另一個必殺技是DLSS 3,這項技術伴隨著新顯示卡推出,並且已經獲得了市面上35款主流遊戲的支援。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

與我們以前理解的DLSS 2。X不同,DLSS 3已經不再是傳統意義上的單一技術,它是一個軟體與硬體協同的技術合集,包含了DLSS 2超解析度技術,AI生成幀,加入對NVIDIA Reflex支援。在硬體層面,依靠第四代Tensor Core與光流加速器共同協作,實現畫素級的測量場景,並雲端的NVIDIA超級計算機則夜以繼日的尋找提升高質量影象的途徑。在軟體層,DLSS 3包括DLSS 2超解析度技術,AI生成幀,加入對NVIDIA Reflex支援。

換而言之,DLSS 3開啟的本身也意味著原生開啟了NVIDIA Reflex技術,能夠有效提升系統響應延遲,在毫秒必爭的電競賽事中是非常有必要的。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

新光流加速器與DLSS 3搭配,能夠計算出場景中的所有畫素是如何從一個畫素移動到另一個畫素的,其中就包括陰影、光反射和粒子等光流場資訊。同時透過神經網路分析,分析之前幀與當前幀,最終獲得一個高畫質且自然的效果。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

簡單的說,戰斧GeForce RTX 4090擁有DLSS 3之後,遊戲幀率更高的同時,畫質也更好了。為了讓大家有更直觀的感受,我們將GeForce RTX 3090的DLSS 2與戰斧GeForce RTX 4090的DLSS 3進行對比。

在傳統的3DMark DLSS 2 2K解析度測試中,能夠看到戰斧GeForce RTX 4090效能提升70%以上,似乎在情理之中。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

如果把解析度提升到4K甚至8K,那麼GeForce RTX 3090將會被戰斧GeForce RTX 4090甩數條街,戰斧GeForce RTX 4090在DLSS 3加持下,效能直接提升了125%和170%,8K解析度下能夠流暢的執行93FPS畫面,4K 168FPS畫面,達到了相當離譜的程度。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

在遊戲中也是如此,我們從35款DLSS 3遊戲中選出了《賽博朋克2077》、《微軟飛行模擬》、《瘟疫傳說:安魂曲》、《逆水寒》、《F1 22》作為參考,並引用《Unity Enemies》《Unreal Engine 5: Lyra》兩款DEMO作為對比。

在與GeForce RTX 3090的對比中,戰斧GeForce RTX 4090可以輕鬆拿下200%以上的幀率提升,最高提升甚至可以達到420%。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

不僅如此,《逆水寒》DLSS 3版本首次使用了路徑追蹤也就是全景光線追蹤作為測試場景,因此最終導致了GeForce RTX 3090原始幀率只有7FPS,而GeForce RTX 4090在開啟DLSS 3之後能夠達到79FPS,差距非常大,也印證了DLSS 3搭配全新光流加速器達到了很好的畫質提升效果。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

這裡我們奉上一段ICAT擷取的畫面作為參考,DLSS 3不僅流暢度更有保障,光影效果也處理得更為自然。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

AI光影加速一把手

在一輪效能與體驗的輪番轟炸後,七彩虹戰斧GeForce RTX 4090豪華版給我們留下了深刻的印象,戰斧GeForce RTX 4090設計簡約卻相當有力,發揮出了Ada Lovelace AD102核心應有實力,透過最佳化後的電源與散熱設計,將GPU的通道功率推到了500W,但核心溫度控制在了70以下,並保持足夠安靜的執行,做到這幾點都是相當不容易的。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

更重要的是,戰斧GeForce RTX 4090所搭配的24GB GDDR6X視訊記憶體,AV1雙編碼器,第三代RT Core、第四代Tensor Core以及DLSS 3,都成為了效能提升的殺手鐧。仔細想想,上一次在隔代旗艦級顯示卡之間較量,效能輕而易舉提升100%甚至300%的景象,已經很久沒有發生了。

七彩虹戰斧GeForce RTX 4090豪華版首發評測:爭當AI創作全能手

戰斧GeForce RTX 4090透過強大的硬體堆疊以及巧妙的技術結合,實現了一套1+1大於2的效果,這不免也讓人期待起七彩虹iGame系列的強力表現。總歸而言,在Founders Edition之外,戰斧GeForce RTX 4090的表現,足夠成為設計師們或者想體驗高效能遊戲體驗玩家們不錯的選擇。畢竟在剝離RGB之後,還能有如此強勁表現的顯示卡,在當下的選擇中其實也是不多的。