2018年8月19日 星期日

AMD Ryzen Threadripper 2990WX, 2950X 測試報告 / 32C 旗艦攻頂 信仰爆棚


時隔一年 AMD 更新第 2 代 Ryzen Threadripper 處理器,便油門一拜一腳踩盡 32 核心 64 執行緒,打破以往 HEDT 多核心性能。

二代維持著 Zen+ 架構優化與 12nm 製程,不僅降低記憶體延遲,提升時脈更穩住溫度,首波 Ryzen Threadripper 2990WX 與 2950X,鎖定工作站多核運算專業人士以及遊戲發燒友,給予更多的核心、更強的性能、相同的價格,就這樣摧下去 Ryzen Threadripper 與 Core i9 的多核大戰。

前事提要:關於第 2 代 Ryzen Threadripper 處理器的開箱、4 款產品的介紹,請參閱:「油門全開 AMD Ryzen Threadripper 2990WX、2950X 開箱 新信仰盒裝 旗艦之姿」一文。



↑ 信仰開箱、處理器介紹,請點上方連結。

二代目優化“Zen+”架構與 12nm 製程

第 2 代 Ryzen Threadripper 處理器,同樣採用經歷一代優化後的 Zen+ 架構,可有效降低處理器 L1、L2、L3 快取延遲與記憶體延遲時間,並提升處理器時脈與支持 JEDEC DDR4-2933 標準。



↑ Zen+ 優化讓記憶體延遲更低。

經由 GLOBALFOUNDRIES 12LP(Leading Performace)製程的提升,讓處理器時脈可提升 +200MHz,達到 4.4GHz 的高時脈,更在核心電壓控制上降低了 80-120mV。



↑ 12LP 製程再提升時脈與降低電壓。

第 2 代 Ryzen Threadripper 處理器藉由 Zen+ 優化與 12nm 製程的提升,讓處理器整體性能比起上一代還要出色,不僅時脈提升、快取 / 記憶體延遲降低,更有穩住功耗表現。

Zen 的高彈性造就 Ryzen Threadripper 的異曲同工之妙

AMD 傾心打造的 Zen x86 架構,設計之初以增強指令集平行(Instruction-Level Parallelism),強化快取、預測引擎與同步多執行緒(Simultaneous Multi-Threading),藉此提升運算性能輸出(Throughput)。

Zen 架構有著高彈性的擴展能力,採用 4 核 Core Complex(CCX)模組設計,一顆裸晶 Die 裡面封裝 2 組 CCX 模組,意即一顆裸晶 Die 即有著 4+4 的核心數目。

而核心、裸晶(Die)之間,則可通過 Infinity Fabric 連接,讓 Zen 架構有著高擴展性。

就從 AMD Ryzen Threadripper 2950X 說起,其處理器內部有著 2 顆可工作的裸晶(Die 0 與 Die 1),每一顆裸晶各自連接了 2 組 DDR4 通道、32 條 PCIe 通道,而裸晶之間則透過 Infinity Fabric 連接,有著 50Gbps 的傳輸性能。



↑ 2950X 處理器架構圖。

而 32 核心的 AMD Ryzen Threadripper 2990WX,則是裝好裝滿內部有著 4 顆可工作的裸晶(Die 0-4),但為了相容 X399 晶片組,因此配置上 Die 0 與 Die 2 各自控制 2 組 DDR4 通道、32 條 PCIe 通道,而 Die 1 與 Die 3 則做為單純運算單元(不控制記憶體與 I/O)。

同樣 Die 與 Die 之間都通過 Infinity Fabric 相互連接,每個 Die 都可相互溝通傳輸資料,藉此降低延遲問題;4 個 Die 之間的網狀拓樸(mesh topology)連接可達到 25Gbps 的傳輸性能。



↑ 2990WX 處理器架構圖。

有趣的是,2950X 在架構上支持單一的 UMA(Uniform Memory Access) 或 2 組獨立的 NUMA(Non-Uniform Memory Access)的記憶體管理模式。

UMA 統一管理可獲得最大頻寬,但相對延遲較高;NUMA 則可最小化延遲(核心走最近的 DRAM 控制器),這根據不同的應用程式可獲得不同的性能提升,這項功能的切換則可在 Ryzen Master 軟體中的 Memory Access Modes 中進行控制。

但是 2990WX 則只支持 NUMA(Non-Uniform Memory Access)的記憶體管理模式,主要原因在 4 組 NUMA 結構可讓 AMD 打造 32 核心處理器,並且可相容 TR4 腳位與主機板,這也是 AMD 為了提供需要極高內容創作(Content Creation)性能的市場使用。

SenseMI 新功能 Precision Boost 2 與 XFR2

Ryzen 處理器上所搭載的「SenseMI」技術,制訂了許多功能可讓處理器有著更好的電源控制、精準加速、更高的超頻時脈、預測與預取等設計,而第 2 代 Ryzen Threadripper 處理器,則具備了 Precision Boost 2 與 XFR2 兩項更新。

Precision Boost 2 延續著上一代 25MHz 步階的超頻方式,但比起上一代採用的 4 Core 或 All Core 超頻機制,所造成的非線性時脈調整的問題,在這一代 Precision Boost 2 中,可獲得更線性、平滑的 CPU 時脈超頻機制。

藉由 Precision Boost 2 通過 Opportunistic 機制,根據溫度、電流來提升 CPU 最高時脈,倘若 CPU 散熱器有更好的溫度壓制能力,XFR2 即可自動超頻至更高的 Turbo 時脈,讓玩家在主機板自動超頻設定下,可獲得更強悍的性能。



↑ 2950X Precision Boost 2 時脈變化曲線。



↑ 2990WX Precision Boost 2 時脈變化曲線。



↑ 2990WX 若有更好的散熱條件,可藉由 XFR2 獲得更高的性能提升。

X399 架構圖 / 4ch DDR4, 64 PCIe Gen 3

第 2 代 Ryzen Threadripper 處理器,可相容於既有 X399 主機板,玩家僅需透過 BIOS 更新即可支援。換句話說,2 代 Ryzen Threadripper 在 I/O 規格上並無調整。

TR SoC 也就是處理器本身提供了 8 組 USB 3.1 Gen1、64 條 PCIe Gen3 通道與 4 組 SATA;而 X399 晶片組則提供更多的 USB 3.0 與 USB 2.0 連接埠,而其中更有著 2 Lanes PCIe Gen3,可讓主機板廠用作額外的 4x SATA 或 2x SATAe 來使用;而 8 Lanes 的 GPP PCIe Gen2,則可用做網路、WAN、藍牙或其他控制器之通道。



↑ SOC、X399 所提供的 I/O 規格。



↑ X399 主機板架構圖。

有關 Ryzen Master 的 Legacy Mode、Game Mode 與 Creator Mode

AMD 一系列 Ryzen 處理器皆是可超頻的設計,也因此玩家可透過 AMD Ryzen Master 軟體來替處理器超頻、調整電壓,甚至關閉 SMT 或核心來進行更進階的超頻設定。而為了讓用戶快速操作,則提供了 2 種預設模式:Creator Mode 與 Game Mode。

Creator Mode 與 Game Mode 兩者最大差異在於「Legacy Compatibility Mode」,有鑑於一般遊戲對多核心處理器的支援不佳,更遑論此次測試的 16C、32C 產品,因此 Game Mode 會以關閉核心的方式,來提升該處理器在遊戲時的性能

Legacy Compatibility Mode
處理器
出廠預設
1/2 Core Mode
1/4 Core Mode
Ryzen Threadripper 2950X
2 Dies, 16C32T, 4CH DIMM
1 Die, 8C16T, 2CH DIMM
N/A
Ryzen Threadripper 2990WX
4 Dies, 32C64T, 4CH DIMM
2 Die, 16C32T, 4CH DIMM
1 Die, 8C16T, 2CH DIMM

舉例來說:2990WX 開啟 Game Mode 會從 4 Dies、32C64T、4CH DIMM 降為 1/2 Core 或 1/4 Core 的模式,這可在 Ryzen Master 當中自行調整所需的核心數量;而 2950X 的 Game Mode 則是從原本 2 Dies, 16C32T, 4CH DIMM 降為 1 Die、8C16T、2CH DIMM 的模式。

這功能對於 32 核心的 2990WX 有著相當明顯的幫助,藉由關閉過多的核心,讓遊戲性能可再提升,而測試結果就留待遊戲測試時統一為各位解答。



↑ 於 Ryzen Master 當中可開啟 Legacy Compatibility Mode 關閉核心。

此外,針對 2950X 處理器所提供的「Memory Access Mode」功能,可調整記憶體 Distributed Mode 或 Local Mode,也就是上述提到的 UMA(Uniform Memory Access) 與 NUMA(Non-Uniform Memory Access)的記憶體模式。

Distributed Mode 會分散用 2 顆 Die 上的記憶體通道,這設計可讓需要 16 核心運算的程式,獲得最好的運算性能,也因此 Creator Mode 會將記憶體設定為 Distributed 模式。

至於 Local Mode 則是將 2 顆 Die 的記憶體各自獨立,也就是說每個 Die 都只用離自身最近的記憶體通道,如此一來更可降低記憶體延遲,也使得 Game Mode 亦會將記憶體設定為 Local 模式。

實際測試,2950X 在 Distributed Mode 模式下,記憶體複製僅 79084MB/s 且延遲較高 91.5ns,而在切換為 Local Mode 之後,記憶體間的複製提升到 88979MB/s 且延遲降低至 67.6ns。



↑ 2950X Distributed Mode 記憶體性能。



↑ 2950X Local Mode 記憶體性能。

性能測試 / Ryzen Threadripper 2990WX、2950X 與 i9-7980XE

究竟 32 核心的 Ryzen Threadripper 2990WX 與 16 核心的 2950X 處理器,比起對手 i9-7980XE 與 i9-7900X 在多核運算性能上能贏過多少?更比起自家一代 1950X 處理器,性能進步了多少?亦是本次測試的重點。

測試採用系統預設 Auto 的模式進行,唯一調整 D.O.C.P. 並載入記憶體 3200MHz 設定,並透過 BIOS 讓散熱器全速運轉。

測試平台採用 ASUS ROG ZENITH EXTREME 主機板,以及 G.SKILL FLARE X DDR4 8GB*4-3200 記憶體,作業系統則安裝在 Samsung NVMe SSD 960 PRO M.2 500GB 上;作業系統則是最新 Windows 10 Pro,並將遊戲 DVR 關閉;搭配測試用的顯示卡則是 NVIDIA GTX 1080 Ti FE;處理器散熱器則是 ENERMAX LIQTECH TR4 240。



↑ 測試平台資訊。

總結

AMD 第 2 代 Ryzen Threadripper 馬力全開,32 核心 2990WX 鎖定 3D 創造、渲染、運算等專業應用,讓用戶可自行打造所需的工作站電腦;雖說單處理器價格 $1799 美金(台灣定價 57,999 元),但對於希望藉由多核心運算(金錢)節省渲染、運算的等待「時間」,對於專業工作者來說,若有需求這肯定相對划算。

而與 2990WX 打對台的 i9-7980XE,在台灣定價相當接近,但 2990WX 不僅有更多的核心、更強的運算性能,於 Cinebench R15 與 POV-Ray 有著 33% 的性能領先;此外,2990WX 更可透過 Precision Boost 2、PBO 等技術得到接近超頻的性能。



↑ 時間就是金錢,不是嗎?2990WX 測試 Blender 渲染 Ryzen 處理器,只需要 8 秒的時間。

WX 鎖定專業工作者,而 X 系列的 Ryzen Threadripper 2950X,則鎖定遊戲玩家、性能狂熱分子,玩家同樣可獲得更多的 16 核心,以及相近 Intel 平台的遊戲性能。

且第 2 代 2950X 本身預設時脈也較高,超頻更可挑戰全核心 4.3GHz,整體遊戲性能更勝 1 代 1950X。

更何況 2950X 定價 $899 美金更比 1 代發表時還便宜,可預期台灣 2950X 定價會與 i9-7900X 相當接近,就測試來看 2950X 有著更強的多核性能,即便遊戲帳面上小輸平均 10fps 左右,但同樣可給玩家足夠的遊戲性能,更可藉由 CPU 同時遊戲與直播,兩者兼顧。



↑ 任務完成。

AMD 設計 Zen 架構之初,不僅有著增強指令集平行,強化快取、預測引擎與同步多執行緒等設計,藉此提升處理器的運算性能輸出。而更重要的策略則是「Zen 架構所擁有的擴展彈性」,讓 AMD 可以用與對手相近的價格,開啟多核心的戰爭。

AMD 第 2 代 Ryzen Threadripper 維持著與對手相近價格,但有著更多的核心、更強的運算性能,並且處理器皆可超頻等特色,首波先販售 2990WX,而在 8/31 則輪到 2950X 上陣,玩家可根據需求與預算,來打造 Ryzen Threadripper 多核心體驗。

沒有留言: