初のXeon Platinum/GoldシリーズとなるSkylake-SPが発売、EPYCとどのような戦いを繰り広げるか

Xeon Platinum/Gold 対 EPYC

AMDが1コアにつき2スレッドのSMTを採用し、IPC(Instructions Per Cycle)が52%向上した「Zenアーキテクチャ」を引っさげ、x86サーバー市場に帰ってきました。デスクトップ向けCPU製品「Ryzen」は既にその性能が注目されているところですが、サーバー向け製品「EPYC」も驚異的な性能を誇っています。

そんな中でIntelはこれまでのXeonのブランディングを一新しました。これからは、既存のE3/E5/E7は撤廃され、Platinum/Goldの名を冠して出荷されることになるようです。そしてXeon Platinum/Goldの最初のCPUが7/11に発売されました。

8CPUを超える構成まで可能なスケーラビリティを誇る 「Skylake-Scalable-Processor」

Skylake-SP(Skylake-Scalable-Processor)はその名の通りスケーラブルなプロセッサです。AMDのEPYCが最大2ソケットまでに絞ったこととは対照的に、8ソケットを超える構成に対応するようです。AMDとIntelの戦略の差が垣間見えます。メモリの最大容量は4ソケット構成時に6TBに達するようです。このようなスケーラビリティは、今後増々需要が高まるであろうHPC(High Performance Computing)の分野で強みになると考えられます。

Skylake-SPは単一のプロセッサとしてもHPCに強いようです。28コア/56スレッドまでの製品が用意されている上、ベクトル演算命令セットAVX512に対応することで、FLOPS per Cycleが2倍にまで引き上げられました。AVX512にいかに最適化するかにもよりますが、潜在能力はかなり高まったと言えます。AIのトレーニング及び推論で前世代の2.2倍のパフォーマンスを達成したようで、実性能も高いということが伺えます。

既存のサーバー市場にアプローチする「AMD EPYC」

現在GPGPUがメインとなっているAIワークロードなどを売りにしている点などから、Intel Xeon Platinum/Goldは新しい市場を求める戦略を取っていると言えるでしょう。一方AMDのNaples(EPYC 7000シリーズ)は、現在既存のサーバー市場でメインとなっている2ソケットまでの小規模な構成のシステムに絞るなど、既存の市場でのシェア獲得がメインの戦略と言えます。

AMDは既存のサーバー市場にアプローチする戦略を強力に推進出来ていると言えます。例えばSPEC 2006の整数演算についてのベンチマークは既存のサーバー市場で支持されているベンチマークの一つですが、以下のようにEPYC 7601は概ねXeon Platinumの28コア製品Xeon Platinum 8176よりも高いスコアを叩きだしています。

Subtest Application type Xeon
E5-2699 v4
@ 2.8
Xeon
8176
@ 2.8
EPYC
7601
@2.7
EPYC
Vs
Broadwell EP
EPYC
vs
Skylake
SP
400.perlbench Spam filter 1470 1980 2020 +37% +2%
401.bzip2 Compression 860 1120 1280 +49% +14%
403.gcc Compiling 960 1300 1400 +46% +8%
429.mcf Vehicle scheduling 752 927 837 +11% -10%
445.gobmk Game AI 1220 1500 1780 +46% +19%
456.hmmer Protein seq. analyses 1220 1580 1700 +39% +8%
458.sjeng Chess 1290 1570 1820 +41% +16%
462.libquantum Quantum sim 545 870 1060 +94% +22%
464.h264ref Video encoding 1790 2670 2680 +50% -0%
471.omnetpp Network sim 625 756 705 (*) +13% -7%
473.astar Pathfinding 749 976 1080 +44% +11%
483.xalancbmk XML processing 1120 1310 1240 +11% -5%

Anandtechも主張しているように、これらの値はrate metricとよばれる値で、実際にこのベンチマーク通りにアプリケーションが動くわけでは無いです。SPEC CPUベンチマークのrate metricは複数のスレッドを同時に立ち上げ並列して実行した場合のレートを表しますが、実際のアプリケーションはそうはなっておらず、あくまで参考値だということに注意が必要です。

EPYC 7601: TDP 180W, Xeon 8176: TDP 165W 実際の消費電力は

EPYC 7601はTDP 180W、Xeon 8176はTDP 165Wを公称していますが、このTDP値は消費電力とはリンクしていないようです。特に内臓のFPUを使った場合にIntel Xeon 8176の消費電力は大幅に上がります。

以下はMySQLで最大のスループットを出した場合とPOV-Rayを内蔵FPUを用いて全スレッドで走らせた場合の消費電力です。

SKU TDP
(on paper)
spec
Idle
Server
(W)
MySQL
Best Throughput
at Lowest Resp. Time
(W)
POV-Ray
100% CPU load
Dual Xeon E5-2699 v4 2x145W 106 412 425
Dual Xeon 8176 2x165W 190 300 453
Dual EPYC 7601 2x180W 151 321 327

Xeon PlatinumはAVX512に対応し、FLOPS/Cycleを2倍に引き上げましたが、内蔵FPUを100%使用すると消費電力が1.5倍にまで跳ね上がるようです。TDP180WのEPYC 7601がTDP145WのXeon E5-2699 v4よりも実は省電力で、TDPが消費電力とリンクしていないことが分かるかと思います。IntelはTDPを若干過小に、AMDは若干過剰に気味に公称していると言えるでしょうか。

関連記事

Intel Xeon Platinum/GoldのCinebenchがリーク

IntelがXeonブランドを一新、Xeon Gold、Xeon Platinumという製品群が誕生

Silicon MechanicsがZenアーキテクチャ採用で最大32コアのAMD EPYC CPUファミリ製品を提供開始

ソース

http://www.anandtech.com/show/11544/intel-skylake-ep-vs-amd-epyc-7000-cpu-battle-of-the-decade/

https://insidehpc.com/2017/07/new-intel-xeon-scalable-processors-boost-hpc-performance/

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)