Naplesで構成されるGPGPUサーバーは流行るか

Zenコアを採用するサーバー向けプロセッサNaplesは、どうやらかつて無い性能を誇るようです。Naplesと言えば32コア/64スレッドを誇り、デュアルCPU構成が出来ることが既に知られていますが、それ以外の性能についても特筆すべき点があります。

PCIe Gen3 128レーン

その1つがPCIe Gen3 128レーンという性能値です。PCIeはGPUとの通信に使われる他、ストレージとの通信にも使われています。ストレージとの通信はそこそこレーン数を食う要素で、NVMeは4レーンを使用します。超高速ストレージの需要は、そのシステムが捌くデータが巨大化するほど増します。128レーンという文字通り桁違いのPCIeレーン数は、ストレージやGPUを大量に使う時代を見据えた性能値だと言えます。

128レーンと言う圧倒的なレーン数はGPGPUに大きくプラスに働きます。CPU-GPU間の帯域幅を多く取れますし、ストレージや別のノードとの間の帯域幅も確保出来ます。帯域幅は演算資源を効率良く利用するための必須要素で、PCIeレーン数の増加は帯域幅の根本的な改善を示します。

DDR4 8チャネル

NaplesはDDR4を8チャネルで動かせます。4266 MT/sのメモリを使用した場合、1チャネル当たりの帯域幅は34.1 GB/sなので、8チャネルでは272.8 GB/sという広い帯域幅となります。

PCIe Gen3が128レーンもあることを考えれば、CPU-メインメモリ間の帯域幅272.8 GB/sはむしろ足りないくらいかも知れません。PCIe Gen3は1レーン当たり、双方向で2 GB/sの帯域幅があります。PCIeだけで、理論上秒間256 GBのデータをやり取りする可能性があるのです。

GPUの母艦のような性能

NaplesはGPUの母艦のような性能と言い表せるかも知れません。PCIe Gen3 x128という衝撃的なスペックは、GPUを繋ぎ、ストレージを繋ぎ、外部の演算資源との連携を取るのに十分な数字です。また、Naples自身が32コア/64スレッドを誇っており、メインメモリとの帯域幅もDDR4 8チャネルで272.8 GB/s確保出来ます。NaplesはGPGPUの巨大なワークフローを管理するのに十分スペックを持ち合わせていると言えるのでは無いでしょうか。

関連記事

AMDのZenとVEGAで構成されるシステムは、2017年のTOP500を沸かせるか

中国のエクサスケールに名乗りを上げると見られるSugonはZenとVEGAとHBMの最強APUを使うらしい