X-Gene 3のサンプル出荷が開始、XeonクラスのARMサーバーチップ

AppliedMicroがX-Gene 3のサンプル出荷を開始

AppliedMicroのサーバー向けCPUシリーズX-Geneの最新モデルX-Gene 3のサンプル出荷が開始したようです。X-Gene 3はARMv8 32コア CPUにDDR4 2667 8チャネル、16DIMMsに対応しECCやRASにも対応するメモリコントローラー、PCIe 3.0 42レーンに対応するIO機能などを統合したServer on a Chip(SoC)製品です。

シングルスレッド性能の高いARMアーキテクチャの32コア/32スレッドCPU

AppliedMicroのX-Gene 3はIntel Xeon E5-2680 v4に競合する性能を持っているようです。AppliedMicroのホワイト・ペーパーによると、複合ベンチマーク「SPECin_rate 2006」のスコアは、Xeon E5-2680 v4のスコアが527なのに対し、X-Gene 3が550とリードしています。スレッド当たりのスコアは17.2とXeon E5-2680 v4の91.5%のスコアとなっています。TDPは110W-125Wとなっており、XeonのE5シリーズがカバーする市場を意識した製品であることを伺わせます。

Cavium ThunderXは、X-Geneと同じARMv8命令セットを採用する48コア/48スレッドを誇るメニーコアCPUですが、スレッド辺りのSPECintスコアは7.3とX-Gene 3のスコア17.2の42%に留まっています。両者は同じ命令セットを採用するコアの多さが特徴的なCPU製品ですが、X-Gene 3はThunderXの2.4倍のシングルスレッド性能を誇っており、コア数だけでなくシングルスレッド性能も重視した設計だと言えます。

  • ベンチマークスコア
CPU AppliedMicro
X-Gene 3
Intel Xeon
E5-2680 v4
Cavium
ThunderX
Intel Xeon
D-1540
コア/スレッド 32C/32T 14C/28T 48C/48T 8C/16T
ベースクロック 3.0GHz 2.4GHz 2.5GHz 2.0GHz
SPECint_rate 550 527* 350 238*
SPEC/Thread 17.2 18.8 7.3 14.9
TDP 110–125W 120W 95W 45W

* GCCを使用した場合のスコア

  • 各CPUのスペック
CPU AppliedMicro
X-Gene 3
Intel Xeon
E5-2680 v4
Cavium
ThunderX
Intel Xeon
D-1540
コア/スレッド 32C/32T 14C/28T 48C/48T 8C/16T
ベースクロック 3.0GHz 2.4GHz 2.5GHz 2.0GHz
キャッシュ合計 32MB 35MB 16MB 12MB
メモリバンド幅 170.7GB/s 76.8GB/s 76.8GB/s 34.1GB/s
メモリ容量 1,024GB 1,536GB 512GB 128GB
イーサネット 非搭載 非搭載 2x 100GbE
+ 10x 10GbE
2x 10GbE
PCIeバンド幅 82.8GB/s 78.9GB/s 31.5GB/s 55.3GB/s
プロセス 16nm FF+ 14nm HP 28nm HKMG 14nm HP
価格 未公開 $1,745 $600–$800 $581
製造日 2H17(予定) 1Q16 4Q15 1Q15

メモリバンド幅の広さや、今後も強化されていくと言うスケールアウト機能も特徴的

X-Gene 3’s biggest advantage will be on memory-intensive applications such as web search, big data, machine learning, and high-performance computing (HPC).

ホワイト・ペーパーにはX-Gene 3はメモリが重要となるアプリケーションで最大のアドバンテージを得ると記されています。その例としてWebサーチやビッグデータ、マシンラーニング、HPCなどが挙げられています。X-Gene 3はDDR4 2667, 8チャネルに対応する非常に高性能なメモリコントローラーを搭載しています。メモリバンド幅は170.7GB/sとなっていて、Xeon E5-2680 v4の76.8GB/sの2.22倍となっています。

ロードマップを見てみると、X-Geneシリーズは前世代のX-Gene 2から、別のノードのメモリにイーサネットから直接アクセスするRoCE(RDMA over Converged Ethernet)に対応しており、X-Gene 3のロードマップにはScale-out advanced interfaceとの記述があります。

ロードマップにあるScale-out advanced interfaceは、恐らく新しい機能として実装されるX-Tend NUMAのことでしょう。これはPCIeバスを介してNUMA環境を構築する機能をようで、今年中に4ソケットのNUMAが実現され、ロードマップ上では8ソケットまでに対応するようです。これが実現すれば最大256コア、8TBのNUMAマシンを構築出来ることになります。最大8way構成が可能だったOpteronを彷彿とさせますね。

関連記事

ヨーロッパのエクサスケールプロジェクト「モンブラン・プロジェクト」がARMアーキテクチャのCavium Thunder X2を使用したプロトタイプの制作を発表

MicrosoftのデータセンターでQualcommのCentriq 2400が使用されることが決定

ソース

https://www.linleygroup.com/uploads/x-gene-3-white-paper-final.pdf

https://www.apm.com/news/applied-micro-finds-arm-server-footing-reaches-higher/

https://www.nextplatform.com/2015/11/18/applied-micro-chases-xeons-with-x-gene-3-and-numa/

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)