「Project 47」Radeon INSTINCTとEPYCで構成される単精度1PFLOPSのGPGPUサーバー

単精度1PFLOPS、30GFLOPS/WのGPGPUシステムを実現する「Project 47」

AMDと台湾Inventecによって、単精度1PFLOPSを誇るRadeon INSTINCTとEPYCのGPGPUシステムが開発されたようです。ネットワークチップはMellanoxの最大スループットが100Gbpsのものが使用されているようです。仮想化に対応し、機械学習やレンダリングなどへの応用が期待されます。EPYC 7601 20基、Radeon INSTINCT MI25が80基搭載されていて、システム全体の消費電力は34,200W、性能は単精度で1,027,600 GFLOPSとなっています。単精度の効率は30GFLOPS/Wで、ドラマティックな演算効率とされています。

新ブランドRadeon INSTICNT向けのVega「MI25」

AMDはこれまでのFire Proブランドを一新し、プロフェッショナル向けのRadeon Pro、コンピューティング向けのRadeon INSTINCTを立ち上げています。コンピューティング向けのGPUではNVIDIAのTeslaに水を開けられてしまっているAMDですが、新しいブランドと共に巻き返しを図ります。

Radeon INSTINCTの最初のシリーズのハイエンドモデルとなるRadeon INSTINCT MI25はAMDのVegaアーキテクチャに基づきます。Vegaの倍精度の浮動小数点数演算性能は高くはありませんが、グラフィクスの処理でも良く使われる単精度の性能や、機械学習の分野などで注目が集まる半精度の性能は高くなっています。また、帯域の広いHBM2(High Bandwidth Memory 2)を用いたHBC(High Bandwidth Cache)テクノロジーなど、様々な新技術が盛り込まれています。

Radeon INSTINCTの成功はVegaアーキテクチャの完成度にかかっていますが、Radeon Vega Frontier EditionはDeepbenchでTesla P100を超えるなど、上々の仕上がり見せています。倍精度の性能が低いので精度の必要なワークロードなどには向きませんが、ワークロードの種類によっては健闘しそうだと言えそうです。

ROCmはどんな役割を果たすか

AMDは2016年からROCm(Radeon Open Compute)と呼ばれるオープンソースのGPGPUフレームワークを立ち上げており、このフレームワークのバージョン1.5が先のDeepbenchの実行環境としても使用されています。ROCmがPower Project 47に果たす役割やPower Project 47がROCmに果たす役割はおそらく大きいでしょう。

Infinity Fabricはどんな役割を果たすか

このシステムの中でInfinity Fabricが果たす役割は気になるところです。Infinity FabricはEPYCのダイ間及びCPU間に使用されていますが、この技術によってCPUコアとGPUコア全体にコヒーレントでフレキシブルなインターフェースを実現することが明かされています。また、Wikichipによると、ノード間の通信にも応用され、より大規模なシステムのインターコネクトまで応用されるようです。

このシステムにInfinity Fabricが応用されていて、かつそれが上手く機能していれば、より高い効率で演算資源が活用されることが期待できます。AMDのGPGPUシステムは今後どのような発展を見せるのでしょうか。

関連記事

「Radeon INSTINCT」が用いられたディープラーニング・ソリューションは2017年Q3から提供

ROCm(Radeon Open Compute)の最新版がリリース、バージョン1.5に

EPYCの実力はHPCでも発揮されるか、控えめな実装ながら完成度が高いEPYCのFPユニット

ソース

https://instinct.radeon.com/en-us/p47-announcement/

http://wccftech.com/amds-infinity-fabric-detailed/

https://en.wikichip.org/wiki/amd/infinity_fabric

https://github.com/RadeonOpenCompute/ROCm/wiki

One comment

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)