AMDのZenとVEGAで構成されるシステムは、2017年のTOP500を沸かせるか

ROCmでZen、VEGA環境が流行るシナリオ

あまり目立っては居ませんが、AMDが2015年11月に発表したROCmというプロジェクトがあります。Radeon Open Computingの略で、その名の通りオープンなコンピューティング環境をAMDのGPUで提供する言うプロジェクトです。

AMDはLinux向けドライバーなどをオープンソースにする代わりに、オープンソースコミュニティの力を借りてコンピューティングの環境を整えます。

ROCmはAMDのCPUとCaviumのARMアーキテクチャのCPUをサポートするとしており、またOSを介さずにメインメモリの内容をやり取りするRDMAへの対応を謳っています。Zen(またはCaviumのThunderX)とVEGAでHPCシステムを設計する限りにおいては、ROCmの恩恵を受けることが出来ます。

また、Zen VEGA構成を利用したHPCシステムがROCm関連で生み出したソフトウエア資産は、そのままROCmの資産となります。ROCmのソフトウエア資産が積み上がれば、更に多くのHPCシステムに採用されるでしょう。そうなった時、AMDはもしかしたら大逆転を遂げるかも知れません。

ZenとVEGAのポテンシャル

ZenとVEGAのポテンシャルは今までのAMD製品に見られないほど高いようです。i7-6900kのクロックを3GHzにまで落とし、Zenアーキテクチャで3GHz駆動のSummit Ridgeと、BlenderのCycleレンダラーを同時にスタートさせ戦わせたデモがありました。このデモではSummit Ridgeの方が早くレンダリングを完了し、AMDはIntelと勝負が出来るものが出来たと積極的にアピールしています。

このデモはデスクトップ版の8コアのSummit Ridgeの話ですが、サーバー向けのNaplesは32コアです。AMDはNaplesでサーバー市場に再参入すると話しています。

VEGAは次世代のAMDのGPUのアーキテクチャですが、64bit:32bit:16bit:8bit演算が1:2:4:8でスケールするそうです。低精度演算が重要なディープラーニング市場にアピールする狙いがあり、同じようにスケールするTesla P100の後に続きます。理論演算性能でTesla P100を上回るとしており、Radeon INSTINCTというブランドを立ち上げ、NVIDIAのTeslaと戦うようです。

訂正 2017/6/21

Vegaの倍精度(64bit)浮動小数点数演算性能は単精度の1/16と低いものとなるようです。

ソース

http://wccftech.com/amd-vega-10-20-slides-double-precision-performance-1500-mhz-vega-10-x2-2017/

また、VEGAはメモリコントローラーの仮想メモリ空間を512TB用意し、不揮発メモリ導入による大容量化に備えた設計となっているようです。ワークステーション向けブランドのRadeon ProではSSGと言うSSDをGPUのキャッシュとして使う技術を発表しており、次世代スケールのビッグデータを処理する準備も進んでいます。

ZenとVEGAで構成されるHPCシステムがTOP500を沸かせると予想

ROCmプロジェクトによるオープンなコンピューティング環境は、クローズドなCUDA環境よりもオープンソースコミュニティに好かれます。最も成功したオープンソースソフトウエアと言われているLinuxは、HPCシステムにも広く採用されています。そのLinuxのカーネル開発コミュニティは、AMDのGPUの機能をフル活用すべく動いています。

ROCmが効率よく演算資源を使えるコンピューティング環境となり、AMD製品がHPCシステムに採用され出すのは時間の問題でしょう。2017年はTOP500でAMDの製品を沢山見る年になるかも知れません。

関連記事

AMDはCUDAに対抗出来るか、「ROCm1.3」発表

Radeonがディープラーニング向けGPGPUコプロセッサのプロダクトライン「Radeon INSTINCT」を発表

デスクトップ版AMD Zenの性能はIntel i7 6900Kと競合するレベルらしい。