「Radeon INSTINCT」が用いられたディープラーニング・ソリューションは2017年Q3から提供

Radeon INSTINCTによる「インスティンクティブ・コンピューティング」

AMDはインスティンクティブ・コンピューティングの次の章を明かしたようです。Instinctには本能、Instinctiveには本能的な、天性のといった意味がありますが、インスティンクティブ・コンピューティングとはどういった意味なのでしょうか。Radeon INSTINCTベースのディープ・ラーニング・ソリューションがパートナー(Boxx, Colfax, Exxact Corporation, Gigabyte, Inventec, Supermicro etc.)によって提供されるのは2017年Q3からです。

ディープ・ラーニングに特化したRadeon INSTINCT

AMDは人工知能と機械学習は、数年前には想像もできなかったように世界を変えており、これまでは不可能だった問題を解決できる人生を変えるようなブレイクスルーを実現しているとした上で、そのパフォーマンス、効率、実装の容易さを実現すべくRadeon INSTINCT MI25/MI8/MI6とROCm 1.6を打ち出しています。AMDが機械学習に強い期待を抱いていていること、Radeon INSTINCTがそれを強く意識したGPUであることが分かります。

高精度なFP64演算の能力については言及がありません。AMDはこれから大きく開けるであろうディープ・ラーニングの市場に向けて一点集中したGPUを作り、先行するNVIDIAに対して巻き返しを図りたいのでしょうか。

Radeon INSTINCT MI25

AMDはこのGPUをマシン・ラーニングおよびディープ・ラーニングの究極のトレーニングアクセラレータと位置づけています。14nmプロセスで製造され、Vegaアーキテクチャをベースとします。64コンピュート・ユニット(4096 ストリーミング・プロセッサ)によって実現される単精度浮動小数点数(FP32)演算性能はピーク12.3 TFLOPS、半精度浮動小数点数(FP16)演算性能はピーク24.6TFLOPSとなっています。またHBM2 ECCメモリを16GB搭載します。帯域幅は484GB/sとなるようです。

  • Radeon INSTINCT MI25
    • 製造プロセス 14nm
    • GPU Vegaアーキテクチャ
    • 64 CU (4096 SP)
    • FP32 12.3 TFLOPS
    • FP16 24.6 TFLOPS
    • HBM2 ECCメモリ
    • メモリ容量 16GB
    • メモリ帯域 484GB/s

Radeon INSTINCT MI8

Radeon INSTNCT MI8はFujiアーキテクチャを採用した高性能、高効率なスモール・フォーム・ファクターHPCアクセラレーターです。FP32、FP16の演算能力は共に8.3 TFLOPSとなるようです。HBMメモリを4GB、バス幅512bitで搭載するようです。TDPは175Wです。AMDによると、マシン・ラーニングの推論やHPCに適したアクセラレーターのようです。

  • Radeon INSTINCT MI8
    • GPU Fujiアーキテクチャ
    • FP32 8.3 TFLOPS
    • FP16 8.3 TFLOPS
    • HBM メモリ
    • メモリ容量 4GB
    • メモリバス幅 512bit
    • スモール・フォーム・ファクター
    • TDP 175W

Radeon INSTINCT MI6

Radeon INSTNCT MI6はPolarisアーキテクチャ採用したパワフルに冷却された推論アクセラレーターと位置づけられています。FP32、FP16の演算能力は共に5.7TFLOPS TFLOPSとなるようです。GDDR5メモリを16GB、バス幅256bitで搭載するようです。TDPは150Wです。AMDによると、マシン・ラーニングの推論やHPC、エッジ・トレーニングの導入に理想的なアクセラレータにようです。

  • Radeon INSTINCT MI6
    • GPU Polarisアーキテクチャ
    • FP32 5.7 TFLOPS
    • FP16 5.7 TFLOPS
    • GDDR5 メモリ
    • メモリ容量 16GB
    • メモリバス幅 256bit
    • TDP 150W

Radeon INSTINCTをオープン・ソース・ソフトウエアで

Radeon INSTINCTはオープンなGPGPUフレームワークROCm(Radeon Open Compute)にて利用出来ます。6/29にROCm 1.6が公開され、MIOpen 1.0に対応するようです。これによりCaffe, TensorFlow, Torchなどの代表的なマシン・ラーニング・フレームワークを利用することが可能となります。

関連記事

TYANがAMD EPYCのシングルソケット製品を2製品発表

Radeon Vega Frontier Editionのプレ・オーダーが開始、空冷モデル1,199 USD(約13.3万円)、水冷モデル1,799 USD(約20万)

AMDが32コアの最上位モデルEPYC 7601を始めとするサーバー向け製品群EPYC 7000シリーズのラインナップを公開

ソース

http://instinct.radeon.com/en-us/unleashing-radeon-instinct-to-drive-the-next-era-of-true-heterogeneous-compute/

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)