ROCm 1.6がリリースされ、Radeon Vega FEによるOpen CLベンチマークが公開

ROCm 1.6がリリースされた

7月の末にROCm(Radeon Open Compute)のv1.6がリリースされました。Radeon Vega Frontier Editionや、Radeon INSTINCT MI25/MI8/MI6が正式にサポートされ、コンピューティングにおけるVegaの実力を測る準備が整いました。

以下はROCmのGithubリポジトリのリンクです。

https://github.com/RadeonOpenCompute/ROCm

ROCm 1.6、Radeon Vega FEを用いたベンチマーク

Phoronixによって、ROCm 1.6、Radeon Vega FEを用いたOpenCLベンチマークが行われました。環境は以下の通りです。

  • ハードウエア
    • AMD Ryzen 5 1600
    • Radeon Vega Frontier Edition
    • Gigabyte AB350M-D3H
    • 16GB RAM
    • Samsung 960 EVO

  • ソフトウエア
    • Ubuntu 16.04 LTS
    • ROCm 1.6
    • Linux 4.11-compute-rocm-rel

以下のリンクにその詳細な結果が掲載されています。

http://www.phoronix.com/scan.php?page=news_item&px=Radeon-Vega-FE-More-OpenCL

上の記事中では、より以前の以下の環境で取られたベンチマークの結果が併載されています。

  • ハードウエア
    • Intel Core i7 7740X
    • ASUS PRIME X299-A
    • 8GB Corsair DDR4-3200MHz
    • Samsung 950 PRO 256GB NVMe SSD

  • グラフィック・ボード
    • Radeon R9 285
    • Radeon R9 290
    • Radeon RX 480
    • Radeon RX 560
    • Radeon RX 580
    • Radeon R9 Fury
    • GeForce GTX 780 Ti
    • GeForce GTX 960
    • GeForce GTX 970
    • GeForce GTX 980
    • GeForce GTX 980 Ti
    • GeForce GTX 1050
    • GeForce GTX 1060
    • GeForce GTX 1070
    • GeForce GTX 1080
    • GeForce GTX 1080 Ti

  • ソフトウエア(NVIDIA)
    • Ubuntu 16.04 LTS
    • 384.59ドライバ
    • Linux 4.13

  • ソフトウエア(AMD)
    • Ubuntu 16.04 LTS
    • ROCm 1.6 (8/10時点のlatest)
    • Linux 4.11.0-kdf
    • OpenCL 2.0 AMD-APP 2450.0

以下のリンクにその詳細な結果が掲載されています。

http://www.phoronix.com/scan.php?page=article&item=opencl-aug-2017&num=1

ハードウエア環境が違うので一概には言えませんが、これらとの比較も交えてベンチマーク結果を紹介します。

殆どのベンチマークでGeForce GTX 1080Tiに敗れる

以下のベンチマークでGeForce GTX 1080Tiに敗れています。

  • Darktable v2.0.3
    Test: Boat – Acceleration: OpenCL
  • SHOC v2015-11-10
    Target: OpenCL – Benchmark: Max SP FLOPS
  • SHOC v2015-11-10
    Target: OpenCL – Benchmark: Texture Read Bandwidth
  • SHOC v2015-11-10
    Target: OpenCL – Benchmark: FFT SP
  • SHOC v2015-11-10
    Target: OpenCL – Benchmark: MD5 Hash
  • SHOC v2015-11-10
    Target: OpenCL – Benchmark: Triad
  • cl-mem v2017-01-13
    Benchmark: Copy

勝っているベンチマークは以下の1つだけとなっていて、現状OpenCLにおいては、Radeon Vega FEはGeForce GTX 1080Tiよりもパフォーマンスが低いと考えて良さそうです。

  • cl-mem v2017-01-13
    Benchmark: Write

FFT SP、MD5 Hashで過去のRadeon R9 Furyを大幅に超える

単精度のFFTとMD5ハッシュで過去のRadeon R9 Furyを大幅に超えました。特にMD5ハッシュについては76%も向上しており、単純な演算性能の向上しています。

ただし、両者の理論性能を比較すると、その差は82.7%に達しており、効率はむしろ下がっているようです。

  • SHOC v2015-11-10
    Target: OpenCL
    Benchmark: FFT SP
    • Radeon Vega FE: 885.04
    • Radeon R9 Fury: 550.79
    • 66.7% UP

  • SHOC v2015-11-10
    Target: OpenCL
    Benchmark: MD5 Hash
    • Radeon Vega FE: 16.00
    • Radeon R9 Fury: 9.09
    • 76.0% UP

  • SHOC v2015-11-10
    Target: OpenCL
    Benchmark: MAX SP FLOPS
    • Radeon Vega FE: 12.6538 TFLOPS
    • Radeon R9 Fury: 7.14488 TFLOPS
    • 77.1% UP

  • 理論性能
    • Radeon Vega FE: 13.1 TFLOPS
    • Radeon R9 Fury: 7.17 TFLOPS
    • 82.7% UP

Radeon R9 Furyは第一世代のHBMを使用しており、メモリ帯域は512GB/sと非常に潤沢です。一方でRadeon Vega FEは第二世代のHBM2を使用しているとは言え、バス幅はが2048bitに留まるため、メモリ帯域は483.8GB/sに留まっています。

  • メモリ帯域
    • Radeon Vega FE: 483.8GB/s
    • Radeon R9 Fury: 512GB/s
    • 4.5% DOWN

効率が下がってしまっている点については様々な理由が考えられますが、Radeon R9 Furyのよりも82.7%も理論性能が高いにも関わらず、4.5%メモリ帯域幅が狭いことは一因として考えられるのではないでしょうか。

DarktableではRadeon R9 Furyに敗れる

  • Darktable v2.0.3
    Test: Boat – Acceleration: OpenCL
    • Radeon Vega FE: 3.78秒
    • Radeon R9 Fury: 3.42秒

Darktable v2.0.3にベンチマークにおいてはAMDの過去の製品であるRadeon R9 Furyに敗れています。ベンチマークが取られた中では唯一の実アプリケーションにおけるベンチマークとなっていて、これについてRadeon R9 Furyに敗れるというのは痛いように思います。

ROCm 1.6 + Vegaはいまひとつか

ベンチマーク結果をいくつか見た結果では、ROCm 1.6 + Vegaアーキテクチャはいまひとつ性能が出ていないという印象があります。Radeon R9 Furyに敗れているベンチマークがあり、多くのベンチマークにおいてGeForce 1080Tiに及んでいません。

ROCmがバージョンを重ね、この状況が変わることもあり得ます。今後に期待したいですね。

関連記事

次世代のRadeon 「Navi」がAI専用回路を持つとの噂が浮上

Radeon RX Vegaの56CU版下位モデルは9月登場か

「Project 47」Radeon INSTINCTとEPYCで構成される単精度1PFLOPSのGPGPUサーバー

ソース

http://www.phoronix.com/scan.php?page=news_item&px=Radeon-Vega-FE-More-OpenCL

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)