HPCで次に注目すべきなのは、次世代のIntelのXeon PhiでもNVIDIAのTeslaでもなく、エクサスケールを見据えるベンチャーPEZY Computingの「PEZY SC2」だ

全てにおいて高いポテンシャルを持つPEZY

PEZYグループはHPCの全てにおいて高いポテンシャルを持つ企業です。4桁を超えるメニーコアプロセッサを開発するPEZY Computing、冷却液に漬けることでシステムを冷却する液冷サーバーを開発するExaScaler、磁界結合メモリを開発するUltraMemory、機械学習向けの高性能エンジンを開発するDeep Insightsと機械学習をゲノム解析へ応用するInfinite Curation計5社を擁しています。

PEZYグループはグループ内でプロセッサから独自開発し、ワールドクラスのスーパーコンピューターを開発するだけの技術力を有しています。28nmプロセスで製造された旧モデルのPEZY SCnpをベースに構成された理研の菖蒲は、TOP500にランクインしたシステムで競われる省電力ランキングGreen500で2016年6月までトップを保持しました。

旧世代のPEZY SCnpが28nmプロセスでの製造ながらGreen500でトップを保持していたことからわかるように、PEZY Computingは超高性能かつ電力効率が世界最高クラスのプロセッサを作る企業です。PEZY SCnpで作られた理研の菖蒲は、2016年11月のランキングでNVIDIA Tesla P100を搭載したスーパーコンピューターにトップの座を明け渡してしまいましたが、PEZY SCnpが28nmでの製造なのに対してNVIDIA Tesla P100は16nmでの製造です。勝負になっていることの方が奇跡的だと言えるでしょう。

PEZYグループの名前の由来

PEZYグループの名前の由来はPeta、Exa、Zetta、Yottaのそれぞれの頭文字です。エクサスケールを見据え、その先を考えるベンチャーの鏡とも言えるマインドを持った挑戦的な企業です。UltraMemoryによる磁界結合と呼ばれる最新技術を応用した三次元積層メモリの開発と、PEZY Computingによる超メニーコアプロセッサによって、それを実現しようとしています。PEZY SC3では8192コアPEZY SC4では16384コアを実現したいと考えているようです。

「PEZY SC2」と「NVIDIA Tesla P100」の比較

コアが大幅に増えるとされるメニーコアプロセッサのPEZY SC2は、16nmプロセスで製造される予定のPEZY SCシリーズの最新モデルです。既にテープアウト間近と言われている現在(2017/2/1)の最新情報によるとPEZY SC2は以下のようなスペックになるようです。

  • 2048 PEコア + MIPS

  • 倍精度4.1 TFLOPS

  • 単精度8.2 TFLOPS

  • 半精度16.4 TFLOPS

  • 200W

  • LLC(3D積層DRAM)の帯域 2.1TB/s

  • DDR4 2666MHz x4

  • PCIe Gen4 x32

半精度演算への対応は初代PEZY SCには無かったスペックで、機械学習などで注目を浴びたことによる搭載かと思われます。PEZY SC2はディープ・ラーニングの市場も狙っているのでしょうか。また、これだけのスペックを誇りながら200Wの消費電力であることも特筆すべきでしょう。電力効率が凄まじく高いプロセッサになりそうです。PEZY SCnpに勝利したNVIDIAのTesla P100のスペックと比較してみましょう。

  • 3584 CUDAコア

  • 倍精度 4.76 – 5.30 TFLOPS

  • 単精度 9.52 – 10.6 TFLOPS

  • 半精度 19.0 – 21.2 TFLOPS

  • 300W

  • LLC(HMB2)の帯域 720GB/s

  • NVlink

NVIDIA Tesla P100の方が2割強ほど演算能力が高いですが、消費電力は5割高いです。また、LLCとして使用されるメモリの帯域幅には3倍ほどの大きな差が付いています。巨大な演算資源になるほど、キャッシュやメモリの帯域やサイズは重要な要素となりますので、この差は実際の性能に大きく響くでしょう。

2017/2/3追記 LLCは不適当

LLCと言う表現は不適当でした。PEZY SC2の独自の3次元積層DRAMやNVIDIAのHMB2メモリはキャッシュコントローラーによっては管理されていません。誤解を与えるような表現でした。

【訂正】Xeon PhiのKNLのMCDRAMとHBMなどのその他の高帯域スタックド・メモリについての勘違いについての訂正

Xeon Phiと比べるべきプロセッサ

PEZY SC2は、HPCにおいてはNVIDIA TeslaよりもむしろXeon Phiと比べるべきプロセッサだと言えます。PEZY SCではホストとなるCPUのメインメモリに対してPEZY SCのローカルメモリがあると言う構造でしたが、PEZY SC2はMIPSコアを内蔵しMIPSコアとメモリ空間を共有して動作するようです。つまりPEZY SC2は単体でクラスタとして動作すると言うことです。

PEZY SC2はコプロセッサでは無いのです。GPGPU構成などのコプロセッサを使用するシステムでは、CPU-アクセラレータ間の帯域幅の狭さがボトルネックになることがありますが、PEZY SC2はXeon Phiと同じようにそれを省略出来ます。

世界最強のコプロセッサと同等以上の演算能力を持つ単独動作出来るプロセッサ、PEZY SC2は世界のHPCの勢力図を塗り替えるポテンシャルを持っていると言えそうです。

関連記事

今注目すべき日本のベンチャーPEZY computingについて

ヨーロッパのエクサスケールプロジェクト「モンブラン・プロジェクト」がARMアーキテクチャのCavium Thunder X2を使用したプロトタイプの制作を発表

ソース

http://news.mynavi.jp/articles/2017/01/11/pezy2017/

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)