エクサスケールの天河三号に搭載されると見られるGPDSPコプロセッサ「Matrix 2000」、天河一号、天河二号と天河シリーズを振り返る

先駆的なGPGPUスパコン天河一号

天河一号は2009年に中国の国防科学技術大学(National University of Defense Technology : 以下NUDT)の開発したスーパーコンピューターで、 理論性能がペタフロップス級である世界初のGPGPUスーパーコンピューターです。当時大規模なスーパーコンピューターにGPGPUを使用する例は少なく、また、理論性能が1PFLOPSを超えるペタフロップス級のスーパーコンピューターをアメリカしか持っていませんでした。

天河一号はAMD製のRadeon HD 4870を使用しており、改修後の天河一A号はNVIDIAのTesla M2050を使用しています。また、インターコネクトにFT-1000と呼ばれる中国独自のストリームプロセッサが使用されていたようです。FTシリーズプロセッサはPhytiumと言う企業が作っていることとなっていますが、どうやらこの企業はNUDTと強いつながりがある企業のようです。

  • 天河一号のノード
    • プロセッサ:Xeon E5540/E5450
    • コプロセッサ:Radeon HD 4870
  • 天河一A号のノード
    • プロセッサ:Xeon E5540/E5450
    • コプロセッサ:Tesla M2050

2009年には既に、GPGPUを用いたスーパーコンピューターを設計してしまえる技術力が中国NUDTにはあったようです。普通のゲーム用のGPUであるRadeon HD 4870で当時最大級となるスーパーコンピューターを制作してしまった点は特筆すべきでしょう。

先駆的なXeon Phiスパコン天河二号

NUDTは続いてXeon Phiを用いたスーパーコンピューターを設計します。2013年に登場した天河二号はTOP500一位を攫っていきます。既に第一世代Xeon Phiを用いたスーパーコンピューターは多数ありましたが、天河二号はその中でも最大規模でした。

スーパーコンピューターを設計する際は通常、必要とされている計算資源はどれほどかなど様々なことを勘案しながら設計されますが、中国は世界トップクラスのスーパーコンピューターをバンバン作っています。軍事力競争の一環としてスーパーコンピューター開発競争が巻き起こっており、冷戦中の米ソの宇宙開発競争を彷彿とさせる状態となっています。天河二号やスプートニクス・ショックのような衝撃を米国に与えたようで、米国はIntelとNVIDIAに、一部製品の中国政府向けの輸出を制限しました。

  • 天河二号のノード
    • プロセッサ:Xeon E5 2692
    • コプロセッサ:Xeon Phi 31S1P

天河二号ではアーキテクチャよりもその規模で魅せてくれました。理論性能が50PFLOPSを超える世界初のスーパーコンピューターが天河二号です。その後理論性能が120PFLOPSを超える神威太湖之光が出現したりと、中国のスーパーコンピューターへの莫大な投資が伺えるニュースが並びました。

中国独自プロセッサの天河三号へ

NUDTの提案するエクサスケールスーパーコンピューター「天河三号」はPhytium社の開発するARMプロセッサと、Matrix 2000というGPDSPコプロセッサを基に設計されるようです。手始めに天河二号にMatrix 2000を載せ、それを天河三号のテストベッドとして運用します。このテストベッドは2017年中には完成する見込みで、天河二A号と呼ばれるようです。GPUやx86系のコプロセッサを用いたスーパーコンピューターを設計してきた天河プロジェクトは、次はDSPに手を付けるようです。

  • 天河二A号のノード
    • プロセッサ:Xeon E5 2692(Intel)
    • コプロセッサ:China Co-Processor(Matrix 2000?)
  • 天河三号のノード
    • プロセッサ:ARMプロセッサ(Phytium)
    • コプロセッサ:GPDSPコプロセッサ(Matrix 2000系?)

Matrix 2000は2015年の時点で発表された、1GHzで理論性能で倍精度2.4TFLOPS、単精度4.8TFLOPSを誇るGPDSPコプロセッサです。1GHzで動作する場合は200Wを消費するようです。このコプロセッサはビッグデータ解析用フレームワークのHadoopやSparkなどにも対応し、また機械学習や統計的分析、ビジネスインテリジェンスなどへの応用を考えて設計しているようです。数学ライブラリやC/Cpp、Fortranなどのコンパイラが用意されるようで、汎用性の高いコプロセッサに仕上がることが予想出来ます。

Matrix 2000

  • 性能
    • DP/SP:2.4/4.8TFLOPS
    • 1GHz,200W
  • 対応予定のフレームワーク
    • Hadoop(ビッグデータ)
    • Spark(ビッグデータ)
  • 目指す用途
    • 機械学習
    • 統計的分析
    • ビジネスインテリジェンス
  • 使えるようにする言語
    • C/Cpp
    • Fortran
  • その他の機能
    • Open MP(並列化)
    • MPI(並列化)
    • 数学ライブラリ

GPDSPの台頭があり得るかもしれない

GPGPUがGPUを一般的な用途(Global Purpose -:GP-)に使用することを指すのに対し、GPDSPはDSP(Digital Signal Processor)を一般的な用途に使用することを指します。GPDSPと言えばSnapdragon 835のDSPが機械学習フレームワークTensor Flowに対応したことが話題ですが、Snapdragonに限らず、ほとんどのスマートフォン向けのSoCにDSPは標準搭載されています。信号処理をこなすDSPは、通信技術の進歩と共に性能を向上させており、GPUと同様に一般的な数値計算への応用が期待されています。

天河プロジェクトは先陣を切ってGPDSPを応用したスーパーコンピューターを設計していますが、今後GPDSPが流行ることはあり得るのでしょうか。スマートフォンが普及し、当たり前のよに高速な移動通信を使用する現在、その可能性は十分にあるでしょう。中国のNUDTが誇る技術は全く侮れるものでは無く、また中国には広大なスーパーコンピューター市場があります。NUDTが素晴らしい出来栄えのGPDSPコプロセッサを作り、天河三号が実績を作れば、中国市場からその人気が爆発する可能性は否めないでしょう。

関連記事

神威太湖之光は確かに面白いが、中国HPC界なら天河に注目すべきだ

中国のPhytium Technologyの64コアARMベースサーバー向けCPU「FT-2000/64」を発表。中国は革新的な企業だらけだ

ソース

https://www.nextplatform.com/2015/07/15/inside-chinas-next-generation-dsp-supercomputer-accelerator/

https://www.top500.org/news/china-will-deploy-exascale-prototype-this-year/

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)