神威太湖之光は確かに面白いが、中国HPC界なら天河に注目すべきだ

スクラッチパッドメモリのメニーコアはプログラム次第

神威太湖之光はスクラッチパッドメモリを採用したメニーコアですが、パッと見て思ったのはどうやってLinuxを走らせたんだろうと言うことです。スクラッチパッドメモリとは通常のキャッシュよりもシンプルな構造をしていて、速いのですが、その分複雑なプログラミングが要求されます。一般論として、たとえコアを増やすとしても、それぞれにある程度のパワーが無ければボトルネックが発生してしまいます。よほど均等にタスクを割り振らない限りそれは避けられないでしょう。神威太湖之光上で何かアプリケーションを動かそうと思えばとてつもなく複雑なプログラムが要求されるはずです。

普通のプロセッサでは無い

Linpackはスーパーコンピューターに大規模な行列演算を実行させるものです。これはスーパーコンピューターにやらせる中では相当簡単な部類の演算ですが、神威太湖之光ではLinpackをまともに走らせるだけで相当複雑なプログラムが要求されるでしょう。神威太湖之光はGraph500でも相当高いスコアを記録しています。Graph500はIBMのシステムが強いランキングですが、IBMのどのシステムよりも高いスコアとなっています。

40nmプロセスとはどういうことなのか

神威太湖之光のプロセスが40nmプロセスなのは何故なのでしょうか。これほどの規模のスーパーコンピューターに40nmプロセスを使えば、電力の費用が当然嵩みます。TOP500のスコアが高いので、Green500でも良い結果となっていますが、細かいプロセスを使えばもっと省電力性の高いシステムが出来上がったはずです。ずっとファームウエアでも開発していたのでしょうか。

Graph500では良いスコアを出しているのにHPCGではたったの0.3%

HPCGは実際の計算で使えるような応用的な行列の問題をスーパーコンピューターに解かせるベンチマークです。メモリの帯域が重要になると言われていますが、神威太湖之光は理論性能比でたったの0.3%しかパフォーマンスが出ていません。異常に低いHPCGのスコアはスクラッチパッドの扱いずらさを表しているのかも知れません。

A Look Inside China’s Chart-Topping New Supercomputer

ノイマン型のコンピューターである限り、帯域幅は常に重要な要素となります。ノイマン型コンピューターにおける帯域幅によるボトルネックはノイマン・ボトルネックと呼ばれるほど有名ものです。プロセッサ側に帯域の広いキャッシュを置くことはその解決策なのですがHPCGにおいてはそれが上手く機能していないようです。

天河二号はHPCG1位

天河二号の設計は全ての演算資源がx86アーキテクチャに基づくという極めて汎用性の高いものです。様々な演算への応用を考えて設計しているのでしょう。HPCGのベンチマークテストでは1位であり、きちんと帯域の確保出来るスーパーコンピューターであることが分かります。

天河にはアップグレードの計画があります。Intel Xeon Phiの輸出規制でPhiによるアップグレードは出来ないので、ARM系のプロセッサを使うようです。このあたりの選定も天河が汎用性を重視していることが伺えます。

今のスーパーコンピューター市場では汎用性の低さは致命的

数年もしたらエクサスケールのスーパーコンピューターが出てきます。しかもそのエクサスケールコンピューターは簡単にその性能を引き出せる工夫が盛り込まれているのです。いくら現在TOP500でダントツの性能と持て囃されようとも、実効効率がきちんと出る頃に、次世代のスーパーコンピューターに抜かれていては意味がありません。

中国スパコンで本当に強いのは、きちんと汎用性を重視し、次世代が出る前にきちんと演算効率を得ることが出来る天河の方でしょう。

噂レベルの話ですが、次世代の天河はARMのメニーコアプロセッサが使われる可能性があるようです。

関連記事

中国のPhytium Technologyの64コアARMベースサーバー向けCPU「FT-2000/64」を発表。中国は革新的な企業だらけだ