2048bitのベクトル化をサポートするARMと富士通の開発したSVEはARMプロセッサがGPUを超えることを可能にする

64コア2GHz駆動で120WのメニーコアCPUで「FT-2000」で試算

このFT-2000は512GFLOPSを公称していますが、これはSIMD拡張のNeon 128bitを単精度32bit演算で埋めた場合を計算した値かと思われます。(128/32) x 64 x 2.0 x 10^9で512GFLOPSとなります。こんな空論のような理論値の計算をしているので、このCPUの演算能力はむしろGPUの計算能力と比べるべきものでしょう。CUDAコアよりも扱い易いくらいの話で、x86のプロセッサと比べるべきものでは無いです。

GPUのようなものだと考えると120Wで512GFLOPSは少ないように感じます。750tiは60Wで1.3TFLOPS出てしまっているので、二枚並列に繋いで理論値2.6TFLOPSだとして、たった20%の実行効率で512GFLOPSを超えてしまいます。

しかしもしもこれがSVEに対応していたとしたら演算能力の理論値は単精度で8TFLOPS出る計算になります。120Wで8TFLOPSと言うことはワット辺り68.27GFLOPSとなるわけです。こんな数値を達成しているコプロセッサボードは見たことがありません。

当然メモリ帯域も足りませんし、そもそもそんな高度なベクトル化を実際に出来るわけが無いので実行効率は下がると思いますが、GPU以上に効率的な演算資源が現実的になってきました。そしてFT-2000は28nmプロセスです。これが現行のGPUと同じプロセスで作られればもっと電力効率は上がるでしょう。SVEはコプロセッサやサーバー向けCPUの市場を切り開くかも知れません。

関連記事

ポスト京に向けて動く富士通、ポスト京につかわれるARM拡張命令はSVEと言うらしい

中国のPhytium Technologyの64コアARMベースサーバー向けCPU「FT-2000/64」を発表。中国は革新的な企業だらけだ

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)