MicrosoftのProject Brainwaveがベールを脱ぐ

リアルタイムAIのためのProject Brainwave

Hot Chip 2017にてMicrosoftのProject Brainwaveのデモが公開され、またそのことがMicrosoft Research Blogにて公開されました。

このシステムはリアルタイムAIのために設計されています。以下に挙げるような用途が想定されているようです。

  • 検索クエリ
  • ビデオ
  • センサー・ストリーム
  • ユーザーとの対話

これらの用途ではレイテンシが低いことが非常に重要となります。

このシステムではMicrosoftのCNTKやGoogleのTensorflowが利用可能で、一般的なフレームワークで作成したモデルを、Project Brainwave向けにコンパイルすることが出来るようです。Microsoftはそのために独自の中間表現を開発しています。

GRUでも性能の出るBrainwaveシステム

Microsoftはパフォーマンスのデモにしばしば用いられるCNNは、計算集約的なアルゴリズムとなっているおり、高いパフォーマンス値を叩き出すのは簡単であるとしています。

Project Brainwaveのデモではサイズの大きなGRUで39.5 TFLOPSを叩き出しました。GRUはCNNと比べてメモリ集約的なアルゴリズムとなっているので、同じ演算量に対してよりメモリの容量や帯域が必要な演算であると考えられます。なおこのデモではms-fp8と呼ばれる8ビットの数表現が使用されているようです。

FPGAを用いてデザインされたシステム

デモにはIntelの最新世代のFPGA製品「Stratix 10」を搭載したPCIeボードが用いられたようです。FPGAはソフトなハードウエアとも呼ばれ、回路を後から書き換えることが可能となっています。

Microsoftはこのことを「ソフトDPU」と言い表し、GoogleのTPUやGraphcoreのIPUなどの「ハードDPU」と呼び両者を対比しています。DPUとはDNN Processing Unitの略で、ディープラーニングに必要なディープ・ニューラル・ネットワークに関する処理を専門に行うプロセッサを表すようです。

このことはMicrosoft Research Blogのスライドの3ページに記載されていますが、そのページによるとディープラーニングに用いられるプロセッサ(シリコン)の現状は以下のようになっているそうです。

  • フレキシビリティ(柔軟性)
    • CPU
    • GPU
    • ソフトDPU(FPGA)
    • ハードDPU
    • ASIC
  • エフィシェンシー(効率性)

ソフトDPU(FPGA)はGPUよりも効率が良く、ハードDPUよりも柔軟性があるという位置づけとなっています。

関連記事

AWSがFPGAを採用する新インスタンスプラン「F1」を発表、クラウドコンピューティングはインフラとなりつつある

MicrosoftのデータセンターでQualcommのCentriq 2400が使用されることが決定

ソース

https://www.microsoft.com/en-us/research/blog/microsoft-unveils-project-brainwave/

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)