Facebookがオープンソースのディープラーニング・プラットフォームCaffe2をアナウンス

Facebookがオープンソースのディープラーニング・プラットフォームCaffe2をアナウンス

Facebookの管理する軽量でモジュラーなオープンソースのディープラーニング・フレームワーク「Caffe2」のプロダクション・レディ版が公開されました。より多くのGPUに対応する他、iOSやAndroid、Raspberry Pi上でも学習用のものが動くようです。

ソース

https://caffe2.ai/blog/2017/04/18/caffe2-open-source-announcement.html

Tesla P100 x64で57倍のスループット、NVIDIAはほぼリニアな性能向上を達成

NVIDIAはFacebookと協力し、Caffe2への対応を既に進めているようです。NVIDIA Tesla P100を64基用いた環境で、1基を使用した場合の57倍のスループットを達成し、殆どリニアな性能向上を達成したとしています。

ソース

https://blogs.nvidia.com/blog/2017/04/18/caffe2/

ソースでも触れられているFacebookの「Big Basin」と呼ばれるGPGPUサーバーは、前世代のBig SurからApplied Machine Learning (AML), Facebook AI Research (FAIR)及びインフラストラクチャ・チームから得た有益なフィードバックをもとに改良したサーバーです。NVIDIAの技術が使用され、PCIeよりも高速なインターフェースであるNVLinkでNVIDIAのGPUが相互に接続されているようです。似た構成がNVIDIAのGPGPUサーバー製品「DGX-1」でも使用されているそうです。

ソース

https://code.facebook.com/posts/1835166200089399/introducing-big-basin-our-next-generation-ai-hardware/

Intelも対応を進める

また、IntelもCaffe2への対応を進めているようです。IntelとFacebookの協力によって、Intel製CPUに最適化された数学ライブラリ「Intel MKL(Math Kernel Library)」がCaffe2の中に組み込まれました。

Intel MKLは非常に高速なようです。以下はXeon E5-2699 v4を用いた環境でCaffe2を用いてAlexNetを実装し、数学ライブラリとしてIntel MKLを用いた場合とEigen BLASを用いた場合との推論処理のスループットの比較です。1スレッドの場合と44スレッド(Xeon E5-2699 v4は22C/44T)の場合でそれぞれ比較されています。

OMP_NUM_THREADS=1の場合

batch size Intel® MKL
(images/sec)
Eigen BLAS
(images/sec)
1 28.6 5.1
32 64.6 15.4
64 66.0 15.5
256 67.3 16.2

OMP_NUM_THREADS=44の場合

batch size Intel® MKL
(images/sec)
Eigen BLAS
(images/sec)
1 173.4 5.2
32 1500.2 29.3
64 1596.3 35.3
256 1735.2 44.9

Intel MKLはIntelのCPUであるXeon E5-2699 v4において非常に良い性能が得られていることが分かります。OMP_NUM_THREADS=44、batch size=256の場合、スループットは38.6倍となっています。

ソース

https://software.intel.com/en-us/blogs/2017/04/18/intel-and-facebook-collaborate-to-boost-caffe2-performance-on-intel-cpu-s

ビッグネームが相互に連携して進めるイノベーションCaffe2

IT界のビッグネームであるNVIDIA,Intelにとって、Facebookの主導するオープンソースのディープラーニング・フレームワーク「Caffe2」は無視することのできないもののようです。Facebookが単にSNSを運営しているだけの企業で無いことが伺えます。

またこのことは、プロセッサを設計する企業にとってディープラーニングの流行に伴う計算需要の爆発的な増加は無視できないものであると言い換えることも出来るでしょう。ディープラーニングによってIT界の勢力図はどのように変化していくのでしょうか。

関連記事

中国Baiduのクラウド・コンピューティング・サービスにTesla P40が導入

Udacityが自動運転車のシミュレーションソフトをオープンソース化

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)