IBM Power 9はnVidiaのGPUの理想的な司令塔となる

GPGPUへの親和性が高まったPower 9

nVidiaのチップ間通信プロトコルであるNVlink2.0に対応し、GPGPUを構成する際の親和性が高まりました。Power 6でPCIe Gen3だったCPU-GPU間の通信がPower 7でPCIe Gen4に対応しGen3の2倍に、Power 8でNVlink1.0に対応しGen3の5倍に、Power 9でNVlink2.0に対応し7−10倍に伸びています。IBM内でGPGPUなどとの親和性が大きなテーマになっていると見てよいでしょう。

NVlink2.0

レーン辺り最大25GB/sの帯域幅を得られる規格で、Power 9は48レーンまで対応しています。つまり合計の帯域幅は300GB/sと言うことになります。通常のグラフィックボードの規格であるPCIe Gen3のx16は最大で32GB/sなので、これがいかに途方もない帯域幅かわかります。GPGPUでは帯域幅がネックになる場合が多いので、Power 9はGPGPUにおいて理想的な司令塔になれるプロセッサであると言えます。

FPGAなどによる専用プロセッサへの対応も抜かり無し

FPGAとはソフトなハードウエアとも呼ばれる書き換え可能な回路基板です。これに専用の演算回路を書き込むことで科学技術計算を解こうと言う動きは随分昔からありました。無駄が無いので電力効率の良いシステムが作れますし、次世代の計算機として注目している人も居ます。

FPGAは普通は回路の試作品などに使われます。チップにしてからバグが見つかっても修正が効かないので修正の効くFPGAを使おうと言うわけです。しかし前述の通りある処理に対する専用プロセッサを作る用途にも使われます。重力多体問題を解くためのコンピューティングボードGRAPEは特定のモデルでFPGAを使ったボードとして作られ実用化されていました。

Power 9はFPGAやそれを変更不能な回路に落とし込んだASICなどを接続するためのCAPIというポートを備えています。これはどうやら内部的にPCIe Gen4やNVlinkが使われているようで、帯域幅もありますしレイテンシも短いです。

プロセッサ自体の性能も素晴らしい

プロセッサのマルチスレッド化の技術力は恐らくIntelより上でしょう。四倍精度浮動小数点数演算を4つ並列に解けてしまうそうです。これはコア辺りですからサイクル辺りでは12を乗じた48演算が出来ることになります。これは四倍精度での演算なので、倍精度では96演算が可能になることになります。プロセッサとしてもとてつもない能力を秘めていることがわかります。

Add a Comment

メールアドレスの入力は任意です。(公開されることはありません)