お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2014/11/17 23:00

ニュース

NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

Tesla K80
画像集#002のサムネイル/NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表
 米国のルイジアナ州ニューオーリンズで現地時間2014年11月17日に開幕したHPC関連の国際会議「Super Computing Conference 14」(以下,SC14)に合わせ,NVIDIAから,HPC向けの数値演算アクセラレータの新製品「Tesla K80」が発表になった。また,次世代GPU「Pascal」(パスカル,開発コードネーム)世代で採用される新しいインターコネクト「NVLink」に関するアップデートもあったので,本稿では,発表に先立って実施された電話会議の情報をベースに,その概要をまとめてみたい。


Tesla K80は新型GPUコア「GK210」のデュアル構成


 Tesla K80は,KeplerアーキテクチャのGPUを2基搭載する,PCI Express x16接続のカード型製品だ。NVIDIAの従来製品だと,HPC向けカードのフラグシップは「GK110」コアのGPUが1基搭載された「Tesla K40」だったが,「K」型番の後ろに続く数字が2倍になって,GPUの数が2倍になったというのも,分かりやすい話である。
 NVIDIAででTesla部門のジェネラルマネージャーを務めるSumit Gupta(スミット・グプタ)氏によれば,Tesla K80が持つ倍精度浮動小数点演算のピーク性能は2.9 TFLOPSとのこと。Tesla K40だと同1.43 TFLOPSだったから,性能も2倍以上ということになる。

Tesla K80の概要。倍精度浮動小数点演算性能は2.9 TFLOPSに達するという。ただし,Teslaファミリーの常として,動作クロックは明らかになっていない
画像集#003のサムネイル/NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

 気になるGPUコアは,今回が初登場となる「GK210」。NVIDIAによると,GK210はGK110の改良版で,GK110と比べると,浮動小数点演算や共有メモリ,レジスタファイルのスループットが向上しているという。デュアルGPUカードということで,「GeForce GTX TITAN Z」(以下,GTX TITAN Z)のTesla版ではないかと思っていたのだが,どうやら,そこまで単純な話ではないようだ。

NVIDIAのHPC関連スライドでお馴染み,Xeonとの倍精度浮動小数点演算性能比較
画像集#004のサムネイル/NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

画像集#005のサムネイル/NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表
 スライドにも書かれているとおり,Tesla K80のシェーダプロセッサ「CUDA Core」総数は4992基。つまり,GPU 1基あたり2496基ということになる。GTX TITAN Zでは2880基,GK110のフルスペックを採用していたので,GPUあたりの規模でいうと,Tesla K80に搭載されているGK210は,「Streaming Multiprocessor eXtreme」(SMX)にして2基分だけ小さい計算だ。
 GK210はGK110に改良を加えたものというNVIDIAの説明からするに,GK210とGK110のCUDA Core数はフルスペックだと同じで,PCI SIGによるPCI Express 3.0関連規定「PCIe 225W/300W High Power Card」のスペック上限を満たすため,2基のSMX分,CUDA Coreを無効化したのだろう。
 ちなみに,Tesla K80のTDP(Thermal Design Power,熱設計消費電力)は,(PCI SIGによる規定上限ぴったりの)300Wに抑えられているとGupta氏は説明していた。

 GPUの動作クロックは不明だが,Tesla K80では,GPUの自動クロックアップ機能「GPU Boost」に対応するのが特徴となる。
 Gupta氏は電話会議のなかで「(倍精度浮動小数点演算性能は)低負荷時に1.87 TFLOPS」と述べていたから,ピーク値である2.9 TFLOPSとの間で,動作クロックはかなり積極的に制御されることになりそうだ。GK110を参考として,ざっくり計算してみると,倍精度浮動小数点演算時のブースト最大クロックは875MHz程度になるわけだが,GK210で性能が上がっているとされている以上,クロックはもう少し低いかもしれない。また,単精度浮動小数点演算時には,よりクロックを引き上げている可能性もあるだろう。

 なお,480GB/sとされるメモリバス帯域幅はGPU 1基あたり240GB/s。GTX TITAN Zの同336.5GB/sと比べ,かなり控えめな数字だ。GK210とGK110のメモリバス幅が同じと仮定して逆算すると,Tesla K80のメモリクロックは5000MHzとなる。

Tesla K80を搭載する高密度サーバーの取り扱いには,4社が名乗りを上げている
画像集#006のサムネイル/NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表


NVLinkの追加概要が少しだけ明らかに


 2014年3月の「GPU Technology Conference 2014」(以下,GTC 2014)で存在が公表済みのNVLinkには,情報に若干のアップデートが入った。

 簡単にいうと,NVLinkは,2016年の出荷が予定される次世代GPU「Pascal」(パスカル,開発コードネーム)におけるサポートが計画されている,新しいインターコネクトだ。Gupta氏は,「NVLinkにより,アプリケーションレベルでは最大2倍を超える性能向上が得られる」と述べている。

画像集#007のサムネイル/NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表
NVLinkのサポートはPascalから。CPUレベルでNVLinkに対応するのはPowerプロセッサのみで,x86およびARMアーキテクチャのプロセッサの場合,NVLinkはGPU間のインターコネクトのみに使われることになる(※CPUとの接続はPCI Express)。GTC 2014における発表から,とくにアップデートはない
画像集#008のサムネイル/NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表
GPU間のインターコネクトにNVLinkを用いると,アプリケーションレベルでは最大で2倍以上の性能向上が得られるという。ちなみにこの数字は新情報……というわけではなく,NVIDIAのNVLink紹介ページには以前から記載がある

 また,GTCの時点では「PCI Express 3.0比で最大5倍」とだけされていた帯域幅についても,一歩踏み込んだ情報がもたらされた。
 それによると,NVLinkは1レーンあたり20GB/sの帯域幅を持ち,Pascalは4レーンのNVLinkを持つ。4レーンのNVLinkを使って最大4ノードのGPUを結ぶことができ,トポロジーとしてはスター型やリング型に対応できるようである。

Gupta氏が示したNVLinkの接続イメージ(=トポロジー)。4ノードまでサポートされ,リング型やスター型のネットワークがサポートできるようだ。GPUが4基ある場合,GPU間における帯域幅の対称性が失われるが,これはPascalのNVLinkが4レーンしかないのでやむを得ない
画像集#009のサムネイル/NVIDIA,新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

 HPCではインターコネクトが性能を大きく左右する。たとえばIntelはローカルなインターコネクトだけでなくファブリックやスイッチに新技術を導入することを明らかにしていたりする(関連記事),エクサスケールに向けて,今後,HPCの世界では,インターコネクト技術にも大きなスポットライトが当たることになりそうだ。



GK210ベースのGeForceが登場する可能性は?


 倍精度浮動小数点数の演算において2.9 TFLOSというTesla K80のスペックは,現時点で最も高い。ただ,Intelが2015年の市場投入を予告している新しいXeon Phi「Knights Landing」(ナイツランディング,開発コードネーム)では,1基あたり最大3 TFLOS以上の性能が実現されると予告されているため,それが出てくると,製品あたりの性能では並ばれるか,逆転を許すことになるだろう。果たして,HPC市場におけるNVIDIAの次なる一手は2016年のPascal待ちとなるのか否か。今後の動きに要注目ということになりそうである。

 また,NVIDIAの製品投入パターンからすると,Tesla K80のGTX TITAN Z版――“GeForce GTX TITAN Z 2”?――というカードが出てくることは十分に考えられる。共有メモリとレジスタファイルのスループット向上はグラフィックス処理にもプラスの効果があると思われるだけに,幾らで登場してくるのか,期待半分,恐怖半分で待ちたいところだ。

NVIDIAのTesla製品情報ページ

  • 関連タイトル:

    NVIDIA RTX,Quadro,Tesla

  • 関連タイトル:

    GeForce GTX 10

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
スペシャルコンテンツ
注目記事ランキング
集計:04月25日〜04月26日