オススメ機能: お気に入り; 記事履歴; ランキング

記事検索
ゲームタイトル/メーカー名検索
詳細な検索へ

ハードウェア: レビュー; テストレポート; インタビュー; ムービー; ドライバ; ベンチマークレギュレーション

AC

アナログ

▼その他 PSV 3DS

NVIDIA RTX，Quadro，Tesla

NVIDIA

NVIDIA RTX，Quadro，Tesla

ニュース（119）
特集（3）
レビュー（1）
ムービー（10）

お気に入りタイトル/ワード

タイトル/ワード名（記事数）

最近記事を読んだタイトル/ワード

タイトル/ワード名（記事数）

週刊連載

Features

発売スケジュール

LINEで4Gamerアカウントを登録

NVIDIA，新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

特集記事一覧

注目のレビュー

注目のムービー

問い合わせ

メディアパートナー

トップ>HARDWARE>GPU>NVIDIA RTX，Quadro，Tesla

2014/11/17 23:00

ニュース

NVIDIA，新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

ライター：米田聡

Tesla K80

　米国のルイジアナ州ニューオーリンズで現地時間2014年11月17日に開幕したHPC関連の国際会議「Super Computing Conference 14」（以下，SC14）に合わせ，NVIDIAから，HPC向けの数値演算アクセラレータの新製品「Tesla K80」が発表になった。また，次世代GPU「Pascal」（パスカル，開発コードネーム）世代で採用される新しいインターコネクト「NVLink」に関するアップデートもあったので，本稿では，発表に先立って実施された電話会議の情報をベースに，その概要をまとめてみたい。

Tesla K80は新型GPUコア「GK210」のデュアル構成

　Tesla K80は，KeplerアーキテクチャのGPUを2基搭載する，PCI Express x16接続のカード型製品だ。NVIDIAの従来製品だと，HPC向けカードのフラグシップは「GK110」コアのGPUが1基搭載された「Tesla K40」だったが，「K」型番の後ろに続く数字が2倍になって，GPUの数が2倍になったというのも，分かりやすい話である。
　NVIDIAででTesla部門のジェネラルマネージャーを務めるSumit Gupta（スミット・グプタ）氏によれば，Tesla K80が持つ倍精度浮動小数点演算のピーク性能は2.9 TFLOPSとのこと。Tesla K40だと同1.43 TFLOPSだったから，性能も2倍以上ということになる。

Tesla K80の概要。倍精度浮動小数点演算性能は2.9 TFLOPSに達するという。ただし，Teslaファミリーの常として，動作クロックは明らかになっていない

　気になるGPUコアは，今回が初登場となる「GK210」。NVIDIAによると，GK210はGK110の改良版で，GK110と比べると，浮動小数点演算や共有メモリ，レジスタファイルのスループットが向上しているという。デュアルGPUカードということで，「GeForce GTX TITAN Z」（以下，GTX TITAN Z）のTesla版ではないかと思っていたのだが，どうやら，そこまで単純な話ではないようだ。

NVIDIAのHPC関連スライドでお馴染み，Xeonとの倍精度浮動小数点演算性能比較

画像集#005のサムネイル/NVIDIA，新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

　スライドにも書かれているとおり，Tesla K80のシェーダプロセッサ「CUDA Core」総数は4992基。つまり，GPU 1基あたり2496基ということになる。GTX TITAN Zでは2880基，GK110のフルスペックを採用していたので，GPUあたりの規模でいうと，Tesla K80に搭載されているGK210は，「Streaming Multiprocessor eXtreme」（SMX）にして2基分だけ小さい計算だ。
　GK210はGK110に改良を加えたものというNVIDIAの説明からするに，GK210とGK110のCUDA Core数はフルスペックだと同じで，PCI SIGによるPCI Express 3.0関連規定「PCIe 225W/300W High Power Card」のスペック上限を満たすため，2基のSMX分，CUDA Coreを無効化したのだろう。
　ちなみに，Tesla K80のTDP（Thermal Design Power，熱設計消費電力）は，（PCI SIGによる規定上限ぴったりの）300Wに抑えられているとGupta氏は説明していた。

　GPUの動作クロックは不明だが，Tesla K80では，GPUの自動クロックアップ機能「GPU Boost」に対応するのが特徴となる。
　Gupta氏は電話会議のなかで「（倍精度浮動小数点演算性能は）低負荷時に1.87 TFLOPS」と述べていたから，ピーク値である2.9 TFLOPSとの間で，動作クロックはかなり積極的に制御されることになりそうだ。GK110を参考として，ざっくり計算してみると，倍精度浮動小数点演算時のブースト最大クロックは875MHz程度になるわけだが，GK210で性能が上がっているとされている以上，クロックはもう少し低いかもしれない。また，単精度浮動小数点演算時には，よりクロックを引き上げている可能性もあるだろう。

　なお，480GB/sとされるメモリバス帯域幅はGPU 1基あたり240GB/s。GTX TITAN Zの同336.5GB/sと比べ，かなり控えめな数字だ。GK210とGK110のメモリバス幅が同じと仮定して逆算すると，Tesla K80のメモリクロックは5000MHzとなる。

Tesla K80を搭載する高密度サーバーの取り扱いには，4社が名乗りを上げている

NVLinkの追加概要が少しだけ明らかに

　2014年3月の「GPU Technology Conference 2014」（以下，GTC 2014）で存在が公表済みのNVLinkには，情報に若干のアップデートが入った。

　簡単にいうと，NVLinkは，2016年の出荷が予定される次世代GPU「Pascal」（パスカル，開発コードネーム）におけるサポートが計画されている，新しいインターコネクトだ。Gupta氏は，「NVLinkにより，アプリケーションレベルでは最大2倍を超える性能向上が得られる」と述べている。

画像集#007のサムネイル/NVIDIA，新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

NVLinkのサポートはPascalから。CPUレベルでNVLinkに対応するのはPowerプロセッサのみで，x86およびARMアーキテクチャのプロセッサの場合，NVLinkはGPU間のインターコネクトのみに使われることになる（※CPUとの接続はPCI Express）。GTC 2014における発表から，とくにアップデートはない

画像集#008のサムネイル/NVIDIA，新型GPUコア「GK210」搭載のHPC向けデュアルGPUカード「Tesla K80」を発表

GPU間のインターコネクトにNVLinkを用いると，アプリケーションレベルでは最大で2倍以上の性能向上が得られるという。ちなみにこの数字は新情報……というわけではなく，NVIDIAのNVLink紹介ページには以前から記載がある

　また，GTCの時点では「PCI Express 3.0比で最大5倍」とだけされていた帯域幅についても，一歩踏み込んだ情報がもたらされた。
　それによると，NVLinkは1レーンあたり20GB/sの帯域幅を持ち，Pascalは4レーンのNVLinkを持つ。4レーンのNVLinkを使って最大4ノードのGPUを結ぶことができ，トポロジーとしてはスター型やリング型に対応できるようである。

Gupta氏が示したNVLinkの接続イメージ（＝トポロジー）。4ノードまでサポートされ，リング型やスター型のネットワークがサポートできるようだ。GPUが4基ある場合，GPU間における帯域幅の対称性が失われるが，これはPascalのNVLinkが4レーンしかないのでやむを得ない

　HPCではインターコネクトが性能を大きく左右する。たとえばIntelはローカルなインターコネクトだけでなくファブリックやスイッチに新技術を導入することを明らかにしていたりする（関連記事），エクサスケールに向けて，今後，HPCの世界では，インターコネクト技術にも大きなスポットライトが当たることになりそうだ。

「NVLink」の動作イメージ

GK210ベースのGeForceが登場する可能性は？

　倍精度浮動小数点数の演算において2.9 TFLOSというTesla K80のスペックは，現時点で最も高い。ただ，Intelが2015年の市場投入を予告している新しいXeon Phi「Knights Landing」（ナイツランディング，開発コードネーム）では，1基あたり最大3 TFLOS以上の性能が実現されると予告されているため，それが出てくると，製品あたりの性能では並ばれるか，逆転を許すことになるだろう。果たして，HPC市場におけるNVIDIAの次なる一手は2016年のPascal待ちとなるのか否か。今後の動きに要注目ということになりそうである。

　また，NVIDIAの製品投入パターンからすると，Tesla K80のGTX TITAN Z版――“GeForce GTX TITAN Z 2”？――というカードが出てくることは十分に考えられる。共有メモリとレジスタファイルのスループット向上はグラフィックス処理にもプラスの効果があると思われるだけに，幾らで登場してくるのか，期待半分，恐怖半分で待ちたいところだ。