オススメ機能: お気に入り; 記事履歴; ランキング

記事検索
ゲームタイトル/メーカー名検索
詳細な検索へ

ハードウェア: レビュー; テストレポート; インタビュー; ムービー; ドライバ; ベンチマークレギュレーション

AC

アナログ

▼その他 Wii PSV 3DS

GeForce GTX 600

NVIDIA
発表日：2012/03/22

GeForce GTX 600

ニュース（135）
特集（12）
レビュー（18）
テストレポート（5）
ムービー（2）

お気に入りタイトル/ワード

タイトル/ワード名

最近記事を読んだタイトル/ワード

タイトル/ワード名

週刊連載

Features

発売スケジュール

LINEで4Gamerアカウントを登録

NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

特集記事一覧

注目のレビュー

注目のインタビュー

問い合わせ

メディアパートナー

トップ>HARDWARE>GPU>GeForce GTX 600

2012/03/22 22:00

ニュース

NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

ライター：本間文

Kepler第1世代のフラグシップGPUコア，GK104（のダイイメージ）

画像ギャラリー No.003のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

「The fastest, most efficient GPU ever built」（史上最も高速で電力効率のいいGPU）と，NVIDIAはGTX 680を位置づけている

　北米時間2012年3月22日，NVIDIAは，開発コードネーム「Kepler」（ケプラー）として知られてきた新世代アーキテクチャを採用するGPUファミリー「GeForce 600」を発表した。
　発表時点のラインナップは，デスクトップPC市場向けのシングルGPUフラグシップモデル「GeForce GTX 680」（以下，GTX 680）と，ノートPC向けの「GeForce GTX 660M」「GeForce GT 650M」「GeForce GT 640M」の計4製品。デスクトップPC向けモデルは「GK104」，ノートPC向けモデルは「GK107」というコードネームで開発されてきたGPUコアをそれぞれ採用する。

　NVIDIAは，このKeplerアーキテクチャを，「Tesla（＝GT100）から始まるCUDAにおける大きな転換点」と位置づけている。正確を期すと，CUDA（Compute Unified Device Architecture）が提唱されたのはG80コアの時代だが，ともあれ今回のKeplerは，NVIDIAにとって，下記3要素を目指したものという位置づけになっている。

消費電力あたりの性能向上
CUDA Core利用効率の向上
持続的性能の向上

　今回は，北米時間3月8日に米カリフォルニア州サンフランシスコ市で開催された報道関係者向け事前説明会の内容を基に，GeForce 600ファミリーの特徴をまとめてみたい。

SMがSMXへと進化したKeplerアーキテクチャ

SMあたりのCUDA Core数が大幅増

　さて，いきなり結論めいた話から始めると，Keplerアーキテクチャにおける最大の特徴は，NVIDIA製GPUの中核を成す「Streaming Multiprocessor」（ストリーミングマルチプロセッサ，以下 SM）を大幅に見直し，SMを構成するCUDA Coreの数を増やした点にある（表1）。

※いくつか「ん？」と思うスペックもあると思うが，詳細は後ほど。なお，GTX 680がDirectX 11.1に対応するという公式ドキュメントはないが，事前説明会でHenry氏が「対応する」と明言していたため，それを基にしている

画像ギャラリー No.005のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

GeForce GTX 680の基本スペック

　従来のNVIDIA製GPUだと，GF110コアの「GeForce GTX 580」（以下，GTX 580）などで32基，GF114コアの「GeForce GTX 560 Ti」（以下，GTX 560 Ti）などで48基のCUDA CoreによりそれぞれSMを構成していたが，GTX 680ではSMを構成するCUDA Coreの数を一気に192基へと増やし，呼称も「SMX」（Streaming Multiprocessor eXtreme）へと改めた。
　そして，GTX 680はこのSMXを8基搭載する。つまり，CUDA Core数は192×8で1536基だ。Fermi世代の最上位モデルたるGTX 580は32 CUDA Core×16 SMで512基だったため，GTX 580比でCUDA Core数は3倍になったこととなる。

GTX 680の概要（左）とブロック図（右）。8基のSMXを搭載し，1536 CUDA Coreを集積する

こちらはFermi世代のGPUブロック図。GTX 680におけるGPCの構成がGeForce GTX 480＆580を踏襲していると分かる

　また，SMX（SM）あたりのCUDA Core数が従来製品から激増したことを受け，Keplerでは，SMXあたりの「Warp Scheduler※」（ワープスケジューラ）数を従来比2倍の4基とし，さらに，Warp Schedulerあたりの「Dispatch Unit※」（命令発行ユニット）数も2倍の2基とする強化が行われている。FermiのSMだと2 Warp Scheduler，2 Dispatch Unitだったところが，Keplerでは4 Warp Scheduler，8 Dispatch Unitになっているわけだ。

SMXの概要（左）とブロック図（右）。1基あたり192 CUDA Coreを統合するのがSMXの特徴だ。消費電力あたりの性能はFermi世代と比べて2倍になったと謳われる

※「Warp」はNVIDIA製GPUにおける演算実行単位。32スレッド（≒32個のデータ）が1 Warpだ。Warp Schedulerが実行スケジューリングを行い，Dispatch Unitは，そのスケジュールに従ってCUDA CoreやLD/ST（LoaD/STore Unit，ロード/ストアユニット），SFU（Special Function Unit，超越関数ユニット）を起用して，Warp単位で実行を仕掛けていくイメージになる（関連記事）。

GTX 680 GPU。GF110やGF114のようにGPUパッケージ全体がヒートスプレッダで覆われていたりはせず，ある意味，昔ながらの見た目になっている。刻印は**GK104-400-A2**だった

　Fermiアーキテクチャでは，SMが4基集まり，ラスタライザである「Raster Engine」（ラスタエンジン）とセットになって「Graphics Processing Cluster」（グラフィックスプロセッシングクラスタ，以下 GPC）を構成していたのを憶えている人も多いだろう。CUDA Core数が増えたKeplerアーキテクチャでは，GPCを構成するSMXの数は2基とし，GTX 680では，そのGPCを4基搭載する構造になっている。
　各GPCが，8基のROPユニットで一組となったROPパーティションや，L2キャッシュ，メモリインタフェースとクロスバー接続される構造はFermiアーキテクチャと同じだ。

　KeplerアーキテクチャのGPUで採用される製造プロセスはTSMCの28nm。GK104コアのGTX 680におけるトランジスタ数は35.4億で，これはGF110コアのGTX 580における同30億よりも約16.7％多いが，ダイサイズはGF114コアのGTX 560 Tiにおける358mm²比で82％の294mm²に留まっており，ここもGTX 680の大きな特徴と述べることができるだろう。

事前説明会でGeForce GTX 680を紹介するDrew Henry氏（General Manager, GPU Business Unit, NVIDIA）

　もう1つ，Keplerアーキテクチャでは，Fermiアーキテクチャにあった「CUDA Coreをコアクロックの2倍となる『シェーダクロック』で動作させる」という仕組みを廃し，単一クロックで動作させる仕様へ変更している。これにより，GPUのクロックはFermiアーキテクチャ時代のシェーダクロックよりも低く抑えられるようになるわけだが，NVIDIAでデスクトップGPUビジネスを統括するDrew Henry（ドリュー・ヘンリー）ジェネラルマネージャーは，これらの要素が複合的に作用することで「GTX 680が持つ消費電力あたりの性能は，GTX 580比で2倍に高まった」と胸を張っている。
　「GTX 680は，これまで250W超えが当たり前だったハイエンドGPUの常識を打ち破り，TDP（Thermal Design Power，熱設計消費電力）195Wという新しいエンスージアストクラス（≒ハイエンドGPU市場）を作り出す存在だ」（Henry氏）。

画像ギャラリー No.013のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

GTX 680とGTX 580を消費電力あたりの性能で比較したグラフ。純粋な3D性能で比較したグラフではないので，その点は注意が必要だ

画像ギャラリー No.014のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

GTX 680のリファレンスTDPは195Wで，補助電源コネクタ6ピン×2で動作する。195Wという，新しいハイエンド性能を実現したとHenry氏

Jonah Alben氏（Sr.Vice President, GPU Engineering, NVIDIA）

　GTX 680ではトランジスタ数の増加割合に対してCUDA Core数が大きく増えている。そのため，CUDA Coreの簡略化などを疑う向きがあるかもしれないが，NVIDIAでKeplerのアーキテクチャ開発を担当したJonah Alben（ヨナ・アルベン）上級副社長いわく「CUDA CoreやSFUはFermi世代と同じもの。CUDA Coreそのものはシンプルで，トランジスタ数を大幅に増加させたりする要因にはならない」「KeplerのSMXはGF104をベースに拡張した。CUDA Coreそのものに変更はない」とのことだ。

GeForce GTX 560 TiやGeForce GTX 460で用いられたGF114＆GF104アーキテクチャのSM構成（上）とCUDA Coreの拡大（下）。Albel氏は，KeplerのSMXが，GF104をベースにしたものであると説明している

　では，SMXで大幅なメニーコア化を実現した技術的要因は何か。Henry氏とAlben氏は次のように述べている。

　「命令の依存関係を判断したり，スレッドのスケジューリングや管理を行ったりと，コントロールロジックを大幅に簡素化したことで，より多くのCUDA Coreを搭載できるようにした」（Henry氏）

　「Keplerでは，SMX制御の多くをソフトウェア制御にすることで，トランジスタ数を抑えることを可能にしつつ，より複雑かつ効率的なスレッド管理を可能にした」（Alben氏）

　つまり，Fermi世代のSMではハードウェアコントローラを搭載してスケジューリング制御や管理を行っていたところ，Kepler世代ではその処理をCPUに任せることで，より多くのCUDA Coreを効率よく動作させられるようにした，というわけなのだ。

Fermi世代のSM（左）と，Kepler世代のSMX（右）。「Control Logic」（コントロールロジック）を大幅に簡素化して，限られたトランジスタ数でより多くのCUDA Coreを搭載できるようにしたという。SMXのスライドで「2x」とあるのは，「CUDA Core数はGF100＆GF110の32基から192基へと増え，電力あたりの性能が2倍に高まった」という意味

画像ギャラリー No.017のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

KeplerではCUDA Coreもほかの回路と同じクロックで動作するようシングルクロック化を図った。これにより，回路規模を1,8倍に増やしながら消費電力は引き下げられたとされる

画像ギャラリー No.018のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

命令発行のスケジューリングや依存性のチェックにCPUを利用することで，より効率的かつ複雑なCUDA Coreの制御コントロールが可能になったというスライド

Keplerアーキテクチャではテクスチャ性能が大幅に向上したというスライド。100万以上のテクスチャを同時に制御できるようになり，よりリッチなテクスチャ表現が可能になるとのことだ

　スペック面で一点気になるのは，GTX 680のCUDA Core数がGTX 580比で3倍になりながらも，メモリインタフェースが384bitから256bit幅へと縮小していること。これはダイサイズの小ささが影響しているのではないかと思われるが，そこでNVIDIAはGTX 680に1.5GHz動作のGDDR5メモリを採用することで，6Gbps（メモリクロック6GHz相当）の転送レートを実現し，GTX 580とほぼ同じメモリバス帯域幅を確保している。

　もちろん，「CUDA Core数が3倍なのにメモリバス帯域幅は変わらず」である以上，メモリアクセスがボトルネックとなる可能性は否定できない。Alben氏は「Keplerでは，シングルクロック化によって周辺回路の動作クロックが上がっているうえ，L2キャッシュやテクスチャキャッシュなどとのインタフェース帯域幅も従来の倍となっているため，高負荷時の性能が低下しにくい」と述べているが，この点は確認する必要があるだろう。

持続的性能を高める

「GPU Boost」

　Keplerアーキテクチャでは，GPUの性能を引き出す工夫も盛り込まれている。それがGTX 680で採用される「GPU Boost」だ。

GPU Boostのアルゴリズム。GPUおよびカード上に用意されたハードウェアモニタの各種データを読み取り，GPUやメモリの動作周波数と電圧を動的に制御する

　GPU Boostは，一言でまとめるなら，Intelの「Intel Turbo Boost Technology」的な機能。GPUおよびカード上に用意されたハードウェアモニタの数値を100msごとにモニタリングし，GPU負荷が低く，動作電力や温度に余裕がある場合，GPUコアクロックや動作電圧を動的に調整し，より高いクロック＆電圧で動作させるというものだ。そのため，GTX 680では，定格クロックとなる「Base Clock」（ベースクロック）が1006MHzと定められているのとは別に，1058MHzというクロックが「Boost Clock」（ブーストクロック）としてスペック表に記載されている。

GPU Boostにおいては，あまり電力を消費しないゲームタイトルを実行したとき，Power Targetに対する余裕分をクロックアップ動作に割り当てることで，フレームレートの引き上げを図るようになっている

GPU Boostの仕組みを利用し、電力ターゲット値を変更したり、GPUの冷却性を高めるなどすれば、1.2GHz超のオーバークロック動作も可能だと言う

　このGPU Boostは，ユーザーが任意に有効化/無効化を切り替えたりはできず，常に有効となる。そのため，GTX 680では，消費電力の目安となるTDP 195Wとは別に，「Power Target」（電力ターゲット）が170Wとして設定されているのだ。GTX 680はその動作中，負荷時の消費電力が170Wに達していない場合は，Power Targetと温度の閾値の範囲内で自動的にクロックを引き上げるようになっている。
　ちなみに1058MHzというBoost Clockは，「平均的なPC環境における平均的なGPU Boostクロック」という位置づけになる。シリコンとしてはBoost Clockまでの動作が保証されるものの，実際には，動作条件やGPU温度などの要因次第で，1058MHzを上回る，もしくは下回るクロックで動作することもある，というわけだ。

　NVIDIAは，GPU BoostのPower Targetや，Base Clock＆Boost Clockのオフセット値を変更できる開発キットを各グラフィックスカードベンダーへ提供しているため，ユーザーは，自己責任を覚悟すれば，EVGA製の「Precision X」やMSI製の「Afterburner」などといったオーバークロックツールを利用することにより，GPU Boostの挙動をカスタマイズすることも可能だ。

国内で開催された報道関係者向けイベントより，「3DMark 11」実行中のクロックをEVGA製オーバークロックツール「Precision」から追ったところ。Boost Clockを上回る1097MHzまでGPUコアクロックが上がっているのを見て取れる

　ここで1つ注意したいのは，GTX 680で最新世代の3Dゲームタイトルをプレイする場合，常に高めの消費電力で動作するようになるということ。このあたりは別途掲載しているレビュー記事を参照してもらえればと思うが，公称最大消費電力が250Wの「Radeon HD 7970」と比べて，195Wという“数字”の割に，GTX 680の消費電力は下がっていない。
　TDP 195Wという数字はあくまでも目安であり，従来的なグラフィックスカードの概念では捉えられないほどのアーキテクチゃ刷新が入っていることを理解しておくべきだろう。

GPU Boostの仕組みを説明するTom Petersen氏（Director of Technical Marketing, NVIDIA）

　ちなみに，Precisionなどのツールからは，「十分な性能が出るならできるだけ省電力で動かしたい」というニーズに応える設定を行うことも可能だ。NVIDIAでテクニカルマーケティングを担当するTom Petersen（トム・ピーターセン）氏は「Precisionなどのツールで『Frame Rate Target』（フレームレートターゲット）を設定すると，設定したフレームレートを維持するよう動作クロックと動作電圧を調整し，消費電力を抑えられるようになる」と述べている。

さらなる描画品質向上へ

新しいAA技術などを実装

画像ギャラリー No.029のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

GDC 2012より，GTX 680カードを手に持つEpic GamesのMark Rein副社長（右）。左はNVIDIAのTony Tamasi上級副社長

画像ギャラリー No.030のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

GDC 2011におけるSamaritanのデモではGTX 580×3で732Wが必要となり，2500BTU（British Thermal Unit：英熱量。1BTUは1055.06ジュール）の熱量と51dBAの騒音レベルになっていたが，GDC 2012ではGTX 680のシングルカードで動作させていた。「195Wで熱量は660BTU，ノイズも46dBAに低減した」とのこと

画像ギャラリー No.031のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

FXAAは4x MSAAよりも60％も高速に動作するため，GPUへの負荷も低いとされる

　NVIDIAはGDC 2012のタイミングで，Epic Gamesとともに「2011年にはGTX 580の3-way SLIで動かしていた『Samaritan』デモが，Keplerなら1枚で動作する」と発表した（関連記事）。

　ただし前述のとおり，GTX 680の性能は「消費電力あたりで比較したときGTX 580の2倍」である。GTX 580と比べて消費電力が抑えられているため，実性能で2倍という違いは望めず，実際，NVIDIAでテクニカルマーケティングを統括するNick Stam（ニック・スタム）氏は「純然たる3D性能のみの比較だと，GTX 680はGTX 580と比べて1.3倍前後になる」と明らかにしている。

　では，どのようにして「GTX 580×3がKepler×1で！」を実現しているのか。そのカギを握るのがアンチエイリアシング技術の進化だ。

　この点についてHenry氏は，「CUDA Coreを利用してアンチエイリアシングを後処理する『FXAA』（Fast approXimate Anti-Aliasing）をサポートすることで，従来のMSAA（Multi Sampled Anti-Aliasing）と同等の高品質描画を，より低負荷で実現できるようになったことが大きい」と述べる。
　NVIDIAが開発したFXAAは，レンダリング中にアンチエイリアシング処理を施すMSAAとは異なり，GPUコアを使ってレンダリング後のデータからエッジを検出して補正するため，GPUへの負荷が低く済むメリットがある。すでにUnreal Engine 3や「Battlefield 3」などでサポートされているが，NVIDIAはGTX 680の投入に合わせてFXAAをドライバレベルで適用できるようにすることで，すべてのタイトルに対してFXAAを利用可能にする意向だ。

アンチエイリアシングを適用していない状態（左）と，4x MSAA（中央），FXAA（右）の比較。4x MSAAよりもFXAAのほうがジャギーは少ない

FXAAよりも高品質なアンチエイリアシング処理技術と位置づけられるTXAA。TXAA 1では，2x MSAAと同等の負荷で8x MSAAと同等またはやや上のアンチエイリアシング品質を実現するほか，2つのフレームを合成して，よりきめ細やかなポストプロセス処理を施すTXAA 2では、4x MSAAと同等の負荷で8x MSAAを大きく上回る描画品質を実現すると謳われる

　さらにNVIDIAは，FXAAよりも高品位なポストプロセス型アンチエイリアシング技術として「TXAA」（Temporal approXimate Anti-Aliasing）を開発している。TXAAでは，2x MSAA相当のGPU負荷で8x MSAA相当のアンチエイリアシング品質を実現するという「TXAA 1」と，4x MSAA相当の負荷で8x MSAAを大きく上回るアンチエイリアシング品質を実現するとされる「TXAA 2」が用意されるが，「TXAAによって，アンチエイリアシング処理におけるGPU負荷を低減し，その分をフレームレート向上へ振り分けられるようになる」（Henry氏）。

　氏によれば，すでに多くのデベロッパがTXAAに対応したタイトルの開発を始めているとのこと。また，時期や詳細は未公開ながら，Fermi世代以前のGPUでもTXAAはサポートされる予定だという。

アンチエイリアシングを適用していない状態（左）と，8x MSAA（中央），TXAA（右）の比較

　また，描画周りでは，動的にVsyncのオン/オフを切り替える「Adaptive VSync」がGTX 680でサポートされることも述べておきたい。
　Adaptive VSyncは，有効化しておくと，画面表示が引っかかった状態になりそうなほどフレームレートが低下した場合，Vsyncを一時的にオフとし，なるべく滑らかに描画しようと試みるというもの。正直，ゲーム用途での使い道は限られそうだが，場合によっては効果があるかもしれない。

画面表示が引っかかるような状態になりそうなほどフレームレートが落ちた場合，VSyncを一時的にオフとし，滑らかな描画を実現すると言うAdaptive VSync。今後のドライバのアップデートによって，GeForce 500シリーズ以前のGPUで利用できるようになる予定もあるという

標準で4画面対応し，1枚で3画面立体視が可能に

ビデオエンコードエンジンも一新

カード1枚で4画面出力に対応した

　GTX 680では，ディスプレイコントローラが4基搭載され，カード1枚で最大4画面出力が可能になったのもトピックだ。
　リファレンスデザインで用意される出力インタフェースは，Dual-Link DVI-D×1，Dual-Link DVI-I×1，DisplayPort 1.2×1，HDMI 1.4a×1。DVIとDisplayPortを使うと3画面立体視「3D Vision Surround」を利用可能だ（※HDMI出力した“4画面め”に別途デスクトップを表示することは可能）。従来，3D Vision Surroundの利用にはSLI構成が必須だったので，ハードルが大きく下がることになる。
　また，HDMI端子が「Fast HDMI」（HDMI 1.4a 3GHz）に対応し，DiplayPortともども4Kディスプレイ表示（3820×2160ドット/60Hz）が行えるのも特徴といえるだろう。

4画面出力のデモ。ベゼルコレクションの有効/無効はホットキーで変更できるようになっている

　ゲーム画面のマルチディスプレイ出力にあたっては，液晶のベゼルにまたがった部分をどう表示させるか――プレイ中はベゼル部分にもピクセルがあると見なしたほうが自然だが，メニューを表示させるときはベゼル部に表示がかからないようにするほうがよい――が課題となるが，Release 300世代のGeForce Driverでは，ホットキーでベゼルコレクション（Bezel Correction，ベゼル補正）をオン/オフできるようになる。
　また，3画面出力時にWindowsタスクバーを中央のディスプレイへ表示できるようしたり，マルチディスプレイ出力非対応のゲームをプレイするときにはセカンダリ以降のディスプレイに向けた出力をカットして3D性能を1枚のディスプレイのみで最大限発揮できるようにしたりする拡張も行われるとのことだ。

画像ギャラリー No.058のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

3画面表示時にWindowsのタスクバーを中央に表示させるためのデスクトップ管理ソフトが提供される

画像ギャラリー No.059のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

ベゼルコレクションの有効/無効をホットキーで制御できるようになり，必要に応じて切り替え可能に

画像ギャラリー No.060のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

マルチディスプレイ非対応のタイトルでは中央の画面だけ表示させることで最大性能を発揮できるようにする

Keplerアーキテクチャで採用された新世代ビデオエンコードエンジンたるNVENCの概要

　なお，4Gamer的にはあまり重要なポイントではないが，GeForce 600ファミリーでは，ビデオエンコードエンジンが一新されたのもトピックとされているので，念のため紹介しておきたい。
　「NVENC」と呼ばれる新世代ビデオエンコードエンジンは，「Tegra 3に統合されたエンコードエンジンをベースにしており，1080pのエンコードを4〜8倍速で実現できる。また，消費電力も数Wに抑えられるので，CPUを利用したエンコードよりも省電力になる」（Alben氏）とのこと。エンコード品質自体もGeForce 500ファミリーより向上しているという。

フルスペックで2 SMX仕様となるGK107

GPU Boostは無効に

GeForce 600Mシリーズのイメージキャラクターとして，懐かしの「Dawn」（ドーン）が戻ってくると予告された

　最後に，ノートPC向けとなるGeForce 600Mシリーズについても簡単にまとめておこう。
　冒頭でも紹介したとおり，GeForce 600Mシリーズでは，GK107コアを採用した製品が複数ラインナップされる。具体的には表2，3のとおりだが，GK107ではフルスペックでSMXが2基（＝384 CUDA Core）となり，メモリインタフェースは128bit幅。GTX 680でキモとなるGPU Boostは無効になっている。

　なお，NVIDIAはGK107がTSMCの28nmプロセスを採用していることは明らかにしているが，そのトランジスタ数やダイサイズは明らかにしていない。また，GeForce GTX 660MとGeForce GT 650M＆640M以外では，Fermiベースのプロセスシュリンク版やリネーム版がGeForce 600MシリーズのGPUとして用意されるので，その点は注意が必要だ。

画像ギャラリー No.046のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

画像ギャラリー No.047のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

画像ギャラリー No.048のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

Rene Haas氏（General Manager, GeForce Notebook, NVIDIA）

画像ギャラリー No.049のサムネイル画像 / NVIDIA，「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック

Keplerアーキテクチャは，Ultrabookにも外付けGPUによる高品位かつ高性能なグラフィックス機能をもたらすとされる

　NVIDIAでノートPC向けGPUビジネスを統括するRene Haas（ルネ・ハース）ジェネラルマネージャーは，「GeForce 600Mシリーズでは，Keplerアーキテクチャの持つ優れた消費電力あたり性能をGPUの省電力化に向けることで，Ultrabookにも搭載できる外付けGPUを実現した」と説明。実際，AcerはGeForce GT 640Mを搭載したUltrabook「Aspire Timeline Ultra M3」を発表しているが，市場が急拡大しているUltrabookに対応できるだけの省電力性を重視した仕様になっているようだ。

　GPU Boostもサポートされないことで性能面が心配な読者もいると思うが，CPU利用率が低く，システム全体のTDPに余裕がある場合は，その分をGPUのTDPに割り当てることで高性能化を図る機能などが（ノートPCメーカーの選択次第で）サポート可能になるという。

KeplerアーキテクチャのGeForce 600Mシリーズでは，GeForce 500Mシリーズと比べて消費電力あたりの性能が2倍になっているとのこと。2010年の「GeForce GTX 285M」搭載機や2011年の「GeForce GTX 460M」搭載機と同じ3D性能を，「GeForce GT 640M」なら，より少ない消費電力で実現できるとされた

ビッグチップではないGK104

Keplerアーキの詳細が判明するのは5月か

　ついに登場したNVIDIAの新世代GPUアーキテクチャだが，そのデスクトップPC向け第一弾となるGK104は，そのコードネームやトランジスタ数，ダイサイズからも分かるとおり，GeForce 8800 GTX以来の伝統となるフラグシップ・ビッグチップ路線を踏襲していない。また，Warpのスレッド数などにも変更は加えられなかった。

GTC公式Webサイト。GTC 2012は現地時間5月14〜17日開催予定となっている

　Alben氏は「GK104ではまず，Keplerアーキテクチャの実装を最優先してチップサイズやトランジスタ数を決めた」「ソフトウェアの互換性を最優先すると，現在のタイミングでWarpを拡張することは難しいと判断した」と述べている。また氏は「Keplerアーキテクチャの詳細や，GPUコンピューティング機能については，GTC（※GPU Technology Conference 2012，今年5月に米カリフォルニア州San Jose市で開催予定）で明らかにする」としており，Keplerにはまだまだ秘密が隠されているとも言えそうだ。

事前説明会で公開されたGTX 680のキービジュアルだと，電源コネクタは6ピン＋8ピン仕様になっていた。また，GTX 680のリファレンスデザインだと，6ピン×2と8ピン×1に対応するためのパターンが残されている。このことは，同一基板設計をベースにさらなる高スペック版を投入してくる可能性を示唆するものといえるかもしれない

GTX 680と「Radeon HD 7970」の性能比較。競合を上回る性能を実現するとされる

　ちなみに北米市場におけるカードの想定売価は499ドル。市場関係者は，「日本市場における初売り価格は6万円を下回る程度になる」と述べているため，世界市場との間の価格差は，少なくとも最初は小さくないようだ。
　グラフィックスカードベンダー関係者によれば「28nmプロセスの歩留まりや1.5GHz動作するGDDR5メモリの価格がコストを引き上げている」そうで，チップサイズの割にGTX 680カードはかなり高価になるようだが，それでも6万円弱というのはプレミアム（＝価格の上乗せ）感が強い。

　もっとも，GTX 680の供給量は「潤沢とは言わないまでも，想定していたよりは多い」（前述のグラフィックスカードベンダー関係者）とのことなので，競争による価格の押し下げ圧力が早期に生じる可能性はある。どのタイミングで“大本営発表”の499ドル近くに落ち着くか気になるところだ。
　気になる性能は，別途掲載しているレビュー記事をチェックしてもらえればと思う。

4GamerのGeForce GTX 680レビュー記事

GeForce公式情報サイトGeForce.com（英語）

NVIDIAのGeForce製品情報ページ

GTC公式Webサイト（英語）