― 連載 ―

PC向け世界初となる統合型シェーダ採用GPU「GeForce 8800」のポイントをブロックダイアグラムから探る

 1 2 3   

HDRバッファに対するアンチエイリアシング&
4x AA相当の負荷で16x AAが可能に

 ROPユニットはブロックダイアグラムの最下段にあった一群だが,一つ一つは下に示したような構造になっている。まあ,GeForce 7からそのままである。

 

左はGeForce 8800 GTX,右はGeForce 7900 GTXのROPユニットを示したブロックダイアグラム

 

 前のページでも説明したとおり,各64bit幅のメモリパーティションはGeForce 8800 GTXで6。GeForce 7900 GTXより2パーティション分増加していると考えていい。だから総メモリバス幅もその分増えているわけだ。
 なお,各メモリパーティションはクロスバー接続されており,ATI製GPUの一部がサポートする,メモリバス設計の複雑性低減を目的としたリングバスは採用していない。

 

 1パーティションあたりのROPユニット数は16基。GeForce 8800 GTXだと,16基×6パーティションで,計96基持つ計算になる。カラーとZ値の同時出力でクロック当たり96サンプル(≒ピクセル),Z値のみの出力では192サンプルまで可能だ。
 とはいえ,クロック当たりの出力サンプル数とグラフィックスメモリバス幅のバランスを考えると,1クロックで96サンプルやら192サンプルやらが可能とは思えない。実際のメモリ出力時には,書き出しキューに溜めておくような形になると推察される。

 

 ちなみにNVIDIAは,「メモリ帯域を有効利用するため,カラーとZ値については新しい圧縮技術を採用し,帯域利用率がGeForce 7900の2倍に向上した」と説明している。クロック当たり96サンプル(カラー&Z),あるいは192サンプル(Zのみ)の出力は無理だとしても,効率はかなりよくなったのだろう。

 

 もう一つ,開発者はもちろん,ゲーマーやベンチマーカーにとっても朗報なのは,HDRバッファ(FPバッファ)に対するアンチエイリアシング処理がGeForce 8800シリーズでサポートされた点だ。
 FPバッファのアンチエイリアシング(以下AA)は,これまでRadeopn X1000シリーズでしか適用できず,NVIDIAは「GeForceだと3DMark06でアンチエイリアシング有効時のスコアを取得できない」という屈辱を味合わされてきた。この負い目は,ついにGeForce 8800シリーズで解消されたわけである。

 

 GeForce 8800シリーズではFP16-64bitバッファ,FP32-128bitバッファの双方に対してAAを適用可能。また,これまではNVIDIA SLI時にしか利用できなかった16x(16点サンプル)AAも,マルチサンプルAAにおいてシングルカード動作時にも適用可能となっている。

 

CSAA技法により,16x AAを高速かつ“省メモリ”で実現可能と謳う

 AAといえば,GeForce 8800シリーズにおいて,新手法「Coverage Sampled Antialiasing」(CSAA)技法を実装したこともトピックだ。
 これは,サブピクセルのカラーやZ値を圧縮して持つことでサンプル数を低減。帯域を節約して高品位アンチエイリアス映像を生成しようというユニークなもの。4x AA相当のグラフィックスメモリ消費量で16x AA品質を提供できるという。8x AA相当の負荷で,より高品位な16x AA「16xQ AA」を実現すると謳う,ハイクオリティ版のCSAAも「NVIDIAコントロールパネル」から選択できる。

 

「F.E.A.R.」の1シーン。左上のスライドにおいて,丸く囲んだ部分に注目してほしい。右上のスライドは4x AA適用時で,左下のスライドは「グラフィックスメモリ占有量が4xのときと変わらない」(NVIDIA)CSAAを利用した16x AAだ。クオリティは確実に向上しているのが分かる。なお,右下のスライドは,グラフィックスメモリ占有量を左下の状態の倍,8x相当にしたハイクオリティ版の16xQ AAである

 

 このROPユニット構造と,この構造が提供する多様なフィルタリング処理の仕組みをひっくるめて,NVIDIAは「Lumenex Engine」(ルミネックスエンジン)と命名している。

 

Lumenex Engineと命名されたのは,ブロックダイアグラムの下側である

そのほかの特徴〜意外に低い消費電力と
フル10bit化されたディスプレイエンジン

GeForce 8800 GTXリファレンスカードを持つDavid Kirk(デビッド・カーク)氏(Chief Scientist, NVIDIA)

 プロセスルールがGeForce 7900 GTXと同じ90nm。一方でトランジスタ数が2.5倍になった以上,さぞかし消費電力も凄いのではないかと思いきや,公称スペックとしては意外にも(予想よりは)低めに抑えられているようだ。

 

 NVIDIAが公開したスライドを下に並べたが,これらによれば,GeForce 8800 GTXの平均消費電力はGeForce 7900 GTXの1.5倍増し程度。「Radeon X1900 XTX」と同程度だ。
 その秘密についてNVIDIAは公開していないが,チップ内の電力ドメインを最適化し,同時に徹底した電力制御行い,可能な限り消費電力を抑えているという。同プロセスルールで,規模が2.5倍となったプロセッサで消費電力が1.5倍に抑えられたとすれば,これはかなり凄い。

 

パフォーマンス(左)と消費電力(中央)のデータ。グラフのバーは左からRadeon X1900 XTX,GeForce 7950 GX2,GeForce 8800 GTXとなる。右のスライドは平均消費電力を示したもので,NVIDIAはこれを根拠に「Radeon X1900 XTXと同等」と言っている

 

 グラフィックスメモリの内容を実際にディスプレイコネクタへ出力させるディスプレイエンジンについては,地味ながら若干の拡張が見られる。それは,ガンマ処理,色補正処理,解像度変換,RAMDACなどがすべて10bit精度化されたこと。
 一方,GeForce 7シリーズに引き続き搭載するプログラマブルビデオプロセッサ(PVP)だが,こちらはハードウェア的な見地からすると,とくに変更なし。なお,PVPによって実現されるビデオ高画質化技術「PureVideo」については,その高解像度テレビ(HDTV,あるいはハイビジョンともいう)対応版である「PureVideo HD」フルサポートという触れ込みがなされている。

 

PureVideo機能を提供するPVPそのものは,とくに変わっていない ディスプレイ出力エンジンはフル10bit化された

SLIは「SLI2」になる?
3枚以上,異なる型番のGPUによるSLIの可能性

 1ページめで紹介したとおり,GeForce 8800 GTXではSLIコネクタが二つ用意されている。2枚のグラフィックスカードを用いたSLIでは,これまでどおり1系統のSLIブリッジがあれば動作するだけに,上位モデルにだけ用意された二つの端子は意味深だ。

 

分かりやすくするため,GeForce 8800 GTX(左)とGeForce 8800 GTS(右)のGPUクーラーを“剥いて”みた。GeForce 8800 GTXにだけ,2系統分のSLIコネクタが用意されている

 

 このナゾについて,筆者は「GeForce 8ファミリーにおいて,NVIDIAは第2世代SLI『SLI2』(仮名)の導入を計画している」という情報を掴んでいる。
 詳細は不明だが,SLIコネクタが2系統ある以上,3枚以上のグラフィックスカードをブリッジでカスケード接続できるようにする可能性が高い。
 統合型シェーダアーキテクチャとなり,各GPU内のThread Processorが相互通信して連携できるようであれば,例えばGeForce 8800 GTX×2とGeForce 8800 GTS×1といった,異なるGPUを搭載した複数枚によるSLIも,ぐっと現実味を帯びてくるはずだ。

 

テクニカルガイダンスの会場にあった,nForce 680i SLIベースのデモ機。GeForce 8800 GTXがSLI構成で動いていたが,そのSLIコネクタは全長9cmもあった

 ちなみに,公式な新情報としては,SLIブリッジの長さにバリエーションが追加されることが明らかになっている。

 

 これまでSLIブリッジは,2スロットか,長くても3スロット分の長さしかなかったが,もっと長いものが提供されるという。
 いうまでもなく,これはより離れたPCI Express x16スロットに接続された2枚のカードを結ぶため。ちなみにNVIDIAの関係者はその理由として,「GeForce 8800の排熱機構を確実に動作させるためには,2スロット占有カードの距離を離す必要があった」と述べている。

とにもかくにもWindows Vistaがカギ

 GeForce 8800シリーズはDirectX 10世代のSM4.0対応GPUとして一番乗りを果たしたわけだが,課題がないわけではない。それは,DirectX 10やSM4.0といったテクノロジーが,Windows Vista上でしか享受できない点だ。待望のジオメトリシェーダはDirectX 10でないと利用できないため,いきおい,ジオメトリシェーダを駆使したグラフィックスはWindows Vista環境でしか楽しめないのである。
 現在,ハイエンドクラスのGPUを利用しており,次世代グラフィックスが気になるタイプの3Dゲーマーにとって,GeForce 8800シリーズは,Windows Vistaとセットで導入するのが正解かもしれない。

 

 一方,Windows XP環境でDirectX 9世代のゲームパフォーマンスを求めるのであれば,統合シェーダアーキテクチャによって高効率でシェーダが駆動されるため,GeForce 7900 GTXを大きく上回るパフォーマンスを享受できる。具体的なところはレビュー記事を参照してほしいが,当面は高速なDirectX 9対応GPUとして利用し,DirectX 10世代のアプリケーションが出そろったタイミングでWindows Vistaに移行するというのも一つの手だ。もっともこの場合は,「DirectX 10世代のGPUが出揃うころには,コスト面でより手軽なGPUや,より高速なGPUが登場している可能性がある」というリスクを負うことになるのも確かだが……。

 

 さて最後に,やはり読者が気になるのは,なんといってもATIの動向だろう。
 ATIのDirectX 10世代の新GPU,開発コードネーム「R600」だが,65nmプロセスルールを採用することが関係者のリークによって明らかになってきている。そして,新プロセス採用の影響かAMDによるATI買収の余波か,スケジュールは若干遅れ気味のようだ。もっとも,コンシューマ向けWindows Vistaの発売から大きく遅れることはあり得ない。

 

 Windows Vista世代のグラフィックスカードを探している人は,R600の登場まで待って,GeForce 8800と比較検討するのもアリだろう。

 

 1 2 3   

 

タイトル GeForce 8800
開発元 NVIDIA 発売元 NVIDIA
発売日 2006/11/09 価格 製品による
 
動作環境 N/A

Copyright(C)2006 NVIDIA Corporation

【この記事へのリンクはこちら】

http://www.4gamer.net/specials/3de/geforce_8800/geforce_8800_003.shtml