― 連載 ―

マルチチップソリューション「Quad SLI」の詳細

 2004年夏,NVIDIAはマルチグラフィックスチップソリューションとして「NVIDIA SLI」(SLI:Scalable Link Interface,以下SLI)を発表。その後,ライバルのATI Technologies(以下ATI)も「CrossFire」という同種のテクノロジーを投入してきたことにより,マルチグラフィックスチップ環境はかなりの盛り上がりを見せている。マルチグラフィックスチップに対応したチップセットの投入も盛んに行われ,これに伴い,2本のPCI Express x16スロットを搭載したマザーボートの価格もリーズナブルになりつつある。

 

 そんなさなか,マルチグラフィックスチップソリューションのテクノロジーで一歩先行くNVIDIAは“新しいSLI”を提案した。それが,2006年5月1日の記事でもお伝えした,4個のグラフィックスチップを同時に動作させる「Quad SLI」(クワッドSLI)システムだ。

 

NVIDIAは2006年3月に行われた,GeForce 7900シリーズ発表前の技術セミナーで,報道関係者に対してQuad SLIのデモンストレーションを行った。画面は「F.E.A.R.」

 

マザーボードと比較すると,あまりにも巨大なQuad SLIカード。1枚の“2in1”カードは2階建て構造になっている

 「4個のグラフィックスチップの同時駆動」と聞くと,4本のPCI Express x16スロットが必要なのかと思ってしまうが,さすがにそうはならない。2個のグラフィックスチップを1枚のカード上に実装し,このカード2枚を,PCI Express x16スロットを2本用意するSLI対応マザーボードに装着して使用する形態だ。
 これまでにも,2個のGeForceを1枚のカードに実装し,1枚のカード上でSLIを実現させるような製品は,「WinFast Duo PX6600 GT TDH Extreme Version」「Extreme N7800GT DUAL/2DHTV/512M」などがあったが,今回のQuad SLIで採用されているカードは,こういった“2in1”に近い。同時に,そういうカードのデザインをNVIDIAがオフィシャルに行ったという視点から見ても,Quad SLIは興味深い。
 もっとも,NVIDIAが用意したのは,厳密には“2個のグラフィックスチップを,メインとサブ,2枚のカードにそれぞれ搭載して,2段重ねにしたもの”だが。

 

GeForce 7900 GX2リファレンスカード。中央と左は,二つに分けたものだ

 

GeForce 7900 GX2

 Quad SLIに対応するグラフィックスチップはGeForce 7900シリーズのみ。世界初のQuad SLI用グラフィックスカードには,「GeForce 7900 GX2」が搭載されている。
 なお,NVIDIAによれば,GeForce 7900シリーズとほぼ同一設計のGeForce 7800にもQuad SLIロジックは内蔵されていたとのことだが,実際に活用されることは今後もないという。

 

 この“2階建てカード”の“1階”と“2階”に実装された2個のGeForce 7900 GX2は,“1階と2階”をつなぐ格好でリンクされる。同時に,“各階”にはSLI用のコネクタが用意されており,従来のSLIでも用意されていたSLIブリッジによって,もう一方の2階建てカードとリンクされるのだ。PCI Express x16コネクタは,カードの片方にしかないにもかかわらず,SLIコネクタが“各階”に用意されているのは,そういうわけである。

 

カードからチップクーラーを取り外してみた。PCI Express x16コネクタを持つほうのカード(左)には,GeForce 7900 GX2とは別にチップが用意されているのが分かるが,これはすぐ下の段落で説明する「X48 PCI-E」というチップだ。また,2枚のカードは写真右のコネクタによって接続されている

 

Quad SLI対応カードにはSLIコネクタが二つずつ用意されており,写真右のように,ブリッジコネクタは段違いに接続する

Quad SLI動作の仕組み

Quad SLIの論理的なブロックダイアグラム

 Quad SLIシステムのブロックダイアグラムは右のとおり。ブロックダイアグラム中,「G71」はGeForce 7900シリーズを,上下の緑色の枠それぞれが1枚の“2in1/2階建てカード”を表している。前述したとおり,現在流通しているのはGeForce 7900 GX2だが,今後,上位モデルが登場する可能性もあるので,本稿では以後,GeForce 7900と表記する。

 

 さて,中央にある「X48 PCI-E」は,PCI Express x16バスと接続されるハブチップのことだ。ハブチップは2基のGeForce 7900とPCI Express x16バスと接続されることから,「16×3=48」という意味合いで,X48 PCI-Eと名付けられている。
 PCI Express x16バスから伝送されてきた描画コマンドや各種3Dデータは,このX48 PCI-Eハブチップを介して,2個のGeForce 7900へ同時発行される仕組みだ。

 

X48 PCI-Eハブチップ

 ちなみに,X48 PCI-Eハブチップ自体はPCI Express x16バスで接続されるため,その意味では“ごく普通のバス帯域幅を持ったPCI Express x16対応グラフィックスカード”である。

 

 ブロックダイアグラム中,各枠を飛び越えて結ばれる2本のラインがあるが,これが前出のSLIブリッジに相当する。相対するGeForce 7900チップとはSLIラインでコミュニケーションを図るという考え方は,これまでのSLIと同じだ。1枚の2in1(2階建て)カードにおいて,カード上にある2個のGeForce 7900が基板上のラインを通じてつながることはすでに述べたが,それもブロックダイアグラムで確認できる。

 

 ただ,よくよく見てみると,ブロックダイアグラム内,対角線上で向かい合うGeForce 7900を連携するためのラインがないことに気づく。具体的には,左上と右下,右上と左下の組み合わせにおいて,である。
 あるグラフィックスチップがシーンをテクスチャにレンダリング(RTT:Render-to-Texture)し,これを別のグラフィックスチップが担当する別のフレーム生成に用いるような場合,後者のグラフィックスチップ側へテクスチャを伝送して整合性を取らなければならない。この問題は従来のSLIでも存在し,SLIではこの問題に対して,「ドライバを介し,PCI Express x16バスを利用して整合性を取る」アプローチをとっていた(SLIブリッジでは,レンダリング結果となるデジタルピクセルデータだけがやり取りされる)。

 

 Quad SLIの場合,X48 PCI-Eハブチップを介して連携するか,PCI Express x16バスを介して連携するのかは明らかになっていないが,これまでのSLIシステムの仕組みを考えれば,後者が有力となる。いずれにせよこうしたケースでは,レイテンシ(遅延)が免れず,状況が頻発するとQuad SLIのパフォーマンスは低下する。SLI,そしてQuad SLIにおいて,最大のパフォーマンス向上を図るアプリケーションでは,この部分の最適化が必要不可欠になるだろう。

Quad SLIがサポートする
4種類のレンダリングモード

 ところで,Quad SLIにおいては,4個のグラフィックスチップによってレンダリングされることになるため,従来のSLIとは違ったレンダリングモードがサポートされる。順に見ていくことにしよう。

 

●4-way AFRモード
 従来のSLIにおけるAFR(Alternate Frame Rendering)モードを4グラフィックスチップ用に拡張したようなレンダリングモードだ。

 

4-way AFRモードの概念図

 概念図では,4個のグラフィックスチップを「GPU0〜3」と表記しているが,「GPU0でフレーム0,GPU1で続くフレーム1,GPU2でフレーム2,GPU3でフレーム3」という感じで,4個のグラフィックスチップがそれぞれ連続する次フレームをレンダリング。各フレームの描画をオーバーラップできた分だけ高速化につながる,というのがこのモードの特徴だ。

 

 4-way AFRでは,頂点処理,ピクセル処理のすべてを完全にオーバーラップできるため,ほぼ理想に近い形での並列レンダリング処理ができることになる。結果として,Quad SLIの全レンダリングモード中,最も高いパフォーマンスを発揮する。
 CPU側で次フレームのレンダリング準備ができれば,グラフィックスチップは次のフレームのレンダリングに取りかかれることになるが,逆にCPUがもたつくとオーバーラップが阻害されパフォーマンスが上がらない。よって,4-way AFRモードでは高速なCPUが欠かせないということになる。

 

 また,前述したような「テクスチャ素材の生成によってフレーム相関が発生し,グラフィックスチップ間でテクスチャデータの整合性を取らなければいけない」ような局面が発生した場合,この処理が間に挟まることになるから,グラフィックスチップのレンダリング オーバーラップは阻害される。これも繰り返しになるが,こういった問題が起こらないようにするためには,Quad SLI(あるいは従来のSLI)を意識したグラフィックスエンジン設計が必要になるのだ。
 例えば,その素材テクスチャ生成をレンダリングパスの始めのほうで行い,パスの終わりのほうで活用するようにできれば,素材テクスチャの整合性同期処理を早期に始めることが可能になり,“被害”を最小限に食い止められるだろう。

 

GPU0とGPU1という2個のグラフィックスチップを例にした,対応策の図解。「RT1」がそのシーンをテクスチャに生成する処理,「T1」がその生成したテクスチャを使用する処理を意味している。GPU0で「RT1」を先にやってしまえばGPU1で早期にその内容の転送に取りかかれるので,オーバーラップ阻害を最小限に留められるという理屈だ

 

 最大パフォーマンスが得られる可能性が高い一方,CPU性能やアプリケーション側の対応がそれなりに求められるのがこのモードの特徴といえる。

 

●4-way SFRモード
 従来のSLIにおけるSFR(Split Frame Rendering)モードを,4グラフィックスチップ用に拡張したようなレンダリングモードだ。
 このモードでは,GPU0/1/2/3という4個のグラフィックスチップが,共同作業を行って,一つのフレームをレンダリングしていく。

 

4-way SFRモードの概要

 最初は,面積的に四等分された領域のレンダリングを各グラフィックスチップがそれぞれ担当するが,1フレームのレンダリングを完了するごとに,「各グラフィックスチップが,レンダリングにどれくらいの時間を要したか」を振り返り,各グラフィックスチップのレンダリング時間が均等になるようにレンダリング面積を調整していくフィードバック処理が行われる。概念図で,GPU0〜3の縦方向の幅が異なるのは,それをイメージしているためだ。

 

 4-way SFRでは,各グラフィックスチップの担当する面積領域の境界付近でジオメトリ処理が反復してしまい,ピクセルレンダリング工程部にしか高速化が望めない。しかし,アプリケーション側が特別な最適化をせずともパフォーマンスアップが見込めるため,互換性面では確実性が高い。
 また,4-way SFRモードでは同一フレームをレンダリングするため,4-way AFRモードのような「テクスチャ素材にフレーム相関が発生して整合性を取らなければいけない」局面が発生しにくいし,発生しても小規模。4-way AFRモードと比べてCPU性能が低くても,それなりにパフォーマンス向上を図れるという特徴もある。

 

●AFR of SFRモード

AFR of SFRモードの概要

 各フレームを2個のグラフィックスチップによるSFRモードでレンダリングする一方,その背後で次のフレームを別のSFRモードでレンダリングしておくという,AFRとSFRの特徴を組み合わせたハイブリッド的な方法が,AFR of SFRモードだ。大局的に見ればAFRモードだが,各フレームはSFRモードでレンダリングする方法,といういい方もできる。

 

 AFRとSFR,双方の長所と短所を受け継いでいるのでなかなか取り扱いが難しそうだが,基本方針としては,これまでの2グラフィックスチップ用SLIのAFRモードに最適化されたアプリケーションに対して,さらなる加速を目論む方法という認識でいいだろう。
 パフォーマンス的には,期待できる向上率が大きい順に4way-AFR,AFR of SFR,4way-SFRといった感じになる。

 

●32X SLI AAモード
 最後に紹介するのが,32X SLI AAモードだ。これは,4個のグラフィックスチップで同一のフレームを同一タイミングでレンダリングするが,各グラフィックスチップにおける,アンチエイリアシングのサンプル点の位置を変化させる(=オフセットを変える)ことで,超高品位アンチエイリアス画面を作り出そうとするもの。1個のGeForce 7900で8xSアンチエイリアシングを行うことで,トータルでは8xS×4=32xS相当のアンチエイリアシング画面が得られるという理屈である。
 この方法では,レンダリング処理のオーバーラップがまったくないため,パフォーマンス的にはGeForce 7900 1個分に留まる。

 

左は4点サンプルMSAA(Multi-Sample Anti-Aliasing,詳細は連載バックナンバーを参照のこと),中央は8点サンプルMSAAの概念図。2個のグラフィックスチップで8点サンプルMSAA(=8x SLI AA)を実現する場合は,右のように,互いにオフセットさせた位置からそれぞれ4点サンプルMSAAを行い,その結果から8点サンプルMSAA相当の映像を作り出せばいい

 

16点サンプルMSAAを実現する方法も同じ(左)。それぞれのグラフィックスチップで8点MSAAを行って,その結果を利用すればいい。そして,この考え方を利用して,4組の16点サンプルMSAAフレームを作り出し,この結果から32点サンプルMSAA相当の映像を作り出すのが,32X SLI AAモードというわけ

Quad SLIはしばらくの間,
PCメーカーからしか入手不可

 対応チップセットは,AMD/Intel製CPU向けを問わず,nForce4 X16,あるいはnForce 590 SLI。ファームウェアなどのアップデートで,市販のマザーボードやグラフィックスカードでも技術的にはQuad SLIを実現可能だそうだが,実際の製品はPC製品としての販売のみになるという。つまり,一般的なグラフィックスカード製品としての,Quad SLIカードは,しばらく登場しないということだ。
 すでに市場では,同じ2in1/2階建て構造のグラフィックスカードとして,GeForce 7950 GX2という製品の登場がささやかれ始めているが,これも,(メーカー製PCに搭載されて登場するときの話は抜きにして)単体販売版は,Quad SLIをサポートしない可能性が高い。

 

 これはなぜか。NVIDIAは,店頭市場(=チャネルマーケット)で市販されない理由の第一として,その消費電力の高さを挙げている。
 GeForce 7900シリーズの最大消費電力はGeForce 7900 GTXで約120W,GeForce 7900 GTで約80W。さらに,グラフィックスチップ1個当たり512MBのグラフィックスメモリが用意されるので,GeForce 7900 GX2の2in1カード1枚の消費電力は最大300W近くなることが予想される。当然,Quad SLIの実現には“もう300W”必要だし,さらにはCPUやメインメモリ,HDDといったほかのデバイスの消費電力も加算されるわけだから,Quad SLI採用PCの消費電力は,相当なものになる可能性があるのだ。
 要するに,この電力をまかなえる電源ユニット,発熱を処理できる冷却構造やケースデザインをユーザーに一任するのは,時期尚早という判断が働いた,というわけである。

 

 ちなみに,GeForce 7900 GX2の動作クロックはコア500MHz相当,メモリ1.2GHz相当(600MHz DDR)とのことで,コア1個当たりでは,GeForce 7900 GTX(コア700MHz,メモリ1.6GHz相当)よりもスペックは下になる。これは,得られるパフォーマンス,消費電力,熱設計,コストなどをトータルに吟味した結果で決められたスペックという。
 ただ,チャネルマーケットへの展開の可能性がまったくないわけではない。マザーボードや電源ユニットのメーカーなどと連携を図りつつ,前向きに検討したいとも述べていたから,今後に期待したい。

Quad SLIの存在意義

 最後に,Quad SLIの存在意義について考えてみたいと思う。

 

 NVIDIAはこれまでどおり「ハイエンドゲーマーのため」というのを第一に挙げるわけだが,もう一つ,1〜2年後の最新グラフィックスカードにおける動作を想定した,次世代ゲームの開発にも適していると説明する。Quad SLIによって実現される,現行ハイエンドクラスの2〜4倍のパフォーマンスは,1〜2年後のハイエンドやミドルクラスグラフィックスチップのパフォーマンスに相当するというのがNVIDIAの主張だ。

 

XHDを訴求するスライド

 そしてさらにNVIDIAは,Quad SLIが“超高解像度”でのゲームプレイを現実のものとするというのも付け加えている。
 「フルHD」(あるいは「フルハイビジョン」)と呼ばれる,1920×1080ドットが,最近の高解像度テレビではホットな話題だが,NVIDIAはそれを超える解像度を「Extreme High Definition」,略して「XHD」と呼び,そうした超高解像度でのゲームプレイにQuad SLIが最適と位置づけている。

 

 NVIDIAは,Quad SLIの発表に合わせて,具体的にDellの「2407WFP」(24インチ,1920×1200ドット)と「3007WFP」(30インチ,2560×1600ドット)といった液晶ディスプレイをXHD対応ディスプレイとして訴求中だ。まぁ,これはQuad SLIシステムがDellから発売されていることと無関係ではないだろう。

 

XHDとは1920×1080ドットを超える解像度を指す……が,あくまでNVIDIA(とDell?)が勝手に決めた定義ではある ただ解像度が上がるだけでなく,ワイドアスペクトのXHDなら,今まで見えていなかった敵機も見えてくるよというスライド。ちょっと強引?

 

 これから,PCゲームを超高解像度でプレイすることに価値が見出せることになれば,この「XHD」というキーワードも現実味を持ってくるようになるかもしれない。
 もっとも,現時点では「Quad SLIのありあまる馬力を開放するための専用コースを造ったに過ぎない」という印象だ。

 

 

タイトル GeForce 7900
開発元 NVIDIA 発売元 NVIDIA
発売日 2006/03/09 価格 製品による
 
動作環境 N/A

Copyright(C)2006 NVIDIA Corporation

【この記事へのリンクはこちら】

http://www.4gamer.net/specials/3de/quad_sli/quad_sli.shtml