― レビュー ―
12時間のテストで見えた「Quad SLI」の可能性と課題
Prime A Galleria64 Quad-SLI
Text by 宮崎真一
2006年5月1日

 

 2006年1月にNVIDIAから発表された「Quad SLI」は,4個のグラフィックスチップを並列動作させて描画パフォーマンスの向上を図る技術だ。2006年3月には採用PCの販売が国内で始まったこともあり,そのパフォーマンスに注目している人は少なくないだろう。
 今回は,約12時間という制限付きながら,ドスパラ(サードウェーブ)製のQuad SLI採用PC「Prime A Galleria64 Quad-SLI」をNVIDIAの日本オフィスでテストできた。そこで今回は,この12時間で見えてきたものについてお届けしたい。

 

NVIDIAの日本オフィスでテストするできたPrime A Galleria64 Quad-SLI。今回は最大2560×1600ドットの解像度に対応したDell製液晶ディスプレイ「3007WFP」のセットで検証できた。見て分かるとおり,Prime A Galleria64 Quad-SLIは側板が開けられた状態でテストしている

 

 

■三つのレンダリング方式を採用するQuad SLI

 

 従来の2枚のグラフィックスカードで構成されるNVIDIA SLI(以下SLI)の場合,3D描画方法としてAFR(Alternate Frame Rendering)とSFR(Split-Frame Rendering)の2種類が用意されている。
 AFRとSFR,それぞれの特徴と有利不利については,SLIの解説記事,そしてATI TechnologiesのデュアルグラフィックスソリューションであるCrossFireの解説記事を参照してほしい。簡単にいうと,AFRとは「奇数フレームと偶数フレームといったように,2個のグラフィックスチップがフレームを交互に描画する方式」のこと。一方のSFRは「1フレームを上と下といったように分割し,2個のグラフィックスチップがそれぞれ処理を行って,最後に強調して描画を行う方式」のことだ。

 

 Quad SLIでも,SLIと同じく,AFRとSFRの組み合わせで描画を行う。ただし,グラフィックスチップが4個になるため,その組み合わせは1パターン増える。具体的には,4個のグラフィックスチップでAFRを行う「4-way AFR」,同じく4個のグラフィックスチップでSFRを行う「4-way SFR」,そして,AFRとSFRを組み合わせる「AFR of SFR」の3種類である。AFR of SFRは「従来のSLI構成が2組あって,まず各組でSFRを行い,SFR×2でフレームごとにAFR処理を行う」と考えると分かりやすいだろう。

 

左から順に4-way AFR,4-way SFR(ここでの表記は「4-SFR」),AFR of SFRの概念を示したスライド

 

 3種類のうち,どれを利用するかは,ForceWareに用意されたプロファイルで決定される。

 

ロードバランサーを表示させつつQuad SLIでQuake 4(Version 1.1β)をプレイしてみると,4-way SFRで描画されているのが分かる

 いくつかのゲームを試したところ,「3DMark05 Build 1.2.0」(以下3DMark05)やほとんどのゲームではAFR of SFRが利用され,「Quake 4」などの一部のゲームでは4-way SFRが用いられていた。また,4-way SFRの場合,従来のSLIで表示されていたロードバランスが画面右にも表示されるようになる。

 

 また,従来のSLIでは16xサンプルが最高だったアンチエイリアシング(以下AA)も,Quad SLIでは最高32xに引き上げられた。これは,それぞれのグラフィックスチップが8xのAA処理を行い,それをオーバーラップすることで実現している。
 実際に,16x AAと32x AA,そしてAAを適用しない標準設定のそれぞれにおいて,「TrackMania Sunrise」の画面で比較してみると,下に挙げた画面からも一目で分かるとおり,斜め線におけるジャギーは,16x AAを適用するとかなりの改善を見せる。そして32x AAでは,ジャギーの改善がさらに進むほか,線が細すぎて,16x AAを適用すると背景に溶け込んでしまっていた部分も,32x AAでは自然に描画されるのだ。それぞれの画像を拡大し,画面全体で比較すると,それほど変わらない印象を受ける16x AAと32x AAだが,ディテールの表現力は,32xで確実にレベルアップしているといっていい。

 

上段左は16x AA,上段右は32x AAを適用した結果。下段はAAを適用していないときの画面だ。いずれも異方性フィルタリングは適用していない。16xと32xで,かなりの違いがあるのは,正直驚きである

 

 

■2枚セットになったQuad SLI対応カード

 

 話は若干前後するが,Quad SLI対応グラフィックスカードそのものについて,ここで言及しておきたい。Prime A Galleria64 Quad-SLIで採用されているのは,Quad SLI対応のNVIDIA製リファレンスカードだ。グラフィックスチップには「GeForce 7900 GX2」を搭載している。
 GeForce 7900 GX2の仕様は表1にまとめたとおりで,シェーダユニット数などはGeForce 7900 GTX/GTと同じものの,動作クロックは異なっている。少なくとも今のところ,GeForce 7900 GX2はQuad SLI専用という位置づけだ。

 

 

GeForce 7900 GX2リファレンスカード。“2枚重ね”構造になっている

 リファレンスカードは,2枚のグラフィックスカードが重なったような構造になっており,それぞれのカードに1個ずつグラフィックスチップを搭載する。Quad SLIは,2セットのGeForce 7900 GX2カード(とあえて呼ぶ)を用意して,各セットの1枚め(便宜的に「マスター側」とする)と2枚め(同じく「スレーブ側」)を,SLIブリッジコネクタで接続することで実現される仕様だ。

 

GeForce 7900 GX2リファレンスカードを“二つ”に分割してみた。2枚はほぼ同じデザインだが,マスター側はチップファンのところに穴が開けられており,エアを効率よく吸い込めるよう配慮されている

 

PCI Express x16インタフェースのすぐ近くにスイッチ用チップが用意されている。赤い丸で囲んである部分がそれだ

 マスター側のカードにはPCI Expressスイッチと見られるチップが搭載されており,スイッチングによって,一つのPCI Express x16バスを二つのGeForce 7900 GX2チップが効率よく利用できるようになっている。
 これまでも,1枚のカードの2個のグラフィックスチップを搭載するカードはいくつか見られた。しかし,それらはいずれも,PCI Express x16バスをPCI Express x8 ×2に分割するというもの。この点,GeForce 7900 GX2カードではPCI Express x16バスが一旦このスイッチチップに接続され,このチップがマスター側とスレーブ側,2個のグラフィックスチップに対して動的にバスの振り分けを行っている。このため,単純に“PCI Express x8化”するよりも,パフォーマンスでは有利というわけだ。

 

写真左は,チップクーラーとカードの隙間から覗くスイッチ用チップ。中央と右は,PCI Express x16でマスター側とスレーブ側をつなぐものと思われるカードと,それを外して単独で撮影したものである

 

 また,マスター側およびスレーブ側の双方にPCI Express用6ピン補助電源が必要となる点も,特徴として挙げておくべきだろう。さまざまに配慮されているとはいえ,マスター側とスレーブ側の間にはどうしても熱がこもりやすく,動作中は,長時間触れているのが不可能なほど熱くなっていた。Prime A Galleria64 Quad-SLIでは,Quad SLI用に特別な冷却機構を用意してはいないので,ユーザー側での対応が必要になる可能性もある。

 

Quad SLI動作には,合計4系統の6ピン電源コネクタが必要。さすがにそんな仕様の電源ユニットはないようで,結果としてPrime A Galleria64 Quad-SLIは,変換ケーブルで対応していた

 

 

■Quad SLIはRelease 85世代でサポート

 

 Quad SLIは「Release 85」世代となる,未公開のForceWare 87.25でサポート。これとnForce4 SLI X16チップセット搭載マザーボード,GeForce 7900 GX2 ×2が動作のための必須環境となる。

 

ForceWareの「ドライバのグローバル設定」から,ドライバのマルチスレッド最適化を明示的にオン/オフできるようになった。「スレッドした最適化」と,日本語がややおかしいのはご愛敬

 ForceWare 87.25では,これまでのForceWareにはなかった項目がいくつか追加されているが,このうち注目したいのは「スレッドした最適化」である。ForceWareはRelease 80世代で,デュアルコアCPUの恩恵を受けるため,ドライバレベルにおける一部処理のマルチスレッド対応を果たしている。その一方で,3Dゲーム側でも独自にマルチスレッド対応するものが少しずつ登場してきているが,NVIDIAによれば,ドライバとゲームのマルチスレッド対応がバッティングして,パフォーマンス低下を引き起こす場合があるとのこと。このときはドライバ側のマルチスレッド最適化を切る必要があり,そのために「スレッドした最適化」項目が用意されたというわけだ。(※Release 80世代では,レジストリを直接書き換えることで対応していた)

 

 さて,このForceWare 87.25は現在のところQuad SLI専用ドライバのようで,比較用に用意したGeForce 7900 GTX搭載グラフィックスカードのテスト環境ではインストールできなかった。そのため,比較対象のテスト環境でドライバのバージョンが異なっている点は理解いただきたい。
 そのほかのテスト環境は表2のとおり。言うまでもないが,GeForce 7900 GX2のテスト環境=Prime A Galleria64 Quad-SLIだ。詳細を知りたい人は,ドスパラの専用ページを参考にしてほしい。
 表2を見れば分かると思うが,HDDが異なる以外,ほぼ同じ環境で測定を行っている。現状の3Dゲームは,メモリにいったんデータを展開してから実行されることが多いため,HDDへのアクセスが逐一行われるわけではない。そのため,長くても数分程度のシーンでパフォーマンスを計測する本誌のベンチマークテストで,HDDの違いが直接的にゲームパフォーマンスへ影響を及ぼすことはまずない。とはいえ,異なるのは確かなので,念のため注記しておく次第である。
 なお,使用したディスプレイの違いにより,GeForce 7900 GTXでは,2560×1600ドット設定時の検証は行っていない。

 

 

 なお以後,ForceWareから垂直同期のみオフに変更した状態を「標準設定」,同じくドライバ側で強制的に16xまたは32xのAAと16倍16xの異方性フィルタリングを適用した状態をそれぞれ「16x AA&16x AF」,「32x AA&16x AF」と呼ぶ。

 

 

■Quad SLIの有用性はゲームによって異なる

 

 というわけで,いよいよお待ちかねのベンチマークテストに移ろう。  グラフ1は標準設定,グラフ2は16x/32x AA&16x AF適用時における,「3DMark05 Build 1.2.0」(以下3DMark05)のテスト結果だ。標準設定の1024×768ドットという,最もSLIの効果を期待できない状態でGeForce 7900 GTXよりもスコアが高い以外,GeForce 7900 GX2のQuad SLIは,GeForce 7900 GTX SLIの後塵を拝している。

 

 

 

 この理由を探るべく,グラフ3〜5で各項目を見てみると,Vertex ShaderでQuad SLIのスコアが大きく落ち込んでいるのが分かる。3DMark05では,AFR of SFRを行っているので,頂点シェーダユニットの性能(≒動作クロック)の違いだけがここまでの差を生んだとは考えにくいので,何か最適化しにくい理由があるのだろう。
 この点についてNVIDIAに確認したところ,同社は「Quad SLIは,超高解像度,あるいは超ハイクオリティな画面でゲームをプレイするためのもので,3DMarkのベンチマークレコードを更新するためのものではない」という(意見としては正しいが,開き直りとも取れる)公式見解を述べている。

 

 

 

 

 続いて,グラフ6,7でQuake 4のテスト結果を見てみよう。今回は高解像度環境で実行すべく,Version 1.1βパッチを適用させている。使用したリプレイデータは,「Over The Edge」というマップで4名によるデスマッチを行ったときのもの。Timedemoから平均フレームレートを計測し,グラフ化している。

 

 Quake 4という実ゲームベンチマークでは,NVIDIAの言うとおり,Quad SLIの優位性が見て取れる。標準設定ではごくわずかだが,16x AA&16x AFの1600×1200および1920×1200ドットでは,Quad SLIのメリットが明確。Quake 4はSLIの恩恵を受けやすいゲームだが,それはQuad SLIになっても変わらないようだ。

 

 ただ,32x AA&16x AFを適用すると,1024×768ドットでも60fps台にまでフレームレートが落ち込む。いくら画面のクオリティが上がっても,平均70fps以下というのは正直いただけない。
 また,高解像度設定時おける16x AA&16x AFのスコアが良いといっても,実際に,ある程度の快適さをもってゲームをプレイするためには,1280×1024ドット以下に解像度を下げる必要があり,その解像度であれば,GeForce 7900 GTXのSLIと平均フレームレートは大して変わらないという現実がある。Quake 4において,Quad SLIにメリットがないとは言わないが,コストパフォーマンスは芳しくないといえる。

 

 

 

 次に「Battlefield 2」である。Battlefield 2では,「Dragon Valley」で実際に行われたコンクエスト(16人×16人対戦)のリプレイデータをスタートから120秒間再生し,「Fraps 2.60」で平均フレームレートを取得した。標準設定(グラフ8)では,これまでのハイエンドグラフィックスカードのテストと同様CPUがボトルネックとなって,フレームレートが向上しない状態になってしまっているため,それを踏まえて16x AA&16x AF設定時のスコアを見てみたい。

 

 

 16x AA&16x AF設定時(グラフ9)で興味深いのは,1280×1024ドット設定時にQuad SLIが90fps弱のスコアを叩き出している点だ。2006年春の時点で,よく売れている液晶ディスプレイは1280×1024ドットの解像度のものが多いわけだが,この解像度において,16x AA&16x AFを適用しつつ,fpsのプレイにほぼ支障のない90fpsに近い平均フレームレートでBattlefield 2をプレイできるというのは,非常に大きなメリットといえる。

 

 

 「TrackMania Sunrise」のスコアに移ろう。ここでは1周53秒程度の「Paradise Island」というマップのリプレイデータを3回連続で実行し,平均フレームレートをBattlefield 2と同様にFraps 2.60で取得した。
 結果はグラフ10,11にまとめたとおりだが,標準設定ではQuad SLIのスコアがSLIよりも低く出た。4Gamerで何度となく繰り返してきているように,TrackMania Sunriseは描画負荷の軽いゲームだが,軽すぎて,4個のグラフィックスチップ間の同期処理がマイナスに作用しているように見て取れる。
 だが,16x AA&16x AF設定時は,このグラフががらりと形を変える。Quad SLIは,1920×1200ドット設定時でも平均70fpsを超え,かなり快適にプレイできるレベルへ達するのだ。十分なフィルタリングを適用しても,“フルHDゲームプレイ”が可能というわけである。

 

 

 

 さらに今回は,NVIDIAがQuad SLIのテスト用として推奨していたいくつかのゲームタイトルのうち「F.E.A.R.」(1.03パッチ適用済み)を用いたベンチマークも行ってみた。
 F.E.A.R.では,「テスト設定」を利用し得られる平均フレームレートを計測し,2回目と3回目のスコアを平均して,それをスコアとしている。グラフ12,13がそれをまとめたものだが,F.E.A.R.では,Quad SLIがその性能を発揮できていないことがはっきりと分かる。

 

 

 

試用したPrime A Galleria64 Quad-SLIは,Thermaltake製の電源ユニット「PurePower 680W」(型番:PURE POWER-680APD)を搭載していた

 最後に,システム全体の消費電力を,ワットチェッカーを用いて計測した結果をグラフ14にまとめた。ここではOS起動後の何も操作していない状態をアイドル時,3DMark05でもっとも負荷が高くなった状態を高負荷時として,それぞれの消費電力を比較している。
 Prime A Galleria64 Quad-SLIは定格680W,対するGeForce 7900 GTX SLIテスト環境は定格600Wと,電源ユニットのスペックが異なる。また,HDD,メモリモジュールも異なるので,厳密な比較にはならないが,高負荷時にQuad SLIが400Wオーバーを記録したのは,十分参考になるのではなかろうか。

 

 

 

ディスプレイの遅さ&最適化不足の先に見える
16x AAでゲームがさくさく動く近未来

 

 NVIDIAは,Quad SLIの売り文句として「XHD」(eXtreme High Definition,超高解像度)を挙げている。今回試用したDellの30インチモデルのような,解像度の非常に高いディスプレイでゲームをするのに最適ですよ,というわけだ。

 

 今回はそれを確かめるべく,2560×1600ドットまで解像度を上げてテストしたが,実は,ベンチマークテストの結果以上に,指摘しておかねばならない点がある。それは,液晶ディスプレイ側の問題,もっといえば,反応速度の遅さだ。今回は時間に限りがあるので,色の再現性など,ディスプレイ全体についての評価は控えるが,3007WFPでは,いわゆる応答速度が速くないため,FPSやレースゲームのテスト時に,残像がかなり気になった。同席していた担当編集も残像を視認していたから,筆者の気のせいというわけではないはずである。

 

 なら3007WFP以外を利用すればいいかというと,現実問題として,2560×1600ドットという解像度を表現できて,かつ3007WFPよりも応答速度に優れたディスプレイを,3007WFP並みの価格(2006年5月1日現在23万円前後)で入手できるかどうかは,極めて疑問だ。
 この点についてNVIDIAは「ゲーマーの多くにとって,反応速度の遅さというトレードオフがあったとしても,XHD環境のほうがより魅力的だ」と述べている。要するに現状では「XHDゲーム環境」は手に入っても,「すべてのゲーマーが満足するXHDゲーム環境」は,少なくともディスプレイ面で手に入らないことになる。

 

 また,Quad SLIの最適化が,SLIほどには進んでいないという点も,マイナスに作用するだろう。
 3DMark05は置いておくとして,F.E.A.R.のように,Quad SLIを利用することでスコアが下がるケースがあるというのは,導入のハードルになる。初期は特定のゲームでしか恩恵を受けられなかったSLIを,十分使用に堪えるものにまで成熟させたNVIDIAだけに,最適化の問題は時間が解決してくれるだろうが,現時点における性能面の信頼度は,SLIの発表直後と同じくらいと考えておいたほうがよさそうだ。

 

 そして,その費用対効果の低さも,指摘しておくべき事柄といえよう。カードの単体販売が行われていないため,もし仮にNVIDIAの推奨する環境――2560×1600ドット表示に対応したディスプレイも含めて――を構築しようとすると,2006年5月1日時点でざっと80万円以上かかる。それでいて,上で挙げたような制約があるのだから,かなり厳しい評価をせざるを得ない。

 

 ただ,Battlefield 2やTrackMania Sunriseで見せた,16x AA適用時の高いパフォーマンスも,Quad SLIの一側面であることも,同時に指摘しておきたい。
 AAを適用していない状態と16x AAでは,ゲームの映像表現に天と地ほどの差がある。その16x AAを適用しても,十分なフレームレートを維持できるポテンシャルを持つという意味で,Quad SLIの将来性については期待が持てそうだ。実際にSLI構成時よりも高いフレームレートを得られるゲームがあり,さらに,高解像度で,高レベルのフィルタリングを適用しても“ゲームになる”可能性を示した点で,Quad SLIには相応の価値があるといっていいだろう。

 

 ゲーマーとして,今後の展開には注意を払っておきたい。

 

タイトル GeForce 7900
開発元 NVIDIA 発売元 NVIDIA
発売日 2006/03/09 価格 製品による
 
動作環境 N/A

Copyright(C)2006 NVIDIA Corporation

【この記事へのリンクはこちら】

http://www.4gamer.net/review/quad_sli/quad_sli.shtml