レビュー : Quad FX評価システム

デュアル・デュアルコアCPUソリューションはゲームプレイに何かをもたらすのか

Quad FX評価システム

Text by 宮崎真一
2006年11月29日

 

Athlon 64 FX-74搭載の評価システム

 別記事でもお伝えしているように,AMDはコンシューマ向けのデュアルCPU環境「Quad FX」を発表した。
 今回4Gamerでは,このタイミングに合わせて,Quad FXの評価システムを日本AMDから入手。ユニークな仕様のハイエンド向けソリューションで,限りなくワークステーションに近いQuad FXが,果たしてゲーマーに何をもたらすのか,テストを行って明らかにしてみたいと思う。

 

 さて,この評価システムは,Quad FXのローンチマザーボードパートナーであるASUSTeK Computer製のnForce 680a SLIマザーボード「L1N64-SLI WS」を搭載。このデュアルSocket Fボードに,Quad FX対応CPUであるAthlon 64 FX-70シリーズの最上位モデル,「Athlon 64 FX-74/3.0GHz」が2個,そしてPC2-6400 DDR2 SDRAM 1GBモジュールが4枚,「GeForce 7900 GTX」搭載カードが2枚差さっている。メインメモリはQuad FXのサポートする最大容量が用意されている計算だ。

 

評価システムの側板を開けたところ

 今回の評価システムでは,CPUの着脱が許可されていないため,テストはすべてデュアルCPU構成,CPUコア数でいえば4コアでの検証となる。そこで,比較対象としては,直接のライバルとなるIntel製のクアッドコアCPU「Core 2 Extreme QX6700/2.66GHz」を用意して,4コア同士で比較することにした。また,2006年11月時点でデュアルコアCPU最速となる「Core 2 Extreme X6800/2.93GHz」も用意。システムレベルの違いをできる限り少なくするため,Intel製CPUのテストはnForce 680i SLIマザーボードで行うことにしている。

 

 ベンチマークに当たっては,4Gamerのベンチマークレギュレーション2.1に準拠するが,CPU性能を比較するため,グラフィックスカードの性能にスコアが左右されやすい高負荷設定の検証は省略。一方,NVIDIA SLI(以下SLI)構成時に限って,高負荷設定よりも負荷の高い,8xアンチエイリアシングと16x異方性フィルタリングを適用した状態(以下8x AA+16x AF,スペースの都合でグラフ中のみ8x AAと表記)でもテストを行う。
 これは,16レーン×2,8レーン×2のPCI Experss x16スロットを持つnForce 680a SLIにおいて,最良のSLIパフォーマンスを得られるのは16レーン×2ではなく16レーン+8レーンの組み合わせであるというNVIDIAの主張を考慮してのものだ。描画負荷の軽い状態(標準設定)と,非常に高い状態(8x AA+16x AF)の両方で,傾向を見てみようというわけである。

 

 このほかテスト環境は表1のとおり。利用しているForceWare 92.91βは,評価システムに付属していたQuad FX最適化バージョンとなる。テスト環境をなるべく揃えるため,PCI Expressやチップセット間のクロックを上昇させるnForce 680i SLIの機能「Link Boost」は無効化した。
 また細かい話だが,以下スペースの都合で,グラフ内に限って,Athlon 64 FX-74のQuad FXシステム,Core 2 Extreme X6800,Core 2 Extreme QX6700は,順にFX-74 Quad FX,C2E X6800,C2E QX6700と表記する。

 

 

 

マルチスレッド対応タイトルの少ない現状では
1コアの絶対的な性能が物を言う

 

 まずは,シングルグラフィックスカード環境で,主にCPUのパフォーマンスをチェックしてみよう。
 というわけでグラフ1,2は,順に「3DMark06 Build 1.0.2」(以下3DMark06)と「3DMark05 Build 1.2.0」(以下3DMark05)の結果をまとめたものだ。マルチスレッド対応が進んでいる3DMark06では,Core 2 Extreme QX6700に迫る,ほぼ互角といっていいスコアを叩き出すAthlon 64 FX-74×2だが,それほど対応の進んでいない3DMark05で比較すると,Core 2 Extreme X6800に有意な差を付けられているのが分かる。4コアのパフォーマンスを最大限発揮するにはアプリケーション側のマルチスレッド対応が絶対的なカギで,それほど進んでいない場合には,3GHzという動作クロックを持ってしても,Core 2の上位モデルには及ばないという傾向が見て取れよう。

 

 

 

 では,実際のゲームだとどうなのか。「Quake 4」(Version 1.2)のテスト結果をグラフ3にまとめた。Core 2 Extreme QX6700のレビューで用いたForceWare 91.47ほどはマルチスレッドの効果がないようで,材料が少ないため断言はできないものの,ForceWare 92.91βはQuake 4のマルチスレッド最適化とあまり相性がよくないようだ。それにしてもAthlon 64 FX-74の“完敗ぶり”は目立つ。

 

 

 「Half-Life 2: Episode One」や「F.E.A.R.」(Version 1.08)も,Quake 4と同じような傾向を示す(グラフ4,5)。このクラスのCPUを使って1024×768ドットで一人プレイメインのFPSをプレイするケースというのは確かに少ないかもしれないが,それにしても,直接のライバルとなるCore 2 Extreme QX6700に30fps前後置いて行かれているのはちょっと苦しい。

 

 

 

 「GTR 2 - FIA GT Racing Game」(以下GTR2)になると,地力の差はより顕著となる(グラフ6)。60fps出ていれば合格なので,問題ないといえばないのだが,それでも,1920×1200ドットにおいて12fps近く差を付けられているのはいただけない。
 「Lineage II」のテスト結果も,GTR2と同じ傾向だ(グラフ7)。マルチスレッド対応でないゲームでは,1コア当たりの性能の違いが如実に出てしまっているように見える。

 

 

 

 

消費電力の高さは大きなデメリット
冷却能力への要求も高い

 

 TDP 125WのCPUを2個搭載するQuad FXではかなり高い消費電力が予想される。そこで,OS起動後30分間放置した状態を「アイドル時」,MP3エンコードソフトをベースとした,マルチスレッド対応のCPUベンチマークソフト「午後べんち」を30分間連続実行し,CPUに負荷を与え続け,最も消費電力の高かった時点を「高負荷時」として,システム全体の消費電力をチェックしてみた。ワットチェッカーによって計測した結果をまとめたのがグラフ8だ。
 Athlon 64 FX-74では「Cool’n’Quiet」,Intel製CPUでは「Enhanced Intel SpeedStep Technology」(EIST)を有効化できるので,その有効無効でスコアを別に取得してみたが,Quad FXシステムの消費電力の高さは群を抜いている。評価システムには,後述するとおり複数のケースファンが取り付けられているため,その分は割り引いて考える必要があるが――標準で取り付けられているHDDの電源ケーブルは外してあるので,こちらは問題ない――ちょっと差がつきすぎである。
 2個のデュアルコアCPUを一つのパッケージに収めたCore 2 Extreme QX6700でも高負荷時の消費電力は289W,それに対してデュアルCPU構成のQuad FXは451Wで,ほぼ1.5倍。デュアルCPU構成のデメリットが露骨に出てしまったといえるだろう。

 

 

 テスト環境が異なるため,参考程度のスコアになることを覚悟のうえで,グラフ8の各ポイントにおいけるCPUコア温度を,ステータスモニタリングソフトの「Core Temp」で測定してみた。
 結果はグラフ9にまとめたとおりだが,Athlon 64 FX-74のコア温度が予想以上に低いと思った人は少なくないのではなかろうか。

 

評価システムのCPU周り

 その理由は簡単。Tcase 56℃を実現するため,評価システムがかなり強力な冷却機構を搭載しているからだ。マザーボードへの電源(電圧)供給を行うVRM(Voltage Regulator Module)部には冷却ファンが三つ用意され,ケース背面には80mm角ファン×1と120mm角ファン×1,前面には120mm角ファン×1を搭載。さらに,ケース側面にはCPUの数に対応した2系統のダクトが設けられ,CPUクーラーそれぞれに直接外気を送り込むようになっているのである。
 この冷却機構は低いCPUコア温度という形で功を奏しているのだが,一方,騒音はかなりのもの。ケースを閉じた状態で1m離れた位置からでもうるささを感じたほどで,作業しながらテレビを見ようと思っても,テレビの音声は聞こえなかったりした。この条件で電源を投入してからWindowsが起動するまでの動作音を,録音して「こちら」にUpした(5.0MB:29秒,WAVE)ので,興味のある人は聞いてみてほしい。
 2007年1月以降に発売される製品レベルでは騒音対策が施されるはずだが,Quad FXマシンの購入を検討しているなら,静かさは要チェックの項目といえる。

 

 

 

 

SLIの組み合わせでは
かなり興味深い結果に

 

nForce 680a SLIのブロックダイヤグラム

 チップセットの解説記事で説明しているとおり,nForce 680a SLIでは,2個あるAthlon 64 FX-70シリーズの片方にMCP(nForce 680a SLIチップ)が二つともHyperTransportで接続される。イメージは右に示したとおりだが,MCP間は接続されていないこと,そして,MCPごとに16レーンと8レーンのPCI Express x16スロットをサポートしていることが大きな特徴だ。実際,評価システムが搭載するL1N64-SLI WSボードだと,CPUに近いほうから16/8/16/8レーンという順番でスロットが用意されている。
 そして,「NVIDIAは16レーンと8レーンを推奨する」という,冒頭の話に戻るわけだ。16レーン×2(や8レーン×2)の場合,2枚のグラフィックスカードでデータの同期を取るためには,いちいちCPUを介さねばならず,パフォーマンスで不利になることが予想される。そのため,これまでの「16レーン×2が真のSLI」という主張を曲げ,NVIDIAはnForce 680a SLIにおいて16レーンと8レーンの組み合わせを推奨しているのだろう。

 

SLIの設定から,AFRで動作しているか,はたまたSFRに動作になっているかをチェックしながらテストを進めた。これはSFR動作になっている例

 では,本当にNVIDIAの推奨どおりの結果になるのだろうか? 以下,16レーン+8レーンの組み合わせによるSLIを「x16+x8 SLI」,16レーン×2によるSLIを「x16+x16 SLI」と表記して,先ほどまでと同じテストを行ってみる。

 

 グラフ10は3DMark06,グラフ11は3DMark05のテスト結果だが,NVIDIAの主張どおり,x16+x8 SLIが,x16+x16 SLIに対して大きく差を付けているのが分かる。
 ボトルネックが生じたにしては,あまりにもスコアが違いすぎると思った人もいるだろう。今回用いているForceWare 92.91βがQuad FXに最適化が行われていることは先に述べたとおりだが,実は同バージョンでは,アプリケーションの起動時に2枚のグラフィックスカード間でデータ同期を問題なく取れるよう,スケーリング処理のAFRとSFRを自動的に切り替えているのだ。事実,3DMark06/05では,x16+x8 SLIだとすべての解像度でより高いパフォーマンスの得られるAFRでレンダリングが行われたのに対して,x16+x16 SLIでは,1280×1024ドット以上の解像度だとSFRになってしまった。

 

 なお,これはやや余談気味だが,ForceWare 92.91βでは,nForce 680i SLIにおいて1280×1024ドット以上でSLIが有効にならないという不具合があった。Intel製CPU搭載環境でSLIデータを取得していないのはこのためである。

 

 

 

 一方,実際のゲームでは,タイトルごとに大きく傾向が変わる。
 グラフ12のQuake 4では,x16+x16 SLIのほうが,わずかではあるものの,x16+x8 SLIよりスコアが高いのだ。体感では差のないレベルとはいえ,少なくとも3DMark06/05とはまるで毛色の違うグラフになっているのは確かである。
 3DMark06/05ほどデータ量が多いと,CPU経由によるオーバーヘッドはかなりパフォーマンスに影響を及ぼす。しかし,それよりもデータ量の少ない実際のゲームではx16+x16 SLIのほうがパフォーマンスで有利になる場合があるようだ。

 

 

 一方,3DMark06/05と同じような傾向を見せたのがHalf-Life 2: Episode Oneである。ここでは,x16+x16 SLIは,1280×1024ドット以上でSFRに切り替わり,一気にスコアを落としている。言うまでもないことだが,x16+x8 SLIは,1920×1200ドットでもAFRだ。

 

 

 グラフ14はF.E.A.R.のテスト結果だが,明らかに,x16+x16 SLIのスコアが優勢となっている。
 ただし,F.E.A.R.の場合,1280×1024ドット以上のディスプレイ解像度設定でゲームを起動すると,自動的にSFRになってしまうという問題に遭遇。そこで,1024×768ドットのディスプレイ解像度でゲームを起動してから,ゲーム側でゲーム中の解像度を変更すると,すべてAFRで実行されたのだった。テスト結果はx16+x16 SLI有利だが,その結果を生む過程があまりスマートでないことは覚えておく必要がありそうだ。

 

 

 GTR 2 - FIA GT Racing Gameも,なかなか興味深い結果を示した。同タイトルでは,1280×1024ドット以上だと,SFRへと自動的に切り替わったのだが,それでもx16+x16 SLIの優位性が保たれたのである(グラフ15)。扱うデータ量が少ない,比較的軽いゲームでは,帯域の広いx16+x16 SLIのほうが有利なのかもしれない。

 

 

 最後に,CPU負荷の高いゲームであるLineage IIでは,SLI動作にCPUを介さざるを得ないx16+x16 SLIが大きくスコアを落とした。実は,グラフィックス描画負荷が低いこともあって,x16+x16 SLIはテストしたすべての解像度でAFRレンダリングが行われたのだが,SFRに切り替わらなかったとしても,スコアが落ち込むケースはあるようだ。

 

 

 というわけで,いろいろ面白いスコアが出たが,とどのつまり,x16+x16 SLIは安定しない。NVIDIAがx16+x8 SLIを推奨しているのは,パフォーマンスというよりも,安定感が理由ではなかろうか。

 

 ただし,パフォーマンスとは別に,一つ指摘しておく必要がある。右の写真は,NVIDIAの推奨するx16+x8 SLIの例だが,このように,2スロット仕様のグラフィックスカードを利用すると,写真上側のカードは冷却面でかなり不利になる。また,利用できる拡張スロットはPCI Express x16 ×2(16レーンと8レーン各1)になるので,一般的なPCIカードは利用できなくなってしまう。
 x16+x16 SLI構成にすれば,冷却面での不利がかなり解消するうえ,その不利を覚悟すれば,PCIカードが1枚利用可能になる。正直,運用の容易さといえば,こちらのほうが上だ。ASUSTeK Computerがローンチパートナーである以上,発売から少なくともしばらくの間は,LIN64-SLI WSかその派生品がQuad FXシステムには採用されるはずなので,このスロット構成がいきなり変わるとは考えにくい。なかなか悩ましい仕様といえるだろう。

 

x16+x16 SLI構成のイメージ。2スロット仕様のカード×2の周辺が,ずいぶんゆったりした印象になっている

 

 

残念ながらゲーマーには不要
3GHz動作のAthlon 64 FX-60シリーズに期待

 

 ゲームとは関係ないが,一般的なアプリケーションにおける性能をグラフ17に,そしてCPUテストの詳細と別途表2にまとめたので,興味のある人は参考にしてほしい。詳しくは触れないが,一般的なアプリケーションにおいても,Core 2ファミリーに対して優位性を発揮できていないのが分かる。

 

 

Athlon 64 FX-70シリーズへの対応を謳う「CPU-Z 1.38」でチェックしてみると,「model unknown」と出た。実際の製品と微妙にステッピングが異なる可能性はありそうだ

 以上細かく見てきたが,2006年11月末時点において,Quad FXシステムを選択する理由はない。1コア当たりの性能がCore 2より絶対的に低いAthlon 64をベースとしたデュアルCPUシステムをゲーマーがわざわざ選択する必要性は,残念ながら最後まで見つけられなかった。
 Quad FXが対応を謳うクアッドコアCPU×2=8コア環境への先行投資を行いたいというのであれば話は別だが,8コアに対応するゲームが登場するころには,きっと4コア,8コアを実現する環境の選択肢はもっと増えているはず。将来に向けての投資という点でも,“押し”の弱さが感じられてしまうのだ。

 

 むしろAMDには,3GHzやそれ以上のクロックで動作するAthlon 64 FXを,Socket AM2市場に投入してほしい。そう願ってやまない。

 

タイトル Athlon 64
開発元 AMD 発売元 日本AMD
発売日 2003/09/24 価格 モデルによる
 
動作環境 N/A

Copyright 2006 Advanced Micro Devices, Inc.

【この記事へのリンクはこちら】

http://www.4gamer.net/review/quad_fx/quad_fx.shtml