― 連載 ―

ATI,48ピクセルシェーダのRadeon X1900シリーズを発表

Radeon X1900シリーズの事前発表会で技術プレゼンテーションを行ったATIのディスクリートデスクトップグラフィックスグループ プロダクトマネージャーのDaniel Taranovsky(ダニエル・タラノフスキー)氏

 ATI Technologies(以下ATI)は2006年1月24日23時,新型のハイエンド向けグラフィックスチップ「Radeon X1900」を発表した。ATIのハイエンドといえば,これまでは2005年10月に発表された「Radeon X1800」だったわけだが,それからわずか4か月足らずという異例の短いスパンで,後継製品が発表されたことになる。しかも,発表から発売まで約1か月の間があったRadeon X1800シリーズに対し,Radeon 1900シリーズは搭載カードが即日出荷開始。秋葉原の店頭では発表前の段階で販売が始まっていたほどだ。
 ベンチマークテスト結果は別記事を参照してもらうとして,本稿では,一世代前の製品からほとんど間を空けずに登場した,この新型Radeonのスペック面にスポットライトを当ててみることにしよう。

Radeon X1900 XTのロゴと搭載カードのイメージ。搭載カードのイメージは,Radeon X1800とほとんど変わっていない

トランジスタ数6300万増&消費電力50W増の
「ビッグ」マイナーチェンジ

 Radeon X1900シリーズは開発コードネーム「R580」と呼ばれていたものだ。Radeon X1800シリーズのそれが「R520」だったことからも分かるように,Radeon X1900シリーズはR500ファミリーの最新版,もっといえばRadeon X1800シリーズのリファイン版という位置づけになる。

 主なスペックは表1にまとめたが,製造プロセスは90nmで,総トランジスタ数は3億8400万。Radeon X1800と比べると,製造プロセスは同じで,総トランジスタ数は6300万増ということになる。
 製造プロセスをシュリンクさせずにトランジスタ規模を拡大したため,消費電力はもちろん増大している。ATIの発表によれば,高負荷な3Dアプリケーション実行時に,消費電力はRadeon X1800シリーズの100W前後に対して40〜50W増の約150Wとなるという。

※フィルレートはROPユニットの個数とコアクロックに依存する。逆にいえば,シェーダの個数には依存しないので,Radeon X1900 XTとRadeon X1800 XTのフィルレートは同一になる。また,価格は2006年1月24日時点で販売を確認できる(た)ものは日本円,そうでないものは米ドル建ての想定価格で表記した

 今回発表されたRadeon X1900シリーズは,表1で示したように,通常モデルとなる「Radeon X1900 XT」と,最上位のプレミアムモデルとなる「Radeon X1900 XTX」が用意される。また,肝心要のテレビチューナ周りのスペックが日本市場向けでないため,国内の正式発売予定がない「All-in-Wonder Radeon X1900」も,コア500MHz,メモリ1GHz相当という動作クロックで,北米市場向けに発表された。3モデルの違いは動作クロックのみで,機能的にはまったく同一だ。
 なお,24日の段階では,XL型番の下位モデルやAGP版は発表されていない。また,Radeon X1800シリーズは今後も継続販売される予定となっている。

Radeon X1900 XTにCrossFire対応機能を加えて提供されるRadeon X1900 CrossFire Editionは,カードの参考価格がRadeon X1900 XTXよりも安価に設定されている

 また,当然のことながら,ATI独自のデュアルグラフィックスカードソリューションである「CrossFire」に対応する。
 ただ,今回用意される「Radeon X1900 CrossFire Edition」は,Radeon X1900 XTベース。動作クロックも同じで,“Radeon X1900 XTX CrossFire Edition”は用意されない。これは,これまでのCrossFire Editionのルールから外れることになるわけだが,その理由は「性能の高いほうが低いほうに合わせてデュアルグラフィックスカード動作する」という制約が外れたためのようだ。
 Taranovsky氏によると,Radeon X1900のCrossFire動作においては,Radeon X1900 XTXをスレーブにするほうが,Radeon X1900 XTをスレーブにするときよりも,1〜2%,パフォーマンスが向上するとのこと。同氏は「Radeon X1900 XTXとRadeon X1900 XTの動作クロック差ほど,CrossFire時のパフォーマンスに差は出ない。それなら,価格の低いRadeon X1900 XTをベースにするほうが,コスト面で有利だ。CrossFireによって,シングルカード時よりも大きくパフォーマンスが向上するという意味では,どちらも変わらないわけだから」と説明する。

都内のホテルで行われた事前発表会では,Radeon X1900 CrossFire Editionを利用したCrossFire動作デモ機が公開された 事前発表会で配布された資料には,Radeon X1900 XLのロゴマークやチップイメージが入っていた。ユニット数を減らした下位モデルがいずれ登場しそうな気配である

48基に大増強された
ピクセルシェーダユニット

 Radeon X1900が持つ3Dコアの基本アーキテクチャは,Radeon X1800と同じプログラマブルシェーダ3.0(Shader Model 3.0,以下SM3.0)。この点で従来製品と変わらないRadeon X1900における最大のトピックは,約6000万ものトランジスタ予算を割いて行われたシェーダ性能の向上ということになる。具体的には,ピクセルシェーダ(Pixel Shader)ユニットが,現行PC用グラフィックスチップとしては最多となる48基に増設された点だ。
 以下が,Radeon X1900シリーズのブロックダイアグラムだが,NVIDIAのハイエンドグラフィックスチップであるGeForce 7800 GTXでも24基なので,単純計算でRadeon X1900ではピクセルシェーダユニットをGeForce 7800 GTXの2倍搭載していることになる。
 Radeon X1800では,GeForce 7800 GTXの3分の2となる16基で,このハンデを高い動作クロックでカバーしようとしていたわけだが,Radeon X1900では,ハンデになっていたはずのシェーダユニット数で優位に立ってしまったというわけだ。

左がRadeon X1900シリーズのブロックダイアグラム,右はRadeon X1800シリーズのそれだ。右だとレンダーバックエンドの説明も行われているので,若干形状は異なるが,「Ultra-Threading Dispatch Processor」と接続される,4個1組のピクセルシェーダコアが,Radeon X1900で見事に3倍の数になっているのは分かると思う

Radeon X1800シリーズでいうところのピクセルシェーダユニットが本当に48基あると,ATIは強調する

 NVIDIA寄りの海外コミュニティの一部からは「Radeon X1900のピクセルシェーダユニット数は16基のままで,ピクセルシェーダが内包するALU(Arithmetic and Logical Unit,算術&論理計算ユニット)の個数で数え直しただけ。単なる数字のマジックだ」という反論があった。これについてTaranovsky氏は,「Radeon X1800シリーズ相当のピクセルシェーダユニットが48基に増強されている」と,これを公式に否定している。

 一方,Radeon X1900で増強されたのはピクセルシェーダユニットのみで,頂点シェーダ(Vertex Shader)ユニットはRadeon X1800と同じ,8基に据え置かれている。テクスチャユニットも16基のままで,実際のグラフィックスメモリへの書き込みを担当するレンダーバックエンドであるROP(Rasterize OPeration)ユニットも16基のままだ。
 そう,Radeon X1900では「ピクセルシェーダユニット一点強化型」のリファインが行われているのだ。Taranovsky氏は「現在の3Dアプリケーションでは,ピクセルシェーダユニットへの負荷が急増している。Radeon X1900で行われたピクセルシェーダユニット増強はこれに応えたものだ。一方で,ほかの部分についてはRadeon X1800シリーズのままで必要十分という判断を下した」と説明する。

 現在の3Dアプリケーション,とくに3Dゲームにおいては,ピクセルシェーダの活用が著しい。
 例えば,最近よく目にする,リアルな水面のさざ波表現では,まずピクセルシェーダを活用してテクスチャに対する波動シミュレーションを行い,ここでさらにピクセルシェーダを活用して法線マップを生成。しかも,最終的なシーン全体のレンダリング時におけるピクセル単位の陰影処理は,この法線マップを基にして,またまたピクセルシェーダを用いて行うことになる。最新3Dゲームグラフィックスでは,ただシーンをレンダリングするためだけではなく,そのシーンに活用するための素材生成にも,ピクセルシェーダが用いられているのだ。

左は「Half Life2: Lost Coast」,右は「F.E.A.R.」より。水面のさざ波表現では,そのさざ波の波動シミュレーションまでがピクセルシェーダによって行われている

 ピクセルシェーダユニットの処理のうち,今挙げた陰影処理のような「テクスチャそのものとは関わらない」算術処理と,テクスチャに関わる処理では,圧倒的に前者の頻度のほうが高くなってきている。下は,各年代の3Dゲームにおけるピクセルシェーダプログラム内における命令量比率をグラフ化したものだが,テクスチャに関係した命令(テクスチャアクセス命令)と比べて,算術処理命令の含有率が,非常に高くなってきていることが分かるだろう。当然のことながら,算術処理命令の実行効率を上げるには,ピクセルシェーダユニットの増強が特効薬となる。

各ゲームで使われているシェーダの算術命令とテクスチャアクセス命令の比率を示したグラフ

 ピクセルシェーダユニット増強が優先されたのは,こうした流れに呼応したものなのである。
 さて,Radeon X1900も含むRadeon X1000シリーズでは,4×4ピクセルの処理を1スレッドとして考えており,テクスチャアクセスが発生すると,別のスレッド処理に切り換える「Ultra-Threading」という仕組みを実装しているというのは,Radeon X1000シリーズの解説で述べたとおりだ。Radeon X1900では,ピクセルシェーダユニットの大増強により,Ultra-Threading で処理可能な最大スレッド数がRadeon X1800の512に対して,1024と倍になったことが公表されている。簡単にいえば,より多くのスレッドを実行できるようになったわけで,より高負荷な状況に対応できるようになったともいえる。

シャドウマップ技法を加速する
新テクスチャユニット

シャドウマップ技法をいち早く取り入れたのがSplinter Cellシリーズだった

 3倍に増えたピクセルシェーダユニットばかりが注目されがちだが,Radeon X1900では,2006年1月現在における,3Dアプリケーションの要求に応える形で,さまざま改善が施されているとATIは主張している。
 具体的には,これまで4要素(α/R/G/B)テクスチャの参照のみに特化していたテクスチャユニットを,ある1要素を同時に4個参照できるようにもしたというのだ。
 これは「Tom Clancy’s Splinter Cell: Chaos Theory」など,最近の3Dゲームで採用例が増えており,3Dベンチマークソフト「3DMark06」でもその発展形が採用されている影生成技法「シャドウマップ技法」(デプスシャドウ技法)のアクセラレーションに貢献する。

Radeon X1900のテクスチャユニットでは,1要素テクスチャ4個の同時読み込み(「Fetch4」という)が可能になっていることを示す図。これもATIのホワイトペーパーから

3DMark06の「HDR/SM3.0 Test 2」である「Deep Freeze」より。シーン内の影はシャドウマップ技法によって生成されている

 シャドウマップ技法では,光源から見たシーンの深度情報をZバッファなどの1要素テクスチャにレンダリングすることで,そのシーンの遮蔽構造を表す「シャドウマップ」を生成する。そしてシャドウマップは,シーン全体の最終的なレンダリング時に,当該ピクセルが影となるかどうかを判定するため,高い頻度で参照されることになるのだ。

 

 なお,Radeon X1000シリーズの発表直後に,NVIDIA側がその弱点として指摘していた「VTF」(Vertex Texture Fetching)については,Radeon X1900でも対応は見送られている。
 VTFとは,頂点シェーダにテクスチャアクセス機能を加えるものだが,Taranovsky氏いわく「VTFについては,ゲームスタジオに対して,代替手段があることを啓蒙している。我々としては競合(=NVIDIA)が指摘するほど大きな問題になっていると捉えていない」とのこと。

Radeon X1000シリーズだと,Shader Particlesのテストはグレーアウトして選択できない

 ただ3DMark06では,VTFを活用した「Shader Particles」というテストが「Feature Test」の一つとして盛り込まれている。Feature Testは3DMark総合スコアに無関係なので,ユーザーへの影響はほとんどないと思われるが,GeForce 6/7シリーズならローエンドモデルでも実行できるテストを,ATIの最新ハイエンドチップが実行できないというのは,少々寂しい気もする。

 最後に出力面では,10bitベースの処理を一貫して行ったり,MPEG-2再生時の高画質化を図ったりするAvivo Technologyは,変わらず搭載。デュアルリンクDVI出力にも引き続き対応している。

現時点では最速――NVIDIAの反撃は!?

Radeon X1900 XTカードを持つTaranovsky氏と,ATIテクノロジーズジャパンの広報,金井華奈子さん

 NVIDIAの最上位モデルであるGeForce 7800 GTX 512は,2005年最速のグラフィックスチップでこそあったものの,GeForce 7800 GTXの優良選別品を極限までオーバークロックした,言うなれば付け焼き刃的なプレミアム最速モデルだった。実際,GeForce 7800 GTXとは比べものにならないほど,GeForce 7800 GTX 512の流通量は少ない。
 これに対してRadeon X1900は,リファイン版のカタログ通常モデルだ。ベンチマークスコアは別記事を参照してもらうとして,最速の座を奪い返した格好になった,と言ってしまっていいだろう。

 もちろん,NVIDIAがこれを黙って見ているはずはない。
 先日発表されたGeForce 7300 GSが90nmプロセスルールを採用していたことからも分かるように,NVIDIA製グラフィックスチップも今後はRadeonと同様,90nmプロセスへ移行する。しかも,3月開催のGDCまでには,90mプロセス版GeForce 7のハイエンドモデル(開発コードネーム「G71」)の投入が確実視されており,Radeon X1900が最速でいられる期間は,思いの外短いかもしれないのだ。
 ATI対NVIDIAのSM3.0世代グラフィックスチップ戦争は,年明け早々から,目まぐるしく戦局が動くことになる。(トライゼット 西川善司)

 

タイトル ATI Radeon X1900
開発元 AMD(旧ATI Technologies) 発売元 AMD(旧ATI Technologies)
発売日 2006/01/24 価格 製品による
 
動作環境 N/A

(C)2006 Advanced Micro Devices Inc.