― 連載 ―

タイトル

Avivo Technology標準搭載
 新開発ディスプレイエンジンの詳細仕様が判明

 このほか,3Dグラフィックスと直接の関係はないものの,Avivo Technology(以下Avivo)をシリーズ全モデルで採用したのもRadeon X1000シリーズの特徴だ。
 Avivoについては発表会の模様をお伝えしているので,まずはそちらを参照いただきたい。一言でいえば,ATIのAV機器向けチップであるXilleonのビデオエンコーダ/デコーダ機能をベースに,シェーダを活用した動画フォーマットのエンコード/トランスコード,デコード支援,新開発のディスプレイエンジンを組み合わせた機能のことだ。NVIDIAの「PureVideo」への対抗技術という位置づけになる。

Radeon X1000シリーズのディスプレイエンジン。これはレンダリングパイプラインとは切り離されたところにある機能ブロックだ

 注目すべきは,Avivo実現のため,新たに開発されたディスプレイエンジンだ。
 このディスプレイエンジンでは64bit整数バッファ(αRGBそれぞれがint16),64bit浮動小数点バッファ(αRGBそれぞれがFP16),32bit HDRバッファ(αがint2,RGBそれぞれがint10)を直接表示できるという。実際にはディスプレイエンジンの10bitガンマエンジンで処理され,HDRレンダリングのトーンマッピングに相当する処理が行えるとのこと。光が溢れ出して見えるグレアやブルームといった効果はサポートされないが,HDRバッファを特定の輝度レンジに落とし込む処理はピクセルシェーダを使わずに行えるそうだ。API自体がどういう仕様でどういう形態なのか(Direc3DなのかOpenGLなのか)は未公開。

 このディスプレイエンジンは,以下に挙げるような多様な出力フォーマットに対応しているのも特徴である。

一般ユーザー向けグラフィックスチップがFP16とInt16のHDRデュアルリンク出力に対応したのはこれが初めてである

(1)48bitカラー(RGBが各FP16あるいはint16)のデュアルリンクDVIデジタル出力
(2)30bit HDRカラー(RGBが各int10)のデュアルリンクDVIデジタル出力
(3)アナログTV出力,アナログRGB出力,デジタルRGB出力(シングルDVI)において,ディザリング処理によりRGB各10bit,10億色相当の表示を行う機能

 (1)や(2)はデュアルリンク用なので,対応ディスプレイが必要になるが,(3)では従来の(≒ユーザー手持ちの)ディスプレイにも適用できる。ディザリング処理は時間積分型(毎フレーム異なる色を出し,続けて見させることでその中間の色であると人間の目に知覚させる方式),フレーム内完結型(周辺の画素色に,不足する色値を分散させる方式)に対応しているという。

Avivoでは,HDR対応モデルと比べて色数の少ない一般的なディスプレイでも,ディザリング処理の活用によって,より多くの色を用いた表現が行えると謳う

HDRデュアルリンクに対応したBrightside Technologies製HDR液晶ディスプレイ「DR37-P」。サイズは37V型で,パネル解像度は1920×1080ドットのフルHDに対応する。バックライトにマトリックス式白色LEDを用いコントラスト比20万:1を実現するとか。価格は日本円にして約550万円。今回の事前発表会では実機も展示されていた

 長くなったが,以上がRadeon X1000シリーズの特徴だ。ここからは,ハイエンド,メインストリーム,バリューの各シリーズについて,個別に見ていくことにしよう。

Radeon X1800
〜625MHzの高速動作,リングバス採用

Radeon X1800のチップイメージ

 最上位となるRadeon X1800シリーズのトランジスタ数は3億2000万。GeForce 7800 GTXの3億200万を1800万上回る。実行可能なスレッド数は最大512個だ。
 発表時のラインナップは以下のとおり2モデルで,クロックとメモリ容量以外の仕様は同じ。Radeon X850で"Press Edition"と揶揄されたほど,ほとんど製品が出回らなかった「Platinum Edition」は今のところ用意されていない

Radeon X1800 XT

 コアクロック:625MHz
 頂点シェーダ数:8
 ピクセルシェーダ数:16
 グラフィックスメモリスペック:GDDR3 SDRAM 1.5GHz相当
 (750MHz DDR)
 メモリバス:512bit相当(256bit×2)
 グラフィックスメモリ容量:512MBもしくは256MB

Radeon X1800 XL

 コアクロック:500MHz
 頂点シェーダ数:8
 ピクセルシェーダ数:16
 グラフィックスメモリスペック:GDDR3 SDRAM 1GHz相当(500MHz DDR)
 メモリバス:512bit相当(256bit×2)
 グラフィックスメモリ容量:256MB

本文でも触れたように,現時点では2モデルのみだが,事前発表会で配布された資料の中にはRadeon X1800 Proのロゴマークも含まれていた。いつものように,追って発表される可能性が高い

 頂点シェーダは8基で,Radeon X800シリーズに対して2基追加された格好だ。VTFには対応しないので,頂点シェーダとテクスチャユニットは接続されていない。ちなみに,8基という数はちょうどライバルのGeForce 7800 GTXと同じである。

 

 ピクセルシェーダは16基で,これはRadeon X800シリーズの上位陣,Radeon X850シリーズやRadeon X800 XLと同じだ。テクスチャユニット(テクスチャアドレッシングユニットも含む)も同じく16基となっている。24基持つGeForce 7800 GTXと比べると3分の2しかないわけで,これまでの戦いで繰り返されてきた「後出しじゃんけんの法則」(後から出したほうが必ずライバルのスペックを上回る)から逸脱することになる。

 

Radeon X1800の3Dコアアーキテクチャ

 ATI ResearchのアドバンストテクノロジディレクターであるAndrew B. Thompson氏は「この差がそれほど重要とは受け止めていない。また向こう(GeForce 7800 GTX)もレンダーバックエンドの個数は16基でうちと同じだから,クロック当たりのピクセルスループットは同じだ。我々には90nmプロセスの採用によって実現した高い動作クロックというアドバンテージがあるので,競合に対しては十分に大きな差を付けられると考えている」と述べる。
 レンダーバックエンドとはα処理,Zバッファ/ステンシル処理,アンチエイリアス処理を行う部分のこと。簡単にいえば,ピクセルシェーダの結果を基にして,グラフィックスメモリに対し実際にピクセルを書き出すブロックだ。NVIDIAではこれをROPユニット(ROP:Rasterize OPeration Unit)と呼んでいる。確かに,GeForce 7800 GTXはピクセルシェーダの個数こそ24基だが,ROPユニットは16基止まり。Radeon X1800シリーズも16基だから,時間当たりのピクセルスループットは16個で変わらないことになる。

 最上位モデルとなるRadeon X1800 XTの動作クロックは625MHz。GeForce 7800 GTXは430MHzだから,動作クロックはRadeon X1800 XTのほうが約1.5倍高い。クロック当たりのピクセルスループットはRadeon X1800 XTが上になる計算だ。
 ピクセルシェーダの数がGeForce 7800 GTXの3分の2しかないという問題は,やはり約1.5倍という動作クロックの違いで相殺される。しかも,組み合わされるグラフィックスメモリが高速なので,理論的にはATIのいうとおり,GeForce 7800 GTXの上を行く。

リングバスメモリコントローラを搭載

 Radeon X1000シリーズ中,Radeon X1800シリーズのみが採用するものとしては,「リングバスメモリコントローラ」(Ring Bus Memory Controller)が挙げられる。

接続の複雑性を分散した形がこのリングバス構造。データはバケツリレー式に手渡されていく事になり、多少のレイテンシーはある

 Radeon X800シリーズまでは,一つのメモリコントローラにすべてのグラフィックスメモリが接続される,いわば集中型の設計だった。この設計だとメモリバス幅を拡大したり,搭載メモリ量を増やしたりするときに,配線が集中しすぎてしまう。
 この問題の解決策がリングバスである。ATIが提供する資料(右の画像)を見ると分かるように,外周にある内回りと外回り,向きの異なる二つの256bitメモリバスを通って,メモリ内のデータはメモリコントローラに伝送されるという仕組みだ。レイテンシは従来型の接続仕様よりも大きくなるが,ATIは,バースト転送が主体となるグラフィックスにおいて,そのペナルティは最小限としている。
 この構造のおかげでメモリコントローラの複雑性は大部緩やかとなり,より高速なビデオメモリを大量に組み合わせることが可能になる。しかも,各256ビットとはいえ,スペック表記上は「512bitメモリバス」になるため,単純なスペック比較では,GeForce 6/7に対して優位性を主張できるというわけだ。

Radeon X1800でもCrossFire動作にはマスターカード(CrossFire Edition)が必要になる。スライドでは2048×1536ドットの解像度で垂直リフレッシュレート70Hz以上をサポートするとあるので,CrossFire EditionのTMDSレシーバは別のものになっている可能性が高い

 Radeon X1800 XT搭載カードは,11月5日出荷開始予定。予想実売価格はメモリ容量512MB版が549ドル(約6万2000円),256MB版が499ドル(約5万6000円)となっている。一方,Radeon X1800 XLは即日(2005年10月5日)出荷開始で,カードの想定価格は449ドル(約5万円)。
 グラフィックスカード2枚差しソリューション「CrossFire」には当然対応しており,Radeon X1800 XT 512MB版のCrossFire Editionが,登場時期未定ながら,599ドル(約6万8000円)で発売される予定になっている。

Radeon X1600
〜シェーダパフォーマンスを重視した設計

Radeon X1600のチップイメージ

 Radeon X700シリーズの後継として用意されるのが,Radeon X1600シリーズである。
 Radeon X1600シリーズのトランジスタ数は1億5700万で,Radeon X850シリーズとほぼ同等になった。一世代前のハイエンドがメインストリームに降りてきたという理解でOKだ。
 ラインナップは2モデルで,主な仕様は以下のとおりとなる。

Radeon X1600 XT

 コアクロック:590MHz
 頂点シェーダ数:5
 ピクセルシェーダ数:12
 グラフィックスメモリスペック:GDDR3 SDRAM 1.38GHz相当
 (690MHz DDR)
 メモリバス:128bit
 グラフィックスメモリ容量:256MBもしくは128MB

Radeon X1600 Pro

 コアクロック:500MHz
 頂点シェーダ数:5
 ピクセルシェーダ数:12
 グラフィックスメモリスペック:GDDR3 SDRAM 780GHz相当
 (390MHz DDR)
 メモリバス:128bit
 グラフィックスメモリ容量:256MBもしくは128MB

Radeon X1600の3Dコアアーキテクチャ

 X1800シリーズと機能面で差異はないものの,メモリインタフェースは128bitになる。最大スレッド数は128だ。
 頂点シェーダは5基。Radeon X700シリーズが4基だったので1基追加された格好だ。同様に,ピクセルシェーダもRadeon X700シリーズの8基から1.5倍に増えている。

 

 ただ,意外なことにテクスチャユニットは4基しかなく,レンダーバックエンドも4基。クロック当たりのピクセルスループットはRadeon X1800シリーズの4分の1ということになる。「(ピクセルシェーダ個数)>(テクスチャ,レンダーバックエンド)」というユニークなアーキテクチャになっているのだ。
 一方でZ処理ユニットは8基(Radeon X1800 XTは16基)ある。影生成やDeferred Rendering(Zバッファ処理を先に行ってしまうレンダリング技法で,重複描画をひどく嫌うグラフィックスエンジンでしばしば実装される技法)でZ処理負荷が高いことへの配慮だろう。

 

 Radeon X1600シリーズはともに11月30日出荷開始予定となっており,Radeon X1600 XTはグラフィックスメモリ256MB版が249ドル(約2万8000円),128MB版が199ドル(約2万2000円)になるようだ。Radeon X1600 Proは256MB版が199ドル(約2万2000円),128MB版が149ドル(約1万6000円)になる予定だ。
 Radeon X1600シリーズもCrossFireに対応しており,Radeon X1600 XTグラフィックスメモリ256MB版のCrossFire Editionは299ドル(約3万4000円)になるとのこと。ただし,登場時期はやはり未定のままである。

Radeon X1300
〜ローエンドでもHDコンテンツを再生可能

Radeon X1300のチップイメージ

 Radeon X300/X550シリーズを置き換えることになるのがRadeon X1300シリーズだ。
 Radeon X1300シリーズのトランジスタ数は1億2000万。これは2世代前のハイエンド,Radeon 9800シリーズとほぼ同じ数だ。メモリインターフェースはRadeon X1600シリーズと同じ128bit。最大スレッド数も128で変わらない。
 ラインナップは3モデルで,PCのメインメモリをフレームバッファとして動的に確保する「HyperMemory」対応モデルが存在する。90nmプロセスの恩恵で,バリュー向けながら動作クロックは高く,HDコンテンツのハードウェア再生支援が可能だ。GeForceでは,GeForce 6600以上でないと再生支援を行えないので,これはアドバンテージとなる。

Radeon X1300 Pro

 コアクロック:600MHz
 頂点シェーダ数:2
 ピクセルシェーダ数:4
 グラフィックスメモリスペック:GDDR3 SDRAM 800MHz相当
 (400MHz DDR)
 メモリバス:128bit
 グラフィックスメモリ容量:256MB

Radeon X1300

 コアクロック:450MHz
 頂点シェーダ数:2
 ピクセルシェーダ数:4
 グラフィックスメモリスペック:DDR SDRAM 500MHz相当
 (250MHz DDR)
 メモリバス:128bit
 グラフィックスメモリ容量:256MBもしくは128MB

Radeon X1300 HyperMemory

 コアクロック:450MHz
 頂点シェーダ数:2
 ピクセルシェーダ数:4
 グラフィックスメモリスペック:GDDR3 SDRAM 1GHz相当
 (500MHz DDR)
 メモリバス:128bit
 グラフィックスメモリ容量:32MB(カード上に実装する容量)

Radeon X1300の3Dコアアーキテクチャ

 頂点シェーダ数が2,ピクセルシェーダ数が4というのは,Radeon X300/X550と同じ。テクスチャユニットやレンダーバックエンドも4基で,形成されるレンダリングパイプラインはRadeon X300シリーズとほぼ同一になる。Radeon X1800直系となるAvivoなどの機能と,動作クロック増加分のパフォーマンス向上が,Radeon X1300シリーズの特徴ということになるだろうか。

 

 HyperMemoryモデルを除くシリーズ2製品はいずれも即日出荷されており,価格はRadeon X1300 Proが149ドル(約1万7000円),Radeon X1300はメモリ256MB版が129ドル(約1万5000円),128MB版が99ドル(約1万1000円)。

 

レンダリング結果はPCI Expressバスを利用して伝送。Radeon X1300のCrossFireにマスターカードは不要なのだ

 Radeon X1300シリーズもCrossFireに対応しているが,Radeon X1800/1600シリーズとは異なり,Radeon X1300を2枚導入するだけでCrossFire動作が可能になる。片側のRadeon X1300でレンダリングした結果は,DVIケーブルではなく,PCI Expressバス経由でもう一方のX1300に伝送されるのだ。このため,PCI Expressのバス消費率が高くなり,Radeon X1800/1600を利用したCrossFireと比べると,パフォーマンス向上率は下がることになる。
 もっとも,バリュー向けのグラフィックスチップとしては初のカード2枚差しソリューション対応製品なので,訴求力はあるだろう。

Radeon X1000シリーズのユニット数比較(上)と3Dアーキテクチャ比較。今世代では8ピクセルシェーダの製品が存在しないのは少々不思議である。"Radeon X1600 GT"あたりが今後登場する?

 これまで「ハーフライフ2」のValve Softwareのような"ATI系デベロッパ"はSM2.0に留まり,Unreal Engine 3.0のEpic Gamesのような"NVIDIA系デベロッパ"はSM3.0へと突き進むという,2極化が生じていた。だが,Radeon X1000シリーズの登場によって,すべてのデベロッパがSM3.0を考慮したゲーム開発に乗り出してくるはずだ。

 

 これにより,ユーザーは純粋に性能が高いものを選べばよくなる。結果として,熾烈なベンチマークスコア戦争やお互いのスペックの叩き合いが起こる可能性があるだろう。かつてRadeon 9000シリーズとGeForce FXシリーズ間で行われた泥仕合のように。
 ATIはきっと,トータルパフォーマンスの優位性と,バリュー市場などにおけるAvivoの有効性を強調してくる。対するNVIDIAはまず間違いなく,シェーダ数とVTF未対応を突くだろうし,メインストリームクラスのGeForce 7シリーズや,ウルトラハイエンド製品(GeForce 7800 Ultra?)をぶつけてくるかもしれない。  この冬,DirectX 10を目前にした,SM3.0世代グラフィックスチップの最終戦争が勃発する気配が濃厚だ。