オススメ機能
Twitter
お気に入り
記事履歴
ランキング
TOP
PC
Xbox
PS4
PSV
Switch
3DS
スマホ
女性向け
VR
ハードウェア
ハードウェア
レビュー
テストレポート
インタビュー
ムービー
ドライバ
ベンチマークレギュレーション
AC
アナログ
パッケージ
ATI Radeon HD 4800公式サイトへ
  • AMD
  • 発表日:2008/06/19
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
QRコードでLINEの4Gamer
アカウントを友達登録すると
月〜金の週5回,21時に厳選
ニュースをお届けします!
※購読にはLINEアプリが必要です
特集記事一覧
注目のレビュー
注目のムービー
印刷2008/06/25 13:01

ニュース

AMD,「ATI Radeon HD 4870」正式発表。GPUアーキテクチャ詳細を明らかに

 日本時間2008年6月25日1:01PM,AMDは発表時点におけるフラグシップ製品となるシングルGPU「ATI Radeon HD 4870」を発表した。「ATI Radeon HD 4850」を上回る,1.2TFLOPSの演算性能を持つGPUが,搭載カードの想定売価299ドルで市場投入されることになった。
 同社は併せて,開発コードネーム「RV770」とされてきたATI Radeon HD 4800シリーズのGPUアーキテクチャを公開。そこで本稿では,6月16日に米カリフォルニア州サンフランシスコ市で開催された,ATI Radeon HD 4800シリーズの技術説明会「Technical Deep Dive Event」の内容を軸に,新世代GPUの強化ポイントを紐解いていきたいと思う。

ATI Radeon HD 4870リファレンスカードのイメージ。想定消費電力が160Wになることもあってか,GPUクーラーは2スロット仕様になっている
ATI Radeon HD 4800

 なお,ATI Radeon HD 4870の下位モデルとなる「ATI Radeon HD 4850」は,発売スケジュールが突然前倒しされ,先週末には秋葉原を中心として,PCパーツショップの店頭に製品が並んでいる。4Gamerでも23日にレビュー記事をお届けしているので,同製品についてはそちらも併せて参照してもらえれば幸いだ。


ATI Radeon HD 3000/2000の弱点を克服した

ATI Radeon HD 4800シリーズ


 旧ATI Technologies時代の開発コードネームルールでは,「RV」は前世代,もしくは同一世代GPUの機能制限版という位置付けにあったため,その性能を疑問視する向きもあったRV770。だがフタを開けてみれば,(確かに基本となるストリーミングプロセッサの構成自体は従来から変わっていないものの)ATI Radeon HD 2000/3000シリーズの「R600」アーキテクチャが持つ弱点を徹底的に改良したものになっている。

ATI Radeon HD 4850の上位モデルとして発表されたATI Radeon HD 4870は,GDDR5メモリを採用し,1.2TFLOPSの演算性能を実現する
ATI Radeon HD 4800

 その最大の特徴は,汎用シェーダユニットとなるStream Processor(ストリームプロセッサ,以下SP)数がATI Radeon HD 3800シリーズの320基から800基へと増やされている点。トランジスタ数は従来製品の6億6600万個から9億5600万個へ増えているが,1.4倍強のトランジスタ数増加で,SP数を2.5倍にできているのを考えるに,かなり効率的な半導体設計がなされたと述べるべきだろう。
 なお,製造プロセスは従来どおりTSMCの55nmプロセスを採用しており,ダイサイズ(半導体そのもののサイズ)は190mm2から260mm2に増えている。

ATI Radeon HD 4800シリーズのブロックダイヤグラム。ストリーミングプロセッサが800基に増えたことで,アーキテクチャ的にもさまざまな改良が加えられた
ATI Radeon HD 4800

ATI Radeon HD 2900 XTと比較して,わずか1年で4倍もの演算処理性能向上を果たしたとアピール
ATI Radeon HD 4800
 アーキテクチャ面でATI Radeon HD 3000/2000世代と比べて変更の度合いが大きいのは,AMDが「SIMDコア」(SIMD:Single Instruction/Multiple Data)と呼ぶ,SPクラスタ(Stream Processor Cluster)だ。
 AMDでは,5基のSPと1基の分岐実行ユニットを一つの「Stream Processing Unit」(ストリームプロセッシングユニット)とし,これを16基(つまりは80ストリームプロセッサ1組)まとめてSIMDコア1基としている。ATI Radeon HD 3800シリーズの場合,SP数は320基なので,SIMDコア換算では4基。ATI Radeon HD 4800シリーズではこれが10基となっているわけだ。

 SIMDコアが増えたことを受け,各SIMDコアに命令を発効する「Ultra-Threaded Dispatch Processor」(ウルトラスレッド・ディスパッチプロセッサ)には,各SIMDコアをコントロールする「Thread Sequencer」(スレッドシーケンサ)が設けられ,より効率的なSIMDコアの制御を実現しているとのこと。また。各SIMDコアには「Local Data Share」(ローカルデータシェア)と呼ばれる共有メモリが設けられ,頻繁に利用されるデータはこの共有メモリに格納されることで,各Stream Processing Unitから利用できるようになった。

 テクスチャユニットとL1テクスチャキャッシュも,ATI Radeon HD 4800シリーズでは各SIMDコアに従属する形がとられた。L1テクスチャキャッシュはSIMDコア単位で頻繁に利用するデータを格納できるようになったため,テクスチャ処理の効率は上昇する。さらに,各SIMDコアの連携を高めるため,「Global Data Share」と呼ばれる容量16KBの共有メモリが設けられている。SIMDコア間のシームレスなデータ共有を実現し,スループットパフォーマンスを向上させる狙いだ。

ATI Radeon HD 4800シリーズではSIMDコアの構成が変更され,SIMDコアごとにLocal Data Shareと呼ばれる共有メモリとテクスチャユニットを装備。さらに,SIMDコア間のデータ共有のために16KBの共有メモリであるGlobal Data Shareが搭載される
ATI Radeon HD 4800

 テクスチャユニットは従来製品比でやや簡素化されているものの,パフォーマンスは従来モデルから大きく引き上げられている。
テクスチャユニットは,ATI Radeon HD 3800シリーズよりもやや簡素化されたが,L1テクスチャキャッシュとの連携を高められている。また,32bitテクスチャフィルタリングレートは2.5倍に向上している
ATI Radeon HD 4800
 ATI Radeon HD 3000シリーズでは,「Texture Address Processor」(テクスチャアドレス計算器)がテクスチャユニットごとに8基実装されていたのに対し,ATI Radeon HD 4800シリーズでは4基。しかし,前世代のTexture Address Processorは,フィルタ処理ありとなしで区別されていたので,ここはこれらの機能が統合されたと見るべきだ。
 テクスチャキャッシュからテクセル(※テクスチャを構成する画素)を読み出す「Texture Sampler」(テクスチャサンプラ)は各ユニットに16基搭載され,これらに4基の「Texture Filter Unit」(テクスチャフィルタユニット)が組み合わされる。AMDでATI Radeon HD 4800シリーズの開発を担当したScott Hartog氏(Chief Architect, ATI Radeon HD 4800 Series, AMD Graphics Product Group)は,「ATI Radeon HD 4800シリーズのテクスチャキャッシュ帯域幅は,HD 3000シリーズの倍に向上し,32bitフィルタリングレートは2.5倍に向上している」と,(テクスチャユニットは簡素化されても)パフォーマンスそのものは大幅に向上していると説明する。

L1テクスチャキャッシュの処理効率を高めるため,頂点キャッシュを独立させたATI Radeon HD 4800シリーズ。メモリコントローラと対になったL2キャッシュとの帯域幅も大幅な向上を実現する
ATI Radeon HD 4800
 さらに本シリーズでは,テクスチャ性能を向上させるため,テクスチャキャッシュのデザインも変更している。前世代までのATI Radeonでは,四つのSIMDコアやメモリインタフェースがL1およびL2テクスチャキャッシュを共有する形を採用していたが,ATI Radeon HD 4800シリーズでは(前述のとおりL1キャッシュはSIMDコアに従属させつつ)L2キャッシュをメモリインタフェース(=メモリチャネル)と対にしている。さらに「Vertex Cache」(頂点データキャッシュ)をL1から分離させることで,テクスチャキャッシュの効率を向上。L1キャッシュの効率は従来に比べ2倍に達し,さらにL1テクスチャキャッシュの数が増えたこともあって,チップ全体ではATI Radeon HD 3800シリーズ比5倍の性能アップを果たしたという。
 なお,これは言うまでもないかもしれないが,増強されたL1テクスチャキャッシュを有効に機能させるため,L1とL2の間の帯域幅は最大384GB/sに高められている。ATI Radeon HD 4870のテクスチャ性能は,「GeForce GTX 280」を上回るとAMDは謳う。

ATI Radeon HD 4800
ATI Radeon HD 4870のテクスチャ性能は,GeForce 280 GTXを上回り,もちろん「GeForce 9800 GTX」を圧倒するとAMD
ATI Radeon HD 4800
こちらはATI Radeon HD 3800シリーズとの比較。SP数が2.5倍になった“だけ”に留まらず,テクスチャ性能なども大幅に向上

 そしてもう一つ,3Dゲーマーにとって重要な強化点がある。それは,「ATI Radeon HD 3000/2000シリーズ最大の弱点」とされた「Render Back-Ends」(レンダーバックエンド)だ。

Render Back-Endsの構成が変更され,深度/ステンシル処理性能は2倍に向上。マルチサンプルアンチエイリアシング性能も従来比2倍になった
ATI Radeon HD 4800

MSAAのパフォーマンス比較。赤いバーがATI Radeon HD 4870,黄色がATI Radeon HD 3870。見事に圧倒している
ATI Radeon HD 4800
 “NVIDIA語”でいうところのROP(Rendering Output Pipeline)に当たるRender Back-Endsの数は,ATI Radeon HD 3800シリーズと同じ16基。ただし,ハードウェア構成を見直すことで,従来比で2倍の深度/ステンシル処理が可能になっているほか,アンチエイリアシング時の処理性能も2倍に高められている。これにより,高解像度表示やマルチサンプルのアンチエイリアシング処理を適用する高負荷時でもパフォーマンスの低下を最小限に防げるという理屈だが,これがハッタリでなかったことは,レビュー記事をご覧になった読者ならすでにご存じだろう。

 ATI Radeon HD 4870では,もう一つ特筆すべき強化ポイントがある。それが次世代グラフィックスメモリといわれるGDDR5のサポートだ。旧ATI Technologiesは,グラフィックスメモリの標準化で業界の牽引役を果たしてきたが,それはAMDになっても変わらない。

GDDR5をサポートするATI Radeon HD 4800シリーズの256bitメモリコントローラアーキテクチャ。従来型のリングバスを捨て,より低消費電力で駆動できる256bitインタフェース&GDDR5で,パフォーマンスと低消費電力の両立を図る。メモリコントローラとRender Back-Ends,L2キャッシュが対をなす構成をとることで,処理効率を向上させ,さらにPCI ExpressやATI CrossFireXなどのアクセスを管理するハブが,これらインタフェースのアクセスを最小限に抑え,全体的なメモリバス帯域幅向上に寄与する
ATI Radeon HD 4800

GDDR5の標準化を推進した,ASICエンジニアリング上級ディレクターのJoe Macri氏(Sr.Director, ASIC Engineering, AMD Graphics Product Group, AMD)
 同社のASICエンジニアリング上級ディレクターのJoe Macri氏は,メモリの標準化団体「JEDEC」において,グラフィックスメモリ関連委員会でチェアマンを務める人物でもある。その同氏が3年間にわたり標準化作業に携わってきたからこそ,ATI Radeon HD 4870が他社に先駆けてGDDR5を採用できたといっても過言ではないだろう。

 GDDR5の駆動電圧は1.5Vで,最大28GB/sの帯域幅を実現する。GDDR5ではGDDR3/4の2倍となる二つのDQ(Data Queue,データキュー)ラインを持ち,従来比4分の1の動作クロックで同じデータレートを実現する。つまり,メモリの実動作クロックが1GHzのとき,GDDR3ならデータレートは2GHz相当(2Gbps)になるところが,GDDR5なら4GHz相当(4Gbps)に達するというわけだ。

ATI Radeon HD 4800
GDDR5のGDDR4との比較。比較的低消費電力で駆動できるほか,GDDR4と比べて4分の1のデータレートコマンドクロックを実現するのがGDDR5の特徴だ
ATI Radeon HD 4800
DRAMチップそのものがタイミングやクロックを補正できるため,カードデザイン時にチップからメモリへの配線長などをシビアに追求する必要がない

GDDR3に比べて30%低い消費電力で倍の転送速度を実現するのもGDDR5のメリットだ
ATI Radeon HD 4800
 さらにGDDR5では,一般に高速化が進むほど難しくなる基板への実装を容易にする技術が盛り込まれている。Joe Macri氏によれば,DRAMチップへの配線長が異なっても,GDDR5ではDRAMチップ自体がタイミングなどを学習,補正する機能が盛り込まれるほか,読み出しクロックやデータのリカバリ機能なども備えるとのこと。「単なる高速化のみならず,高速なデータ転送をいかに安定して機能させるかに重点が置かれている」という。
 一方,メモリコントローラではGDDR5対応以外にも,最適化が施された。とくに,PCI ExpressインタフェースやATI CrossFireX,UVD2,ディスプレイコントローラのメモリアクセスを仲介するハブが,メモリへのアクセスを最適化することでメモリアクセスの負荷を軽減させている。これにより,ATI Radeon HD 4800シリーズではメモリ帯域幅の実効占有率をピーク時に95%まで高めることが可能になったとのことだ。

ATI Radeon HD 4800
データ読み出し時にエラーが生じた場合にリトライをかけるなど,高速なデータ転送をサポートするだけでなく,それ以上にデータ転送時の信頼性アップに配慮されているGDDR5
ATI Radeon HD 4800
アーキテクチャの改良とメモリ周りのシステム変更によって,ATI CrossFireXにおけるマルチグラフィックス環境のパフォーマンスアップが飛躍的に向上したという


EAとセガ,NHNがDirectX 10.1対応タイトルを計画

R700の3DMark Vantageスコアも公開に


GPUの演算能力を使った一般アプリケーションの高速化では,次期Adobe Photoshopによるフォトレタッチの高速化や,CyberLinkによる高解像度ビデオのトランスコード高速化,Havokによる物理演算処理のサポートが表明された
ATI Radeon HD 4800
 なお,AMDはATI Radeon HD 4800シリーズの発表に伴い,同社の汎用コンピューティングに対する取り組みを披露。AMDもNVIDIAと同様に,医療や科学演算などの特定用途向けアプリケーションだけでなく,「Adobe Photoshop」におけるフォトレタッチの高速化や,「Cyberlink Power Director」におけるトランスコード(≒ビデオエンコード)の高速化,「Havok」による物理アクセラレーションなどへの対応が明らかにされた。
 ここまではNVIDIAと非常によく似たアプローチ。しかしAMDはここで,これらの取り組みに当たって,あくまでオープンスタンダードを支持するというスタンスを強調する。GeForceベースの並列コンピューティングに向けた開発環境「CUDA 2.0」を用意して,対応アプリケーションの充実を図るNVIDIAとは対照的だ。

AMDが「Streaming Processing」と呼ぶ,GPU汎用コンピューティング環境は着々と整備が進んでいるが,Appleが提唱するOpenCLなど,業界スタンダードを採用するというスタンスに変わりはない
ATI Radeon HD 4800 ATI Radeon HD 4800

AMDは,Intel傘下に下ったHavokを物理演算エンジンのパートナーに選んだ。まずは,AMD製CPUにおいてHavokエンジンの最適化を進め,続いてGPUの処理性能が向上した時点で,GPUにもゲームプレイ物理の処理をさせていく意向を示す
ATI Radeon HD 4800 ATI Radeon HD 4800


ゲームデベロッパなどのサポートを担当するNeal Robison氏(Director, Developer Relations, AMD Graphics Product Group, AMD)は,DirectX 10.1タイトルの開発状況などを説明。DirectX 10.1でプログラムコードを書いた場合,一部のレンダーパスを省略することができるため,DirectX 10と比べて最大25%もベンチマークスコアが向上するとした
 DirectX 10.1に関しては,「グローバルイルミネーションなど,複雑な光源処理が可能になるだけでなく,DirectX 10.1でプログラミングされた場合,いくつかのレンダーパスを省略できるため,グラフィックス処理の高速化も可能になる」とアピール。説明会ではUbisoft Entertainmentの「Assassin's Creed」をDirectX 10.1コードで走らせたところ,最大25%のパフォーマンスアップを実現したというデータが示された。DirectX 10.1タイトルの動向次第で,ATI Radeon HD 4800シリーズのゲームパフォーマンスは,さらに向上する可能性があるというわけである。

 ただ,肝心のタイトルがほとんどない状況はどうなのか。そんな疑問に応える形で,Electronic Arts(以下,EA),SEGA of America,NHN Gamesの3社から,DirectX 10.1タイトルの発売計画が明らかにされた。とくにEAは,2008年内の発売を予定しているファンタジーオンラインRTS「BattleForge」のデモを行ったので,以下のとおりムービーでお伝えしたい。またNHN Gamesは,MMORPG「Cloud 9」において,ATI Radeon HD 4800/3800シリーズが搭載するテッセレータを用い,さらに高品位なビジュアル表現を実現すると予告していた。



 このほか説明会では,DirectX 10.1やテッセレータ,TFLOPSの演算能力を生かしたAI機能など,ATI Radeon HD 4800シリーズが持つ機能をすべて活用する新しいデモ「Froblines」が公開されたほか,ピクチャ・イン・ピクチャ(PinP)などのデュアルストリームデコード処理をサポートする第2世代の高解像度ビデオ再生機能「UVD2」なども語られたが,本稿では割愛する。

次世代フラグシップモデルとなるR700について説明するRick Bergman氏(Sr. Vice President and General Manager, AMD Garphics Product Group, AMD)
 なお,説明会の最後には,AMDのグラフィックスビジネスを統括するRick Bergman上級副社長によって,ATI Radeon HD 4800コアを2基搭載する「R700」(開発コードネーム)の4-way CrossFireXによるベンチマークスコアが公開されたので,紹介しておきたい。
 ハードウェア構成は明らかにされなかったが,3DMark VantageのExtremeプロファイル(解像度1920×1200ドット)において,スコアは「X12515」。GPU-Zの情報を見る限り,R700は“ATI Radeon HD 4870×2”構成になりそうだが,8週間以内に市場投入されるというウルトラハイエンド製品も要注目だろう。

ATI Radeon HD 4800シリーズ投入後のGPU製品ラインナップ(左)。R700は,2008年7月末に量産を開始するという。右はR700の概要だ。RV770コアを2基搭載することで2TFLOPSの演算性能を実現するほか,グラフィックスメモリにはATI Radeon HD 4870と同様にGDDR5を搭載する。PCI Expressブリッジのデザインが第2世代となり,マルチチップ環境におけるパフォーマンス向上をさらに高めているとのことだ
ATI Radeon HD 4800 ATI Radeon HD 4800
Technology Deep Dive Eventの最後に紹介されたR700のベンチマークスコア。開発中のR700を2枚構成で取得した,3DMark VantageのExtremeプロファイルにおける結果だ。GPU-Zのクロック情報などからは,R700がATI Radeon HD 4870×2構成となる可能性が高いことを見て取れた
ATI Radeon HD 4800 ATI Radeon HD 4800
  • 関連タイトル:

    ATI Radeon HD 4800

  • 関連タイトル:

    BattleForge

  • この記事のURL:
line
4Gamer.net最新情報
トピックス
スペシャルコンテンツ
注目記事ランキング
集計:11月22日〜11月23日
タイトル評価ランキング
82
ARMS (Nintendo Switch)
76
スプラトゥーン2 (Nintendo Switch)
74
鉄拳7 (PS4)
2017年05月〜2017年11月