オススメ機能
Twitter
お気に入り
記事履歴
ランキング
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
「Tonga」コアに隠された機能が明らかに。インドでのイベントでAMDがFireProシリーズの最新事情と「R9 285」の新情報を公開
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2014/10/02 00:00

ニュース

「Tonga」コアに隠された機能が明らかに。インドでのイベントでAMDがFireProシリーズの最新事情と「R9 285」の新情報を公開

 2014年9月25日,AMDは,インドのゴア州バーデス市にて「AMD TECHNOLOGY SHOWCASE 2014」というイベントを開催した。イベントの主催はAMDのアジア太平洋地域支社で,基本的にはインド市場を対象とした製品発表会だったが,映画産業に向けたFireProシリーズのアピールと,「Radeon R9 285」に関するいくつかの興味深い新情報もあったので,本稿にてレポートしたい。


FirePro W9100・W8100を披露

映画大国インドの映画産業を狙う


FirePro W9100
Radeon R9 200
 イベントのオープニングで披露されたのは,ワークステーション向けGPUの「FirePro W9100」(以下,W9100)と「FirePro W8100」(以下,W8100)だ。両製品とも,日本を含む世界市場ではすでに販売を開始しているものだが,インドでは今回が初上陸なのだという。

 両製品はいずれも,Graphics Core Next(以下,GCN)世代のGPUコア「Hawaii」を採用するものだ。W9100は44基のCompute Unit(CU)を備えており,シェーダプロセッサ数(※AMDではStream Processor)は2816基となる。単精度浮動小数点演算性能は5.24TFLOPS,倍精度浮動小数点演算性能は2.62TFLOPSに達するという。
 一方のW8100は,44基のCUでシェーダプロセッサ数は2560基。単精度浮動小数点演算性能は4.2TFLOPSで,倍精度浮動小数点演算性能は2.1TFLOPSというスペックとなっている。

 AMDにてビジュアルコンピューティング部門担当副社長を務めるRaja Koduri氏は,ワークステーションブランドのFire Proシリーズが10年間に250倍もの性能向上を実現したことを「感慨深い」と振り返る。そして,この性能向上は「これからも続くであろう」と自信を示していた。

Raja Koduri氏(Corporate Vice President,Visual Computing,AMD)
Radeon R9 200
AMDのワークステーション向けGPUラインナップ

AMDのワークステーション向けGPUは10年間で250倍の性能向上率を達成した
Radeon R9 200

FirePro W9100(左)とFirePro W8100(右)の主なスペック。W9100の実勢価格は約65万円前後。倍精度浮動小数点演算(Double Precision)がW8100より低くみえるが,これは「2TFLOPS以上」である。実勢価格が35万円前後のW8100は,価格性能比の優秀さが訴求点だ
Radeon R9 200 Radeon R9 200

AMDのKoduri氏,およびRichard Huddy氏(写真右側,Game Scientist,CTO,AMD)とともにFirePro W8100を掲げるMandira Bediさん(写真中央)。Huddy氏の「一枚,差し上げるよ」とのジョークに,デモ機を指差して「あそこのOculusの方がいいわ」と,またもスパイスの効いたインドジョークが……
Radeon R9 200
 ここで,ゲストとしてインドの人気女優Mandira Bediさんが登壇した。人気ドラマ「24」のインド版でヒロインを務める彼女は,インドの映画やドラマでもCGが多用されるようになっており,その制作現場ではGPUが積極活用されていると説明する。
 ちなみに,彼女はコアゲーマーなのだそうで,お気に入りのゲームは「Temple Run」と「Angry Birds」とのこと。……まるっきりAMDとは関係ないゲームだが,インド流のジョークだろうか。

 FirePro W9100・W8100の発表に続けて,プロ向けグラフィックスに関する話題が2つアナウンスされた。

レイトレーシング(パストレーシング)エンジンFire Renderの説明スライド。OpenCLベースなので,NVIDIA GPUでも動作可能だ
Radeon R9 200
 1つめの話題は,OpenCLベースの新レイトレーシングエンジン「Fire Render」である。これは,2014年8月にカナダで開催されたSIGGRAPH 2014で発表されたもので,GCN世代のRadeonやFireProに対応し,OpenCL環境上で動作するレイトレーシングエンジンだ。
 なお,SIGGRAPH 2014で発表されたものから,内容,デモともに更新された情報はなかったので,詳しく知りたい人はSIGGRAPH 2014のレポート記事を参照してほしい。

 2つめの話題は,インドの映像制作産業とAMDが強いパートナーシップを結んでビジネスを展開しているという話だ。その具体事例としては,2つのケースが紹介された。

S. S. Rajamouli監督はビデオメッセージのみの登場。当初は本人が登壇予定だったが,新作映画の撮影でキャンセルされたうえ,ビデオメッセージの背後に新作のセットが映ってしまったため,映像は撮影禁止だった
Radeon R9 200
 最初の事例は,インド映画界の巨匠であるS.S.Rajamouli監督の事例である。Rajamouli監督は,コメディ映画からアクション映画まであらゆるジャンルの映画でヒットを飛ばしており,インド国内の映画賞をいくつも受賞しているというヒットメーカーだ。
 ちなみに,超人的な能力を持つ蠅の活躍を描いたホラーコメディ「Eega」は,2013年度のインド映画賞で最優秀特殊効果賞(Best Special Effects)を獲得している。

 このRajamouli監督は,CGを効果的に活用した作風が特徴であるそうだが,実はKoduri氏の従兄弟にあたるのだという。その関係で,10年以上前からKoduri氏は,Rajamouli監督作品のCG特殊効果に関する技術アドバイザーを務めているのだそうだ。そんなバックグラウンドもあり,Rajamouli監督の映画で使われるCG特殊効果は,AMDのFireProシリーズで制作されているのだという。

 2つめの事例は,インドの映像制作者向け専門学校「MAAC」での採用事例だ。登壇した同校のRam Warrier氏は学校の機材としてAMD GPUを積極的に採用していると語っていた。

Ram Warrier氏(Business Head,MAAC,左)。同校のコンピュータセンターにあるワークステーションは,65%がAMDのFireProベースという(右)
Radeon R9 200

 AMDがインド映画産業へのビジネス展開に肩入れするのは,別にAMDのキーパーソンがインド映画産業に太いパイプを持っているからではない。聞いたことのある人もいると思うが,インドは映画大国で,年間の制作本数はハリウッドの2倍近くもあるのだ。そうしたインド映画でも,CGが活用されるようになってきているとあれば,AMDが新興市場として注目するのも自然な流れなのである。そのインドにおける積極的なセールス活動が一定の効果をもたらしているというのが,今回のアピールというわけだ。


Tongaコア採用「Radeon R9 285」の詳細情報が公開


 ワークステーション向けGPUに続いての話題は,2014年8月に発表された新GPU「Radeon R9 285」(以下,R9 285)である。
 既存の「Radeon R9 280」は,型番こそ「Radeon R9」シリーズではあるものの,その中身はRadeon HD 7900系のGPUコア「Tahiti」をリネームしたものであった。それに対して,Radeon R9 285は,新しいGPUコア「Tonga」を採用している。

Radeon R9 285を解説するRichard Huddy氏
Radeon R9 200
Radeon R9 285の特徴をまとめたスライド

Radeon R9 200 Radeon R9 200
Radeon R9 285とともに発表されたゲームバンドルキャンペーン「Never Settle: Space Edition」(左)。R9 285を購入すると対象のゲームを3タイトル,無料で入手できる。目玉は「Alien: Isolation」と「Star Citizen」の2本だ(右)

 Tongaコアは,GCNアーキテクチャのGPUコアであるが,R9 280のTahitiコアはもちろんのこと,「Radeon R9 290」に採用された「Hawaii」コアよりも世代が新しいと,解説を担当したRichard Huddy氏は述べる。R9 285の詳細についてはレビュー記事を参照してもらうこととして,ここではHuddy氏が語ったTongaコアの新たな特徴を説明していこう。

R9 285の主な特徴(上)とスペック(下)。R9 290よりも世代の新しいGCNコアを採用しつつ,R9 280よりも優れた価格性能比を実現するという
Radeon R9 200
Radeon R9 200

 まずTongaコアでは,テッセレーションステージの性能が向上しているとHuddy氏は述べる。これは,ジオメトリパイプラインの内部バッファを強化増量したことによるものとのこと。テッセレーションの分割因子(Tessellation Factor)が増えれば増えるほど――つまり,ポリゴンを細かく分割すればするほど――,R9 280よりも優れた性能を発揮できるそうだ。

強化されたテッセレーションステージの性能を示したスライド
Radeon R9 200

 次の改良点は,「Lossless Delta Color Compression」機能の搭載だ。これは,ピクセルデータを可逆圧縮して,実効メモリ帯域幅を向上させる機能である。

 競合であるNVIDIAは,第2世代Maxwellコアを採用した「GeForce GTX 980」を発表したときに(関連記事),Lossless Delta Color Compression機能の改良によって,「GK104※1と比べて,メモリバスの消費量を約25%低減できた」とアピールしていた。
※1 「GeForce GTX 680」や「GeForce GTX 770」のGPUコア。

 Tongaコアでは,Lossless Delta Color Compression機能をレンダーバックエンド側に搭載している。これにより,レンダリング結果の書き出しだけでなく,テクスチャユニット経由の読み出しにも対応できるという。Tongaコアではこの機能でも負けていないとアピールしているわけだ。

 ちなみに,Delta Color圧縮とは差分量子化圧縮のことであり,ベストケースとワーストケースで性能差が生じる。Huddy氏によれば,ベストケースでの性能は,メモリバス幅が384bitのR9 280より,約1.4倍も実効帯域が向上するという。R9 285のメモリバス幅は256bitなので,R9 280の384bitと比べれば3分の2しかない。ベストケースとはいえ、この差を覆して約1.4倍もの性能向上を実現できるというのは,なかなか驚くべきものがある。

TongaコアのDelta Color Compression機能は,メモリバス幅削減のデメリットを覆すほどの性能を持つというスライド
Radeon R9 200

Tongaコアで導入されたネイティブ命令セット
Radeon R9 200
 またTongaコアでは,命令スケジューリングの改良が行われたほか,シェーダプロセッサが扱うネイティブ命令コードが追加されているとHuddy氏は述べる。具体的には,「16bit半精度浮動小数点や16bit整数を扱う新命令セットの追加」や「SIMDレーンをまたいだデータ列に対する並列演算命令の追加」などがそれに当たるとのこと。
 16bitデータを扱う命令は,演算の精度よりも速度を重視したアプリケーション,あるいは映像や音声などのメディア処理向けに拡張されたもので,SIMDレーンをまたいだ並列演算命令は,特定のGPGPU用途に向けた新命令である。

Tongaコアでは内蔵スケーラー回路の品位が向上し,4K解像度にも対応した
Radeon R9 200
 Huddy氏によれば,Tongaコアでは,表示画像の解像度を変換するスケーラー回路でも,画質向上のために仕様拡張が行われたそうだ。この改良されたスケーラー回路は,変換元および変換先の解像度として4K解像度(3840×2160ドット)にも対応しているとのこと。
 ただし,ディスプレイエンジン周りの仕様は,R9 280から据え置かれているそうで,HDMIによるRGB各8bitの4K/60Hz(60fps)出力や,YUV444の4K/60Hz出力といったHDMI 2.0に必要な仕様には対応していないそうだ。また,AMDが推進しているディスプレイ同期技術「FreeSync」(VESAの規格名「Adaptive-Sync」)に対応している。

Radeon R9 200 Radeon R9 200
TongaコアRadeon R9 285はGPU主動のディスプレイ同期技術「FreeSync」に対応する

 AMDが誇るハードウェアビデオエンコーダ/ハードウェアビデオデコーダもTongaコアでアップデートが施された。ただし,4K解像度の映像で使われると見込まれているコーデック「H.265」には未対応で,既存のH.264対応エンコーダとデコーダの性能が強化されたのだという。

 まず,ビデオデコーダの「Unified Video Decoder」(以下,UVD)は,H.264の最上位プロファイルである「High Profile Level5.2」に対応した。これにより,4Kで60Hz(※3840×2160ピクセルで最大66.8Hzまで)に対応するほか,1920×1080ドットでは,最大172Hzという高フレームレートの動画再生に対応できるとのことだ。
 ビデオエンコーダの「Video Coding Engine」も,H.264対応とはいえ4K/60Hzのリアルタイムエンコードに対応している。動作クロックの向上などによって性能が大幅に向上しており,理論上は3ストリーム分の4K/60Hz映像を同時エンコードできるという。

アップデートされた新ビデオエンジン。H.265には未対応だが4K時代へと順当に適応している
Radeon R9 200


R9 285はTongaコアの全能力を開放したものではない

隠された機能や仕様をひもとく


 Tongaコアで導入された新要素はまだ他にもある。講演とは別に行われたグループインタビューでKoduri氏は,Tongaコアが「GPU Graphics Preemption」と「GPU Compute Context Switch」という機能に対応したことをほのめかしていた。「ほのめかす」という表現を使ったのは,Koduri氏がはっきり「対応した」とは明言しなかったためだ。

2012年のAMDイベントで披露されたAMDのGPUロードマップ。Tongaコアでついに,ロードマップの右端にある機能までサポートされた
Radeon R9 200

 これまで,GCN世代のAMD GPUは,同一コンテクストで異なるカーネルを同時に動かすことはできたが,異なるコンテクストの実行をかける(発行する)ことはできなかった。Tongaではこれが可能になったというのだ。
 もう少し分かりやすくたとえると,「アプリケーションA」のカーネルをGPUコアが実行中に,「アプリケーションB」のカーネルを実行するよう,GPUコアに対して命じられるようになった。ここで重要な点は,「同時に実行できる」のではなく「実行を発行できる」ということだ。

 アプリケーションAのカーネルを実行中にアプリケーションBのカーネルが発行されると,GPUが「アプリケーションBのカーネルを実行する必要がある」と判断した場合,アプリケーションAのカーネル実行に関連した情報を退避したのち,アプリケーションBのカーネルを実行するように動作する。GPUコア内のCUに手の空いているものがあれば同時実行もできるという。

 こうした機能がなんの役に立つのかといえば,GPU仮想化の実現だ。ゲーム寄りの説明をするなら,クラウドゲーミングのために複数の仮想マシンを動作させる必要があるGPUサーバーを実現するために,極めて有用な機能である。

 またTongaコアでは,条件分岐の処理をより効率的に行う改良も施されているようだ。
 CPUが条件分岐を処理する場合,「結果が正なら命令Aを,否なら命令Bを実行」という形での処理が一般的だ。プログラム経験のある人には,「IF 条件 THEN 命令A ELSE 命令B」といえば分かりやすいだろう。
 一方,GPUでの条件分岐はこれと異なり,「周辺ピクセルをひとまとめにして,結果が正の場合の命令Aと,結果が否の場合の命令Bを両方とも実行する」という処理を行うのだ。命令Aと命令Bの両方を実行しなくてはならないので,CPUの条件分岐処理と比べて,どうしても処理に時間がかかる。GPUによる条件分岐処理が遅いのはこれが理由でもあるのだ

 そこでTongaコアでは,「結果が正の場合」を処理するCUとは別のCUに,「結果が否の場合」だけの処理を渡して実行させる機能が導入された。この方式なら,それぞれのCUは命令A,または命令Bだけを実行すればいいので処理時間を短縮できる。分岐後に処理すべき命令が長いほど,この効果は大きくなるわけで,全体の処理効率が大きく改善できるというわけだ。

 ただし,R9 285でこれらの機能が有効化されるかどうかは不明である。
 たとえばKoduri氏は,Tongaコアが備えるすべてのCUやレンダーバックエンド,メモリコントローラが,R9 285で有効化されているわけではないと,明言はしないまでも匂わせていた。つまり,R9 285はTongaコアのフルスペック版ではないというのだ。
 現在のR9 285は,CUが28基でシェーダプロセッサ数は1792基,レンダーバックエンドは4基で,256bitのメモリインタフェースという構成となっている。だが,同じTongaコアをベースとしながら,CUが32基でシェーダプロセッサ数2048基,レンダーバックエンドが6基,384bitメモリコントローラという上位モデルが登場するという可能性もあり得る。R9 285のレビューでの推測が,Koduri氏によって裏付けられたといえよう。

 AMDはそう遠くないうちに,別のイベントを計画しているという。フルスペック版のTongaコアを採用するGPUは,そこで発表される可能性がある。4Gamerのレビューで,「1920×1080ドットまでの解像度で使うなら,非常にバランスの取れたGPU」と評されたTongaコアがフルスペックで登場したならば,どれくらいの性能を発揮できるのだろうか。今から楽しみでならない。

AMDのRadeon R9シリーズ製品情報ページ


  • 関連タイトル:

    Radeon R9 200

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
トピックス
スペシャルコンテンツ
注目記事ランキング
集計:05月21日〜05月22日