オススメ機能
Twitter
お気に入り
記事履歴
ランキング
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
西川善司の3DGE:NVIDIAが「GeForce GTX 1080」の発表会で語ったこと,語らなかったこと
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2016/05/10 00:30

連載

西川善司の3DGE:NVIDIAが「GeForce GTX 1080」の発表会で語ったこと,語らなかったこと

Jen-Hsun Huang氏(Co-founder, President and CEO, NVIDIA)
 北米時間2016年5月6日,NVIDIAは,DreamHack Austinの開催に合わせて自社イベントを開催し,その場で,同社の社長兼CEOであるJen-Hsun Huang(ジェンスン・フアン)氏が,Pascal世代の新GPU「GeForce GTX 1080」(以下,GTX 1080)とその下位モデルである「GeForce GTX 1070」(以下,GTX 1070)をアナウンスした(関連記事)。

 氏はこの場で,「New King」としてGTX 1080を紹介していたが,それとは別に,「New Art Form」「New Sound」「New Tech」の3テーマでも発表を行っている。その一部は4Gamerでも速報としてお伝え済みだが(関連記事1関連記事2),ここでは,現地からのレポートとして,NVIDIAの総帥が語った内容と,それに基づく筆者なりの考察をまとめてみようと思う。

Huang氏はイベントのテーマとして4つの話題を挙げていた
GeForce GTX 10


GTX 1080とGTX 1070の要点


GTX 1080のリファレンスカードを掲げるHuang氏
GeForce GTX 10
 まずはNew King,要するに「地球上,最強のGPU」として紹介されたGTX 1080と,その下位モデルであるGTX 1070からだ。

 GTX 1080は,GPU Technology Conference 2016(GTC 2016)でデビューした数値演算用途の「GP100」とは異なるGPUコアを採用するGPUで,そのCUDA Core数は2560基。Maxwell世代のGM200ベースとなる「GeForce GTX TITAN X」(以下,GTX TITAN X)だとCUDA Core数は3072基,「GeForce GTX 980 Ti」(以下,GTX 980 Ti)だと同2880基なので,それらと比べるとシェーダプロセッサ数は少ない。ただ,直接の置き換え対象となる「GeForce GTX 980」(以下,GTX 980)だとCUDA Core数は2048基なので,そちらと比べると25%増しという計算だ。
 採用する製造プロセス技術はGP100と同じ16nm FinFETで,総トランジスタ数は約72億個。GM200だと約80億個,GM204だと52億個だから,規模感としてはGM200により近い。

GeForce GTX 10
イベントには,Unreal Engine 4の開発元であるEpic Gamesの創設者(の1人)にして,今なお最前線でカリスマプログラマーとして活躍するTim Sweeney(ティム・スウィーニー)氏が登壇。新作タイトル「Paragon」のデモをGTX 1080で動作させた
GeForce GTX 10
デモ実行時におけるGTX 1080のランニングステータスがこちら。GPUクロックは2.114GHz,メモリクロックは5508MHz相当で,GPU温度は67℃となっていた
 では,そんなGTX 1080が「GTX TITAN X比で2倍」(Huang氏)という性能を実現できるのはなぜかというと,GTX 1080はブーストクロック1.7GHz,ブースト時の最大クロック2.1GHz以上という,Maxwell世代を圧倒する動作クロックを実現できるからだ。
 ちなみにHuang氏は,GTX 1080の理論性能値となる単精度浮動小数点演算性能を9 TFLOPSとしているが,これは2560基の1.75GHz動作時に得られる値となる。

 また,メモリインタフェースは256bitで,こちらもGM200の384bitより狭いが,GTX 1080ではGDDR5Xを採用することで,この“負い目”を補おうとしている。GDDR5Xの詳細は大原雄介氏による解説記事を参照してほしいが,簡単に言えば,制御系はそのままに,データ転送レートだけをGDDR5比2倍に高めた高速改良版だ。
 もっとも,GTX 1080におけるメモリクロックは10GHz相当で,メモリバス帯域幅は320GB/sと,GTX TITAN XやGTX 980 Tiの336.5GB/sにはちょっと足りない。ただし,GTX 980の224GB/sに対しては圧倒的に高い数字となっている。

 ここまでをまとめると,GTX 1080というGPUは,製造プロセスのシュリンクを活かしてより高クロックで動作させることにより,前世代のトップエンドGPUを圧倒する演算性能を稼ぎ,同時に,GDDR5Xの採用でメモリバス帯域幅も稼いだ製品,ということになる。
 Huang氏はGTX 1080が採用するGPUコアの開発コードネームもダイサイズも明らかにしなかったが,製造プロセス技術が28nmから16nm FinFETへと大きくシュリンクされるため,コスト的な優位なのは間違いないだろう。ゲートの作り方が異なるので一概には言えないものの,製造プロセス技術が28nmから16nmへシュリンクすると,同じトランジスタ数ならばダイ面積は約3分の1になるからだ。

 GTX 1080搭載カードは北米時間5月27日に,北米市場におけるメーカー想定売価599ドル(税別)で発売予定だ。デビュー時の価格で比較すると,GTX 980は同549ドルだったので,50ドル高いスタートとなる。また,NVIDIAは今回,より高いブーストクロックでの動作を期待でき,よりよい部材も採用しているという高品位なリファレンスデザイン版カード「Founders Edition」も用意すると言うのだが,そちらは同699ドルと,GTX 980 Tiがデビューしたときの同649ドルより50ドル高い。このあたりは,国内における販売価格をイメージするときの参考になりそうだ。

GTX 1080は,北米時間5月27日に日本を含む世界市場で発売予定
GeForce GTX 10

 なお,北米時間6月10日に発売予定のGTX 1070は,GDDR5XではなくGDDR5メモリを搭載し,搭載グラフィックスカードの想定売価が379ドル(税別)となる。Founders Editionは449ドルだ。「GeFore GTX 970」だと同299ドルだったので,「7系」としてはMaxwell世代よりも高い設定ということになる。
 ちなみにGTX 1070のCUDA Core数は明らかになっていないが,6.5 TFLOPSという動作クロックが仮に1.75GHz動作時のものだとすると,1856基という計算だ。実際にはもう少し動作クロックが低く,CUDA Core数は多くなるのではないかと思うが。

GTX 1080より少し遅れての登場となるGTX 1070も,単精度浮動小数点演算性能ではGTX TITAN Xの6.144 TFLOPSを上回る
GeForce GTX 10

 ……と,性能指標と価格,発売時期を明らかにしたHuang氏だが,一方で「GP100ではない」新コアの詳細など,アーキテクチャ周りについては何も語っていない。Founders Editionの詳細に関する公式の言及もない状態で,このあたりは,世界中のレビュワーに対する情報開示とその解禁を待つ必要があるだろう。


ゲーム画面キャプチャ機能の新形態「Ansel」


 New Art Formは,「ゲーム画面のキャプチャ機能の新形態」となる新機能「Ansel」(アンセル)のことだ。

 従来のゲーム画面キャプチャツールは,ディスプレイへ表示するフレームが描き込まれているバッファを保存するようなアプローチによる実装となっていた。そのため,取得できる画面ショットは当然のことながら,見えているものそのものということになる。

 それに対してAnselでは,ゲーム内のシーンを別の角度からキャプチャできるだけでなく,ポストプロセスフィルタによる簡易的なレタッチを行ったり,オリジナルとは異なる色深度でキャプチャし,それを「OpenEXR」形式で書き出したりできる。さらには,ゲームランタイムの設定解像度から独立した,まったく別の解像度でキャプチャすることすら可能だ。

Anselで可能になる新しいキャプチャ手法
GeForce GTX 10

 驚かされるのは,対応ゲームタイトルでAnsel機能を発動させると,ゲームの進行が止まって,視点制御までがAnsel側に移ってしまう点である。ある瞬間のゲーム世界やキャラクターを,別の角度からキャプチャできるようになるのだ。

 キャプチャ画角は最大360度で,全周画像としてキャプチャできるため,その画像をVR(Virtual Reality,仮想現実)対応のヘッドマウントディスプレイ(以下,HMD)で楽しめるようになる。
 レタッチ機能は,色調変更といった基本機能だけでなく,3Dグラフィックスらしい被写界深度表現をはじめとした光学エフェクトにまで及ぶ。

GeForce GTX 10
ゲーム世界の360度キャプチャにも対応する
GeForce GTX 10
ポストエフェクトでレタッチ可能。Vignetteとは,周辺減光効果のこと

 OpenEXRというのは,Star Wars(スター・ウォーズ)で知られるGeorge Lucas(ジョージ・ルーカス)監督が設立した映画スタジオ「Lucasfilm」のCG特殊効果部門「Industrial Light&Magic」(ILM)が規定した色深度フォーマットのこと。要するに,RGB各コンポーネントを16bit浮動小数点で表現できるハイダイナミックレンジでのキャプチャが行えるというわけである。

8Kを超える解像度でキャプチャ可能
GeForce GTX 10
 最後にキャプチャ解像度は,ディスプレイ側のそれをはるかに超える設定が可能だ。これはキャプチャした画面ショットから画面内の一部を切り出したときに十分な解像度が保てるようにするためのものとなる。

 これらAnselの機能は,Pascal世代のGPU専用というわけではなく,従来のGeForceでも利用可能という。実装形態は明らかになっていないが,視点の移動にも対応している以上,「GeForce Experience」から誰でも簡単に,どのタイトルでも……というわけにはいかないだろう。5月7日掲載の記事でもお伝えしているとおり,当初の対応タイトルは7本だが,これら7本では,ゲーム(エンジン)側と強く連携することで実現していると推測される。

 そもそも視点移動は,実質的にはプレイヤーキャラクターの移動にも相当するわけで,動かしすぎると,ゲームエンジンが処理しているシーンの範囲を超えてしまう可能性もある。また,画角を最大の360度に設定した場合は,本来は描かない背面側オブジェクトや,全周の影も生成しなくてはならない。

360度キャプチャした映像は,VR対応HMDで全天全周の360度映像(※静止画)として見ることができる
GeForce GTX 10 GeForce GTX 10

360度キャプチャした映像は,Google CardboardなどのいわゆるVRゴーグルで見ることも!
GeForce GTX 10 GeForce GTX 10

 Ansel機能は,果たして「ゲームエンジン側から,ジオメトリやテクスチャ,シェーダなどといったレンダリングリソースのすべてをもらって再レンダリングする仕組み」なのか。あるいは「ゲームエンジンをオーバーライドしてしまう仕組み」なのか。この点を,Huang氏は明らかにしていない。いつ実装するのかも,である。
 ちなみに,イベント後に話を聞いたNVIDIA関係者によれば,Anselという名称は「有名な写真家から拝借した」そうだ。おそらくは20世紀に活躍した写真家,Ansel Adams(アンセル・アダムス)のことを指しているものと思われる。

GeForce.comのAnsel概要説明(英語)



レイトレーシングエンジン「OptiX」をサウンド処理に応用した「VRWorks Audio」


新しいサウンド技術としてVRWorks Audioが登場
GeForce GTX 10
 New SoundとしてHuang氏が発表したのが,NVIDIAのVR開発支援ライブラリ「VRWorks」の新機能「VRWorks Audio」であった。

 VRにおいて,ユーザーは全天全周の映像が楽しめるわけだが,その映像と「辻褄の合う音」が,いま求められている。
 現在のところ,多くのVR対応サウンドエンジンは,音の定位を全天全周に対応するだけで留まっている。言い換えると,行われているのは音源の位置とユーザーの位置との相対位置関係に基づく定位計算だけであり,音源がシーン内のオブジェクトによって遮蔽されたり,あるいは音が反射したりする要素はサポートされていないのだ。現状の「VRサウンドシステム」は,360度定位に対応するものの,ユーザーはその直接音しか聞けていないのである。

従来,VRの音処理は全天全周に定位させるだけで,「ユーザーに聞かせる音」は直接音のみだった(左)。それを間接音まで拡張するのがVRWorks Audioだ(右)
GeForce GTX 10 GeForce GTX 10

 それに対して今回のVRWorks Audioは,遮蔽や反射をサポートする。そしてその計算には,NVIDIAが誇るCUDAベースのプログラマブルレイトレーシングエンジン「OptiX」を利用するという。

 NVIDIAは,レイトレーシングエンジンOptiXを,物理シミュレーションにおける衝突判定に応用できることを予告してきたが,それをサウンド処理に応用してみた結果が,VRWorks Audioというわけなのだ。

 Huang氏は,プレゼンテーションにおいて,「音源の位置から1000以上のレイ(ray,線)を投げて,その反射波に対して畳み込み演算を行う」と,VRWorks Audioの概要説明を行っていた。全天全周に定位した音の反射音(=位相が逆転した音)や,遮蔽音(=特定の周波数が減退した音)を,VRWorks Audioでは再現できると見られる。

 レイトレーシングにおける「レイの処理」が,粒子としての処理になるのを知っている人も多いだろう。レイトレーシングでグラフィックスを描画するときは,波としての光が持つ性質は無視するか,陰影計算時にBRDF(Bidirectional Reflectance Distribution Function:双方向反射率分布関数)などを用いて近似的にエミュレーションすることとなる。

 レイトレーシングで音を取り扱うVRWorks Audioでは,反射音や遮蔽音以外を,果たしてどのレベルまでサポートするのか。たとえば,誰もが知る音響効果の1つ,ドップラー効果――過ぎ去る救急車のサイレンの音程が下がって聞こえる現象――などは,音を波動レベルで計算しなければ再現できないわけだが,こういう具体例をHuang氏は挙げなかった。
 なお,NVIDIAは,VRWorks AudioのデモとしてVRコンテンツ「VR Funhouse」を近日中にリリースするとしている。VRWorks Audio,そしてVR Funhouseも,Pascal世代だけでなく,従来のGeForceをサポートするとのことだ。


GeForce.comのVRWorks Audio概要説明(英語)



新技術「Simultaneous Multi-Projection」とは?


 最後のNew Techとして紹介されたのは,「Simultaneous Multi-Projection」(サイマルテイニアス・マルチプロジェクション)というものである。直訳すると「同時複数投射」機能だが,これは何だろうか。

ごく一般的な3Dグラフィックスにおける投射の仕組み
GeForce GTX 10
 3Dグラフィックスというものは,内部処理的には3Dであるものの,描画時には2D平面上に投射(=projection)する。通常は,これでなんの問題もない。

 しかし,VR対応HMD向けに2眼分描画するケースでは,この投射処理を1つのシーン描画につき2回行わなければならない。また,単なるマルチディスプレイ表示ではなく,オブジェクトの形や配置に応じた表示をマルチディスプレイ環境に対して行いたい場合も,ディスプレイ枚数分だけ投射を行う必要がある。

VRシステムにおいては,2視点分の投射が必要だ(左)。また,3画面などのマルチディスプレイ環境で,VRシステムに近い,視点から見えるオブジェクトの形に応じた描画を行いたい場合には,ディスプレイ枚数分(=視点の数だけ)の投射を実装する必要がある
GeForce GTX 10 GeForce GTX 10

 投射回数が複数あるというのは,レンダリングパイプラインをその回数だけ回さなければならないことと同義だ。しかし,1回のレンダリングパイプラインで,異なる投射(=異なるビューポート)を実現できれば,間違いなくレンダリング効率は向上する。だから「同時複数投射」機能なのである。

Simultaneous Multi-Projection機能の無効時(左)と有効時(右)におけるフレームレート比較。有効化でフレームレートは約1.5倍に向上するとHuang氏は胸を張っていた
GeForce GTX 10 GeForce GTX 10

 しかも,話はここで終わらない。
 VRの場合,拡大光学系の接眼レンズによって映像が歪むわけだが,その歪みを吸収するために逆歪みを与えて描画することで,接眼レンズを通して見たとき正常な視界を得られるようにしているのが,今日(こんにち)におけるVR HMDの描画手法となる。そしてそのとき,拡大光学系ではレンズ外周が大きく歪むことが知られているのだが,それなら,映像外周を低解像度で描画し,中央を高解像度で描画するような投射系を実装すれば,さらに効率は上がるのではないか?

VRにおいては,「接眼レンズの歪みに倣った4分割の湾曲した投射系」を1眼ごとに実装するほうが無駄のないピクセル描画を行えるというのがNVIDIAの言い分
GeForce GTX 10
 ということでNVIDIAは今回,「1眼あたりの投射系を4分割して与える最適化をしてみました」という技術アプローチも発表している。この場合,1眼あたり投射系は4個なので,2眼で合計8個の投射系を1回のレンダリングパスで駆使することになる。
 このSimultaneous Multi-Projection機能は,GeForce GTX 1000シリーズ専用機能として提供するとのこと。両GPUでは最大で16個の投射系を1回のレンダリングパイプラインで適用できるという。

Multi-Res Shading
GeForce GTX 10
 ここで,記憶力のいい人はVRWorksの「Multi-Res Shading」を思い出すのではないだろうか。
 Multi-Res Shadingは,ジオメトリシェーダの活用により,1ポリゴンを異なる方向に投射する処理系を実装することで実現していた機能だ。そのため,Simultaneous Multi-Projection機能も発想としては同じモノではないかという推測は成り立つのだが,しかし今回,Huang氏はその技術的な詳細を明らかにしていない。

 もしかすると,Simultaneous Multi-Projection機能は,ジオメトリシェーダを活用するのではなく,ポリゴンからピクセルに分解する機能ブロックであるラスタライザ(Rasterizer)をプログラマブルに拡張したものなのかもしれない。プログラマブルラスタライザは新世代GPUへの搭載が見込まれてきた機能なので,ひょっとすると,NVIDIAが先陣を切って搭載してきた可能性がある。
 そしてその場合,DirectXなどから標準機能としてサポートされなければならない。NVIDIA単独の機能拡張では,ゲーム開発者やアプリケーション開発者が積極的に活用する機能にはなり得ないからである。

 Simultaneous Multi-Projection機能がどういう仕組みで実装されているのかは,注視していく必要があるだろう。


 ……といったところで,Huang氏は見事に,技術面の核心に関する言及を避けたというのが,発表会を通じての感想だ。今回残された「謎」については,取材を進め,あらためて解説したいと思う。

Huang氏の講演後に立ち上がったGTX 1080特設ページにおける公開情報を基に,GTX 1070および従来製品とスペックを比較してみたが,肝心の部分は見事に分からない。なお,SLIブリッジは今回,Maxwell世代比で2倍の帯域幅を持ち,GTX 1080専用となる「SLI HB Bridge」に変わるとのことだ
SLI HB Bridgeのイメージ

NVIDIAのGTX 1080特設ページ

  • 関連タイトル:

    GeForce GTX 10

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
トピックス
スペシャルコンテンツ
注目記事ランキング
集計:04月23日〜04月24日