善:
「GeForce FXの頂点処理能力はGeForce 4Tiの2倍だ」ということを公言されていますね。ここから考えてGeForce FXの頂点シェーダーユニット数はGeForce 4Tiの2倍の4基と考えていいんでしょうか?
GB:
いや,違うんです。実はGeForce FXの頂点シェーダーは1基なんですよ。1基,2基,4基と増やしていくのはクラシックな方法で,Direct X9世代のGPUでは,この方法はうまくないと我々は思っているんです。そこでGeForce FXでは,非常に高性能なジオメトリプロセッサユニットを1基搭載するという,まったく新たなアプローチを見いだしたのです。
善:
それは具体的にどういう構造なんですか?
GB:
これまでのように明確に独立した複数の頂点シェーダーがあるわけではないのです。GeForce FXの頂点シェーダーは内部に複数の実数演算器を持っていて,頂点処理時にはそのつどその計算に必要な演算器をスケジューリングして効率良く利用していくんです。
善:
3DlabsのWildcatVPに使われているP10プロセッサもそれと同じ発想なんですね。P10では16基のジオメトリプロセッサをスケジューリングして使用する構造になっています。これはGeForce FXには同種のテクノロジーが使われていると解釈していいんでしょうか?
GB:
「同じ」と言い切ることなんてできませんよ,もちろん(笑)。
善:
どういった経緯でこういうアーキテクチャを採用したんですか?
GB:
とにかく,今や複数基の頂点シェーダーを持つだけでパフォーマンスが上がるなんていう単純なものではないんです。なぜなら,「ある頂点は非常にシンプルな変換処理しかしない」けれど「ある頂点については非常に長いGeForce FXならではの頂点シェーダープログラムが実行される」という場合に,単純な処理のほうは頂点シェーダーを持てあましてしまいますし,複雑なほうはもっと演算パワーが欲しいという状況に陥ります。
効率良く,スムースに頂点処理を行う場合には,我々のアーキテクチャの考え方のほうが自然なんですよ。
|
|
GeForce FXのデモ「Dawn」の見どころは,微妙な表情の変化を頂点シェーダを駆使して実現したフェイシャルアニメーション |
|