オススメ機能
Twitter
お気に入り
記事履歴
ランキング
パッケージ
Xeon Phi
  • Intel
  • 発表日:2012/06/18
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
機械学習の分野で「Xeon Phi 7200番台」を武器にNVIDIAと対抗するIntel,その戦略を語る
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2016/07/15 19:56

イベント

機械学習の分野で「Xeon Phi 7200番台」を武器にNVIDIAと対抗するIntel,その戦略を語る

Hugo Saleh氏(Director of Marketing and Industry Development,HPC Platform Group,Intel)
 2016年7月14日,Intelの日本法人であるインテルは,都内で機械学習業界関係者向けのイベント「インテル HPC&マシンラーニング・セミナー」と題するイベントを開催した。題名から想像できるとおり,最近話題の機械学習に対して,Intel/インテルがどのように取り組んでいるかをアピールするというものなのだが,4Gamerでは,イベントに先立って実施となった報道関係者向けラウンドテーブルに参加することができた。

 この数行の説明だけでも,ゲームとは何ら関係のないことが想像できると思うが,よく知られているとおり,機械学習はNVIDIAが総力を上げて取り組んでいる分野だ。そこで,業界の巨人となるIntelは何をしようとしているのか。今回はセッションのスピーカーである,IntelのHugo Saleh(ヒューゴ・サレー)氏による話を簡潔にまとめてみたいと思う。


第2世代Xeon Phiの性能やスケーラビリティはどれほどのものか


 Intelは,2016年6月のスーパーコンピュータ関連国際会議「International Supercomputing Conference 2016」(ISC16)に合わせて,開発コードネーム「Knights Landing」(ナイツランディング)と呼ばれていた第2世代のHPC(High Performance Computing)向けプロセッサ「Xeon Phi 7200番台」を発表している。

 Intelの機械学習に対する取り組みの中核をなすのは,このXeon Phi 7200番台だ。
 ニューラルネットワークは,古典的な逐次実行型のCoreプロセッサやXeonプロセッサよりも,並列実行に特化したプロセッサのほうが実装しやすく,かつ性能が出る。そして,Intelのラインアップの中で並列実行に特化したプロセッサはXeon Phiシリーズしかないため,必然的にXeon Phiが主役になるのである。

 なので,報道関係者向けセッションでSaleh氏はまずXeon Phi 7200番台の特徴をアピールし,その後,機械学習への取り組みを説明するといった流れでインテルの取り組みを語っていった。
 Xeon Phi 7200番台については2015年12月11日掲載の記事も参照してほしいが,Saleh氏はまず,「Xeon Phi(7200番台)はコプロセッサはない」という点から話を始めている。

Xeon Phi 7200番台における4つの「初」を記したスライド。1つめがコプロセッサではなくホストCPUとして機能すること,2つめが統合メモリの搭載,3つめは高速インターコネクト「Omni-Path Fabric」の統合,そして4つめは「SPECfp_rate2006」で世界記録を打ち立てたことだ。個別の話は後段で
Xeon Phi

 「Knights Corner」という開発コードネームで知られる第1世代Xeon Phiは,GPUと同じように,動作にはホストCPUが必要なコプロセッサだった。それに対してXeon Phi 7200番台はスタンドアロンで動作する。最小でも64基,最大72基という,圧倒的な数のプロセッサコアを集積した「CPU」として利用できるのである。

Xeon Phi 7200番台は,72基のプロセッサコアを統合する最上位モデル「7290」以下,「7250」「7230」「7210」までの4モデル構成となる。「(下位モデルの)Xeon Phi 7210は既存のXeonに近い価格設定」(Saleh氏)で,導入のハードルは低いという
Xeon Phi

 Xeon Phi 7200番台の4製品はいずれも,初採用となるIntel独自のインターコネクト「Omni-Path Fabric」を統合したラインナップがあるので,合計では8モデル展開ということになる。

Xeon Phi 7200番台のプロセッサパッケージ。左がOmni-Path Fabricを統合したタイプで,右はスタンドアロンタイプである
Xeon Phi Xeon Phi

 Xeon Phi 7200は,容量16GBの統合型メモリをオンパッケージで備えるのも大きな特徴だ。Saleh氏は「Micron TechnologyとIntelが共同で開発したもので,(この統合型メモリに)HBMの技術は使っていない」と述べている。DDR4メモリを積層したうえで,広帯域のバスでプロセッサコアと接続したものだそうだ。

Xeon Phi 7200番台の概要。オンパッケージで容量16GBの統合型メモリを搭載し,それとは別に6chのDDR4メモリコントローラを搭載し,最大384GBのプラットフォームメモリを確保できる
Xeon Phi

 Saleh氏はこのXeon Phi 7200番台について「『SPECfp_rate2006』で世界記録を打ち立てたことをとくに強調しておきたい」とその性能をアピール。続けて,「Xeon Phi 7200番台は,発表時の6月の時点で(アーリーアクセスのユーザーに対して)3万ユニットを出荷した。2016年中には10万ユニットを出荷する計画だ」と,実数を上げながら順調な滑り出しを強調した。

Xeon Phi 7200番台は2016年中に10万ユニットの出荷を計画しているそうだ。30以上のパートナーから搭載システムが発売となる予定で,30以上のISVからXeon Phi 7200番台向けのアプリケーションがリリースになるという。また,「日本では最先端共同HPC基盤施設(JCAHPC)がXeon Phi 7200番台を導入する」(Saleh氏)
Xeon Phi

 NVIDIAに挑戦する立場ということもあり,Saleh氏はライバルとなるGPUとの性能比較も示している。主にスケーラビリティに関する比較だが,いろいろと突っ込みどころは多い印象だ。
 たとえば,下のスライドは文字認識を行う2層ニューラルネットワーク「Word2Vec」において,Xeon Phi 7250と「GeForce GTX TITAN X」を比較したものだが,いくらTITANシリーズといえども,コンシューマ向け製品を比較対象にするのはどうかという気がする。

Word2Vecにおけるスケーラビリティの比較。横軸がノード数,縦軸が1秒間に処理した単語数だ。GeForce GTX TITAN Xのスコアは点線になっているが,これは1ノードと4ノードのデータからスケーラビリティを推定した線だからだそう。一方のXeon Phi 7250は実測値である
Xeon Phi

 また,下はK近似法(KNN)という,画像認識などで使われているアルゴリズムにおけるスケーラビリティの比較だが,こちらでも比較対象としてデュアルGPUカード「GeForce GTX TITAN Z」を使っていたりする。こちらはDPフルスピードモードにも対応する,かなり数値演算プロセッサに近い製品なので,GeForce GTX TITAN Xとの比較よりはまだ納得できるが……。

K近似法(KNN)における,競合とのスケーラビリティ。比較対象はGeForce GTX TITAN Zだが,テストコンフィグレーションが左と右のグラフで統一されていない点は要注意
Xeon Phi

 なぜGeForceとの比較になったかというと,NVIDIAが公開しているデータを引用したためとのことだった。つまり,実機ベースでの比較ではないとうわけだ。その妥当性はともかく,NVIDIAはPascalアーキテクチャを採用する「Tesla P100」を発表,発売済みなので,性能比較はあらためてなされるべきではなかろうかと思う。

 むしろここで重要なのは,グラフに出ている数字よりも,グラフの説明にあたってSaleh氏が,Xeon Phi 7200番台では,GPUを利用することに伴う複雑さを解消できると繰り返していたことだろう。
 Xeon Phi 7200番台はx86命令完全互換で,なおかつスタンドアロンで動作するため,特別なプログラミング言語,それこそCUDAのようなものは必要ない。そこがXeon Phi 7200番台の持つ最大の優位性というわけである。


オープンさとFPGAを推すIntelの機械学習戦略


 さて,本題である。
 Xeon Phi 7200番台を武器に,Intelは機械学習の分野でどのような戦略を描いているのか。その点でSaleh氏がまず強調したのが,オープンソースをベースにしたHPCに対するIntelの取り組みである。
 Linux Foundationが中心となって立ち上げた,オープンなHPC向けのフレームワークの構築プロジェクトとして「OpenHPC」があるが,IntelはこれをXeon Phi 7200番台搭載システムへ容易にインストールできるよう拡張した開発フレームワーク「Intel HPC Orchestrator」を2016年第4四半期にリリースする計画だという。

OpenHPCをベースにしたXeon Phi 7200番台向けフレームワークとしてのIntel HPC Orchestratorを,Intelは2016年第4四半期にリリースする予定だ
Xeon Phi

 Intelの機械学習に対する取り組みも,この例と同じようなものになり,オープンソースコミュニティとの共同で,Xeon Phi 7200番台への最適化を進めていくとのことである。すでにディープラーニングのフレームワークである「Caffe」のXeon Phi向け最適化が完了しており,現在はGoogle製機械学習ライブラリ「TensorFlow」の最適化に取り組んでいる最中だそうだ。
 現時点ですでにIntelは,機械学習に対して数千万ドルの投資を行っているが,これからも継続的に,積極的に投資を行っていくと,Saleh氏は述べている。

Intelはオープンソースコミュニティとの共同で,機械学習に取り組む。合わせて,Xeon Phi向けの演算ライブラリである「MKL」をベースとするディープラーニングライブラリもオープンソースとしてリリースするそうだ
Xeon Phi

 もう1つ興味深いのは,機械学習に対するFPGA(Field-Programmable Gate Array,プログラム可能なロジックLSI)の応用にSaleh氏が触れていた点だ。「FPGAを使った機械学習に関しては,2016年11月の『SC16』で具体的な発表を行う予定だ」という。

スーパーコンピュータに関する国際会議の1つ

 Intelは2015年に,FPGAの大手である米Alteraを買収しており,FPGAを自社製品戦略の1つとして加えつつある。「機械学習にFPGAを利用する」こと自体は,すでにいろいろなところでいろいろな取り組みがあるのだが,傘下にAlteraを抱えるIntelがここに乗り出してくるというのは,注目していいのではないかと思う。

 ちなみにNVIDIAは,ARMベースのプロセッサである「Tegra X」1を使って,機械学習に基づく自動運転やロボットの自律行動への応用例を示したり,第2世代Maxwellベースの数値演算プロセッサであるTesla Mシリーズを使った認識の高速化を行ったりして,学習から認識までトータルにNVIDIA製品でサポートできることをアピールしている。
 一方のIntelには,認識の部分をサポートできる製品がないように思えるが,その点をSaleh氏に聞いてみたところ「(Intelの)IoT製品を使った自動運転といったことにも取り組んでいく」という回答が得られた。

 将来的には,IoT製品だけでなく,FPGAによる認識のハードウェアアクセラレーションを,ロボットや自動運転といった分野に持ち込んでくる可能性もあるだろう。FPGA vs. GPUといった図式になるといろいろと面白そうだが,機械学習の分野でもNVIDIAとIntelの間では熾烈な戦いが繰り広げられることになりそうだ。

IntelのXeon Phi製品情報ページ(英語)

  • 関連タイトル:

    Xeon Phi

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
トピックス
スペシャルコンテンツ
注目記事ランキング
集計:10月15日〜10月16日
タイトル評価ランキング
81
KENGOHAZARD2 (PC)
76
鬼ノ哭ク邦 (PC)
76
Days Gone (PS4)
74
2019年04月〜2019年10月