オススメ機能
Twitter
お気に入り
記事履歴
ランキング
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
QRコードでLINEの4Gamer
アカウントを友達登録すると
月〜金の週5回,21時に厳選
ニュースをお届けします!
※購読にはLINEアプリが必要です
デスクトップPC向け10コア20スレッド対応CPU「Core i7-6950X Extreme Edition」レビュー。Broadwell-Eの可能性を探る
特集記事一覧
注目のレビュー
注目のムービー
印刷2016/05/31 15:00

レビュー

史上初のデスクトップPC向け10コアCPUが持つ可能性と,Broadwell-Eのポテンシャルを探る

Core i7-6950X Extreme Edition

Text by 米田 聡


 2016年5月31日15:00,Intelが,LGA2011-v3パッケージ採用のハイエンドデスクトップPC向けCPU「Broadwell-E」(ブロードウェル-E,開発コードネーム)を,Core i7-6900&6800番台として発表した。

Core i7-6950X Extreme Editionの性能評価用エンジニアリングサンプル。ヒートスプレッダ上の刻印は最終製品と異なるが,性能は変わらないとされている
Core i7(Broadwell-E)
 ラインナップは別途お伝えしているとおり4モデル。いずれも(基本的には,UEFI/BIOSアップデートを行えば)既存の「Intel X99」(以下,X99)プラットフォームで利用できるため,Haswell-E世代のCore i7-5900&5800番台のユーザーからすると,アップグレードパスとして価値を持つのが特徴だ。

 また,Haswell-Eでは最上位モデルとなる「Core i7-5960X Extreme Edition」(以下,i7-5960X)が8コア16スレッド対応で1000個ロット時価格999ドルだったのに対し,Broadwell-Eの最上位モデルとなる「Core i7-6950X Extreme Edition」(以下,i7-6950X)は,10コア20スレッド対応で同1569ドルと,いろいろ強烈になっているのも重要なポイントである。

 一方で,Haswell世代の22nmからBroadwell世代で14nmへ製造技術の微細化が進んだとはいえ,4コア8スレッド対応となるIntelのデスクトップPC向け主力CPU「Skylake-K」「Skylake-S」は,Broadwellよりも新しいSkylakeマイクロアーキテクチャを採用しているため,Broadwell-Eは言うなれば「新しいけれども古いCPU」ということになる。この状況でBroadwell-Eは,性能指向のゲーマーにとって選択肢となるのだろうか。
 今回4Gamerでは,短い時間ながらi7-6950Xを試すことができたので,可能な限りその実力に迫ってみたい。

Broadwell-Eは,現行のIntel製CPUである「Core i7-6700K」「Core i5-6600K」の上位に置かれることとなる
Core i7(Broadwell-E)


動作クロックはHaswell-EのExtreme Editionと変わらないまま,CPUコア数が10基に


 冒頭でも紹介したとおり,i7-6950Xは,i7-5960Xを置き換える,新しいExtreme Editionとなるが,両製品のカタログスペックにおける動作クロックは定格3.0GHz,最大3.5GHzで変わらない。つまりi7-6950Xは,Haswell-Eの22nm 3-D Tri-Gate transistors(3次元トライゲート・トランジスタ)技術からBroadwell-Eで14nm 3-D Tri-Gate transistorsへと製造プロセス技術が微細化したことによるヘッドルームを,CPUコア数を増やすことに振ったCPUという理解でいいだろう。

LGA2011-v3パッケージを採用するため,Haswell-Eとの間で,外観やランド数に違いはない。ただ,細かく見ると,i7-5960Xと比べて基板が約0.3mm薄くなり,その分,ヒートスプレッダが0.3mm程度厚くなっていた。おそらく,ヒートスプレッダの体積を増やして熱の拡散を向上させるために基板を薄くしたのだろう
Core i7(Broadwell-E) Core i7(Broadwell-E)

Core i7(Broadwell-E)
 ただ,別記事でも触れているとおり,「ただCPUコアが増えただけ」でもない。Broadwell-Eでは,少ない数のコアのみに負荷がかかっていて,かつ熱的,消費電力的に余裕のある局面では,「Turbo Boost Technology」(以下,Turbo Boost)の設定クロックよりもさらにクロック倍率を引き上げる「Turbo Boost Max Technology 3.0」(以下,Turbo Boost Max)が自動的に適用されるという。
 少数のコアのみに負荷がかかった状態という,非常に限られた発動条件ではあるものの,シングルスレッド動作ではHaswell-Eよりも高い動作クロックを期待できるわけである。

Xeon E7 v3の発表時に公開された,TSXの概要まとめスライド
Core i7(Broadwell-E)
 Broadwell-Eでは「TSX」命令セットが有効になっているのも,Haswell-Eからの重要な変更点となる。
 「Transactional Memory」(トランザクショナルメモリ)とも呼ばれるTSXは,簡単に言うと,スレッド間で依存があるメモリの書き換えにおけるオーバーヘッドを緩和してくれるのが特徴だ。

 TSX命令セット自体は,Haswell世代で実装済みなのだが,まさにその実装周りの問題で,Haswell世代では基幹サーバー向けの最上位モデルとなる「Xeon E7 v3」でしか有効化されなかった(関連記事)。
 それがBroadwell世代では,「Core i7-5775C」などデスクトップPC向けの一部などでTSX命令が有効になったわけだが,新製品となるBroadwerll-Eでも,当然のようにサポートされているというわけだ。

2016年4月にIntelが公開した「Broadwell-EPの概要」。Broadwell-Eは,Broadwell-EPと多くの部分で共通のハードウェア仕様を採用すると考えられる
Core i7(Broadwell-E)
 なおIntelは,Broadwell-Eの発表にあたり,マイクロアーキテクチャの詳細分については(少なくとも原稿執筆時点では)何も語っていないのだが,ベースとなっているプロセッサが2016年4月リリースの2-way(=2ソケット)対応型サーバー向けCPUで,開発コードネーム「Broadwell-EP」ことXeon E5-2600 v4番台なのはまず間違いない。
 なので,Broadwell-EPの持つ特徴である「浮動小数点演算時の遅延低減」などといった細かな改良は,Broadwell-Eでも適用されているはずである。

 以上を踏まえつつ,Broadwell-Eの4モデルとi7-5960Xの主なスペックを比較したものが表1となる。



テストには「Broadwell-E最適化済み」のMSI製マザーボードを利用


 今回,i7-6950Xのテストにあたっては,「Broadwell-Eへの最適化」をいち早く打ち出したMSI製のX99マザーボード「X99A GODLIKE GAMING CARBON」――正式リリース前には「X99A GODLIKE GAMING Carbon Edition」と呼ばれていた――を用いる。

X99A GODLIKE GAMING CARBON
メーカー:MSI
問い合わせ先:アスク(販売代理店) 03-5215-5652(平日10:00〜12:00,平日13:00〜16:00)
実勢価格:7万6000〜7万9000円程度(※2016年5月31日現在)
Core i7(Broadwell-E)

Core i7(Broadwell-E)
 X99A GODLIKE GAMING CARBONは,各所に配したカーボンシートのルックスを活かした,黒を基調とする外観のマザーボードだ。Broadwell-EのクアッドチャネルDDR4-2400メモリコントローラに向けたメモリ周りのチューニングを行っているのが特徴となる(関連記事)。

 最近のハイエンドマザーボードでは,グラフィックスカードの重さに耐えられるよう物理的な強度を高め,さらにEMIシールド効果も狙うべく,PCI Express x16スロットに金属製のカバーを装着するのが流行している。実際,X99A GODLIKE GAMING CARBONも「Steel Armor」として採用しているのだが,本製品ではさらに,それをDDR4メモリスロットにも採用し,高クロック動作のため,ノイズに弱くなっているメモリモジュールをEMIシールドで保護できるという。

PCI Express x16スロットとDDR4メモリスロットをSteel Armorが覆っている
Core i7(Broadwell-E) Core i7(Broadwell-E)

 ちなみに,最適化済みとされるX99A GODLIKE GAMING CARBONでも,i7-6950Xの利用にあたっては,事前にUEFIのアップデートが不可欠だった。そのとき同時に,Intel Management Engine(ME)の更新も入っていたので,Broadwell-Eの発売前に出荷されたX99チップセット搭載マザーボードでは,一律にUEFIのアップデートが必須になるのではないかと思う。
 X99マザーボードのユーザーは,Broadwell-Eへの対応に関し,各マザーボードメーカーの情報をチェックしたほうがいいだろう。

 なお前述のとおり,i7-6950Xではヒートスプレッダがi7-5960Xよりもやや厚くなったが,CPUパッケージそのものの高さは変わっていないため,CPUクーラーは,Haswell-E対応のものとの互換性を有している。マザーボード側のUEFIアップデートができるなら,Haswell-Eからの乗り換えに支障はないはずだ。


ゲームと一般アプリ,期初検証ツールでのベンチマークを実施


 さて,では実際のテストに移ろう。今回はi7-6950Xの比較対象として,直接の置き換え対象となるi7-5960Xを用意。さらに,現行のIntel主力製品であるSkylake-K&Sとの違いも見るべく,「Core i7-6700K」(以下,i7-6700K)も比較対象として用いることにした。
 i7-6950Xとi7-5960Xは同じマザーボードが利用できるため,CPU以外の環境を完全に揃えることができる。一方,i7-6700Kはマザーボード(≒チップセット)こそ異なるものの,DDR4 SDRAMに対応する点は同じなので,マザーボード以外の環境は完全に揃えた次第だ。

 ただ,ここで注意してほしいのは,別途お伝えしているとおり,Broadwell-EがクアッドチャネルDDR4-2400コントローラを統合しているということである。「テストに用いているメモリの仕様がi7-6950Xとi7-5960X,i7-6700Kで揃っている」という意味では公正な比較になっていると言えるが,i7-6950Xのフルスペックで動作させることはできていない

 なぜこんなことになったのかだが,試用期間が3日しかなく,かつ,Broadwell-EがDDR4-2400に対応するという公式情報が得られた時点で,すでにi7-6950Xは手元になかったというのがすべてである。
 やむを得ない事情により,テスト環境がこういうことになっているのは,あらかじめお断りしておきたい。

 そのほかテストシステムの詳細は表2のとおりだ。


 性能検証にあたっては,4Gamerのベンチマークレギュレーション18.0で採用しているタイトルから,「3DMark」(Version 2.0.2067)と「Fallout 4」,「ファイナルファンタジーXIV 蒼天のイシュガルド」の公式ベンチマーク(以下,FFXIV蒼天のイシュガルド ベンチ),そして「Project CARS」をピックアップ。3DMark以外はあえて描画負荷が低めのタイトルを選ぶことで,GPUボトルネックの発生を回避しようというわけだ。

 また同じ理由から,テスト解像度は,今回のテストシステムで採用するGPU「GeForce GTX 980 Ti」にとって十分に“軽い”と言える1600×900ドットおよび1920×1080ドットを用いることにした。
 実のところ,4Gamerのレギュレーションでは,CPUのベンチマークには解像度3つを用いるという規定があるのだが,今回は前述したテストスケジュールの都合により,端折ったことをお断りしておきたい。

 さらに,日常的なPCユースにおける性能をチェックすべく,Futuremark製の総合ベンチマーク「PCMark 8」(Version 2.7.613)をピックアップ。また,MAXON製のアニメーション制作ソフト「Cinema 4D」をベースとした定番のマルチスレッド対応ベンチマーク「CINEBENCH R15」も用いる。

 PCMark 8のテストでは,「Home」「Work」「Creative」という3つのワークロードにおけるテストを2回ずつ実行し,それぞれ,総合スコアの高いほうを採用することにした。
 今回は「Storage」ワークロードを省略しているが,これは,組み合わせているストレージがSerial ATA 6Gbps接続であるためだ。Serial ATA 6Gbps接続の場合,CPUの違いによる性能差はほとんど出ないことが分かっているので,限られた時間のなかで,テスト自体をカットした次第である。

Core i7(Broadwell-E)
 一方のCINEBENCH R15は,CPUが対応できるスレッド数を起動して全CPUコアに100%の負荷をかけるベンチマークとなる。IntelはBroadwell-E世代においてCINEBENCH R15におけるベンチマークスコアが大幅に上がっているとアピールしているので,確認してみようというわけだ。

 そして,ここまでのテストを通じて,実アプリケーションやゲームにおけるi7-6950Xの特徴が見えてるはずなので,そのうえで「なぜそうした特徴を持つのか」を調べるべく,後半では「Sandra 2016 SP1」(Build 2220)を使い,i7-6950Xの特性をより詳しく調べてみたいと考えている。

 なお,これも時間の都合によるものだが,別記事で紹介しているオーバークロック関連も,検証はすべて省略している。いずれ機会があればチェックしてみたいと思う。


実ゲームでは意外なフレームレートの伸びを見せるi7-6950X


 では,結果を順に見ていくことにしよう。グラフ1は3DMarkの総合スコアをまとめたものである。
 i7-6950Xのスコアは,対i7-5960Xで100〜103%程度,対i7-6700Kで100〜105%程度というものになった。3つあるテスト条件の中で最もCPUがスコアを左右しやすい「Fire Strike」におけるスコア差が最大となり,逆にCPUスコアが最も影響しづらくなる「Fire Strike Ultra」ではスコアはほぼ完全に横並びとなった。


 総合スコアはどうしてこういう結果になったのか。それを確認すべく,GPUテストとなる「Graphics test」,そしてCPUテストとなる「Physics test」のスコアをまとめたものがグラフ2,3となる。

 Graphics testの結果となる「Graphics score」は,i7-6950Xの分が悪い(グラフ2)。なぜこういう状況を向かえているのかは,この時点ではなんとも言えないが,i7-6950XがGPUの足をわずかながら引っ張っているのは確かだ。


 一方,マルチスレッド処理に対応した物理シミュレーションのテストであるPhysics testの結果をまとめた「Physics score」だと,i7-6950Xはi7-5960Xに対して30〜34%程度,i7-6700Kに対して62〜67%程度高いスコアを示した(グラフ3)。i7-6950Xとi7-5960Xのスコア差がCPUコアの数を超えたものになっているのは,非常に興味深い。Intelの言う最適化効果は確かに出ている印象である。
 一方のi7-6700Kは,4コア8スレッド分の負荷がかかった場合,ブーストせずに定格の4GHz動作となる。CPUコアあたりの性能に違いがないと仮定すると,i7-6950Xはi7-6700Kに対して1.9倍弱のベンチマークスコアが得られるという推定が可能だが,結果はそれに及んでいないので,i7-6950Xが1つ前のCPUコア世代に留まるがゆえの違いが出ているといったところだろうか。


 いずれにせよ,Physics testではi7-6950Xが比較対象を圧倒したものの,総合スコアにはそれがほとんど反映されていないというのが,ここでの見どころとなる。i7-6950Xの演算性能はかなり高そうだが,ゲームでその性能を享受できるかというと……といったところだ。

 では,実際のゲームにおけるスコアを見てみよう。グラフ4,5はFallout 4のスコアだが,より描画負荷の低い「中」プリセットでi7-6950Xは対i7-5960Xが105〜106%程度,対i7-6700Kだと101〜102%程度というスコアになっており,描画負荷が高まる「ウルトラ」プリセットだと,i7-6950Xはi7-6700Kの約96%というスコアに沈んでいる。

 PCゲームの大多数は,一般的なデスクトップPCに向けて最適化されているはずなので,i7-6950Xの10コア20スレッド対応という,Intelが言うところの「メガタスキング」(Mega Tasking)的な方向での強化が,ゲーム性能に直接影響することは,普通に考えて,ない。なので,i7-5960Xに対してはCPUコア性能の違いで若干優勢でも,コア数が半分以下ながら高クロックで動作するi7-6700Kの後塵を拝するというのは,ある意味,納得できる結果だ。


 続いてグラフ5,6はFFXIV蒼天のイシュガルド ベンチの結果である。
 FFXIV蒼天のイシュガルドは,マルチスレッドに最適化されており,描画負荷の低い局面では6コア,8コアCPUで若干の性能向上を期待できるのだが,i7-6950Xは「標準品質(デスクトップPC)」の1600×900ドットでi7-5960Xおよびi7-6700Kに対して9〜10%程度と,意味のあるスコア差を付けている。
 8コアのi7-5960Xに対して2コア増えたi7-6950Xがコア数分の優位性を発揮した,というところだろうか。定格3.0GHz動作のi7-6950Xに対して,その1.33倍にあたる4GHzで動作するi7-6700Kをコア数の力で上回れたのだとすれば,その点は特筆していいように思う。

 「最高品質」だとスコア差はかなり縮まるものの,スコア傾向自体は変わっていない。i7-6950Xがかろうじてトップスコアだ。

※グラフ画像をクリックすると,平均フレームレートベースのグラフを表示します
Core i7(Broadwell-E)
Core i7(Broadwell-E)

 Project CARSのテスト結果がグラフ8,9だが,傾向としてはFFXIV蒼天のイシュガルド ベンチとほぼ同等と言っていいだろう。
 描画負荷が軽い「初期設定」では,i7-6950Xがi7-5960Xに対して1600×900ドットで約114%,1920×1080ドットでは約113%と有意に高いスコアを残している。また,i7-6700Kに対しても順に約110%,約108%増と,こちらもi7-6950Xが有意に高いフレームレートを記録した。

 一方,描画負荷が高くなる「高負荷設定」では差が縮まるものの,傾向自体はそう大きく変わらない。動作クロックがi7-6950Xに対して1.33倍のi7-6700Kを上回るフレームレートを残した点は,やはり注目しておいていいと思う。


 全体としては,「1569ドルという1000個ロット時単価に見合うか」という話をさておくと,i7-6950Xはかなり健闘している印象だ。あくまでも今回のテストは低負荷状況を中心に行っており,CPUの性能差が出やすい,言ってしまえばi7-6950Xにかなり有利な状況におけるテスト結果ではあるが,それでもこの傾向が出ることは興味深いものだと言えるだろう。


PCMark 8の結果はいまひとつ。CINEBENCH R15の結果はIntelのアピールどおり


 次は一般的なPC用途やビデオ編集を想定したテストの結果である。
 PCMark 8は,一般ユーザーが頻繁に利用するであろう,Webブラウジングやビデオ再生,編集,ゲームプレイ,ビデオチャット/ビデオ会議といったワークロードを実行して,フレームレートやワークロードの実行時間からスコアを出す総合ベンチマークとなっている。
 前述のとおり,今回は一般ユーザーの家庭内利用を想定したHomeと,ビジネスアプリケーションを中心としたWork,ビデオや画像の編集系が中心となるCreativeの3ワークロードをテストして,その結果をグラフ10へまとめた次第だ。

 それを見ると,i7-6950Xは,i7-5960Xに対し,Homeで約5%,Workで約2%,Creativeで約5%高いスコアを示した一方,対i7-6700KではCreativeで約2%高いスコアを出したものの,残るHomeとWorkでは下回るスコアになってしまった。
 PCMark 8で採用するアプリケーション(≒現行世代の日常的なアプリケーション)にはCPUコア数が“効く”ものが少ないため,マルチスレッドへの最適化が進んだアプリケーションが相対的に多いCreativeを除くと,i7-6700Kに届かないという結果になったのだろう。


PCMark 8のテストにおいて,i7-6950Xはピークで4GHz(画面上は3999.1MHz)というクロックを記録した
Core i7(Broadwell-E)
 ただ,実行時の動作クロックを追ってみると,少し興味深いものが見られた。右に示したのはCreativeワークロードにおけるi7-6950Xのテスト結果表示画面だが,グラフの動作クロック推移で,テスト開始後10秒ほどが経過したところで,約4GHzの動作クロックを記録しているのだ。

 前述のとおり,Broadwell-EにはTurbo Boost Maxという,規定のTurbo Boostクロック設定値を超えてCPUコアを動作させるモードがあるわけだが,これが機能した結果,4GHzを記録したのだろう。だからといってCreativeのスコアが図抜けたわけではないのが残念なところだが,Turbo Boost Maxが機能していると確認できたのは収穫である。

CINEBENCH R15でi7-6950Xは,対i7-5960Xで最大35%,対i7-6700Kで最大2倍の性能があると謳っている
Core i7(Broadwell-E)
 続いてはIntelが性能向上度合いをアピールしているCINEBENCH R15のスコアだ。
 グラフ11において,「CPU」とある項目は,CPUの論理CPUコアをすべて使ってレンダリングしたときの結果,「CPU(Single Core)」はシングルスレッドでレンダリングしたときの結果だが,まずCPUのほうだと,i7-6950Xはi7-5960Xの約135%,i7-6700Kの約203%というスコアであり,Intelのアピールそのままという結果になった。

 CPU(Single Core)はそれほど大きなスコア差が付かないが,それでも,同じクロックで動作するi7-5960Xと比べて約6%高いというのは重要なポイントと言える。
 対i7-6700Kだとスコアは約82%に留まるが,定格クロックで比較するとi7-6950Xはi7-6700Kの約75%なので,クロック比を考えると,i7-6950Xのスコアは対i7-6700Kでもかなり頑張っていることになる。


 ここで,「CPU(Single Core)ではTurbo Boost Maxが効くから,それが理由では?」と思うかもしれない。しかしi7-6950Xでも,AVX命令実行時にはCPUコアクロックが定格で抑えられ,Turbo Boost系の自動クロックアップは有効にならない仕様だ。

 別記事で紹介しているとおり,i7-6950XにはAVX命令実行時のクロックレシオを設定するオーバークロックの新機能「AVX Ratio Offset」が入っている。だが,AVX Ratio Offsetはあくまでもオーバークロック向けの設定であり,ユーザーが自己責任を覚悟して有効化しない限り機能しない。Haswell-Eと同じく,AVX命令実行のクロックは定格となるのが標準仕様だ。
 実際,CINEBENCH R15実行時の動作クロックを調べ,シングルスレッド動作でもi7-6950Xの動作クロックが3GHzに押えられることを確認している。この点は注意してほしいと思う。

 もう1つ,CINEBENCH R15における興味深いデータとして,「MP Ratio」も掲載しておこう(グラフ12)。
 MP Ratioは,CPU(Single Core)に対してCPUのスコアが何倍になるかを示したものだ。3製品とも「Hyper-Threading Technology」(以下,HTT)が有効なので,もちろん結果はコア数を超えるのだが,「コア数分をどの程度上回るか」でHTTの効果を推定できる。言い換えれば,MP Ratioを物理コア数で割った値がHTTの効果ということになる。

 というわけで結果を見てみると,i7-6950Xが+23%,i7-5960Xが+20%,i7-6700Kでは+24.5%となる。要するに,HTTの効率は,CPUコア世代が新しいほうがよいということだ。Skylakeが最も優れているが,Broadwellはそれに続いており,少なくともHaswellよりは明らかにHTTの効率がよい。


 以上の結果からは,一般的なPC用途であれば,i7-6950X,そしてi7-5960Xの贅沢なCPUコア数は,ほとんど無意味であることをほぼ断言できる。しかし,CINEBENCH R15のような,CPUコアがあればあるだけ使い切るような,数少ない,特殊なアプリケーションであれば,i7-6950Xには明らかなメリットがあるのも確かだ。
 しかもそのとき得られる性能は,i7-5960Xに対するコア増加分を超えたものになっている。


Sandra 2016 SP1でi7-6950Xの特性を検証


 ゲームや一般ベンチマークの結果を見たところで,予告どおりここからは,Sandra 2016 SP1を使い,少し細かくi7-6950Xの特性を分析してみよう。
 ここでは,クロックの変動を抑えるためTurbo Boostおよび「Turbo Boost Max Technology」,そして「Enhanced Intel SpeedStep Technology」(EIST)は無効化している。つまり,i7-6950Xとi7-5960Xは3GHz動作,i7-6700Kは4GHz動作だ。
 i7-6700Kはクロックが1GHz高いが,コア数はi7-6700Kに対してi7-6950Xは2.5倍あるので,動作クロックとコア数からi7-6950Xの性能はi7-6700Kに対し1.9倍程度のスコアが判断の目安(閾値)になる。i7-6950Xのスコアがi7-6700Kの1.9倍に迫ることができれば,世代が異なるi7-6700KのCPUコアの性能に近いと判断できるわけだ。

 グラフ13は,演算性能を見る「Processor Arithmetic」の総合成績を示す「Aggregate Native Performance」の結果をまとめたものとなる。
 i7-6950Xはi7-5960Xに対して約31%,i7-6700Kに対しては約1.63倍となった。3DMarkのPhysics scoreなどと対比すると,ほぼ妥当と言えるだろう。


 Processor Arithmeticの個別スコアはグラフ14,15にまとめたが,ここでは,整数演算を使用する「Dhrystone」系のテストよりも,浮動小数点演算を用いる「Whetstone」系におけるi7-6950Xのスコアが高いことが目を引く。単精度の「Single-float Native」だと,i7-6950Xがi7-5960Xに対して約135%で,さらに対i7-6700Kでは約195%と閾値を超える成績を残した。また,倍精度の「Double-float Native AVX」でも,i7-6950Xは対i7-5960Xで約41%高いスコアを示している。

 前述のとおり,Broadwell-Eでは浮動小数点演算時の遅延低減が入っているはずで,ここではその効果が出ているということなのだろう。同様に最適化が入ったSkylake世代に匹敵する浮動小数点演算性能を持つようだ。


 続いてグラフ16は,マルチメディア処理性能を見る「Processor Multi-Media」の総合スコア「Aggregate Multi-Media Native Performance」である。
 i7-6950Xはi7-5960Xに対して約20%高いスコア,言い換えればProcessor Arithmeticよりもやや低めの成績に収まっている。一方,i7-6700Kに対しては約65%と,Processor Arithmeticよりも大きなスコア差を付けた。


 個別スコアは,見栄えを重視し,項目ごとではなく数値の桁数基準で2つに分けてグラフ17,18に示しておくが,i7-6950Xのスコアは対i7-5960Xで13〜26%程度,対i7-6700Kでは36〜81%程度高くなった。

 対i7-5960Xではベストケースでコア数比に近いスコア差が出ているが,むしろここで興味深いのは対i7-6700Kのスコアだ。古典的なx86命令を使う「Multi-Media Quad-int Native x1 ALU(MPix/s)」の約181%と最も大きく引き離し,続いてFMA命令セットを用いる「Single-float Native x16 FMA」で約177%,「Double-float Native x8 FMA」では約171%といった具合だからである。

 ただ,これらテスト項目で対i7-5960Xのスコアが大きく向上しているわけではない以上,古典的なx86命令セットやFMA命令セットの性能向上があったとは考えにくい。i7-6950Xが対i7-6700Kで有意に高いスコアを記録しているのは別の理由によるものだろう。
 Procssor Multi-Mediaはピクセル処理を実行するテストで,並列化の恩恵を受けやすいため,それが影響しているのではないかというのが筆者の推測だ。



 暗号化や復号化の性能を探る「Processor Cryptgraphy」は少し面白い結果となった(グラフ19,20)。総合成績を示す「Cryptographic Bandwidth」だとi7-6950Xが有利となっているが,個別スコアだと,「Encryption/Decryption Bandwidth AES256-ECB AES」でi7-6950Xがi7-5960Xの約95%というスコアに留まっているのだ。
 Encryption/Decryption Bandwidth AES256-ECB AESは,CPUの演算コアではなく,CPUに統合されたAES暗号アクセラレータを用いるので,i7-6950X側のアクセラレータ性能が若干低いという可能性はある。

 一方,CPUを用いる「Hashing Bandwidth SHA2-256 AVX」ではi7-6950Xが有利となった。並列処理によってコア数分だけスコアが上がったのだと思われる。
 ただし,ハッシュはほとんど整数演算ということもあり,せいぜいコア数比+α程度しかi7-6950Xが有利とならない。それゆえに,結果として総合スコアは「i7-5960Xより約9%高いスコア」になったというわけである。


 お次は金融系の演算を行う「Processor Financial Analysis」だ。ここでは,総合スコアとなる「Aggregate Option Pricing Performanc」をグラフ21に,細かなテストごとのスコアをグラフ22,23にそれぞれまとめた。
 目を引くのは,ブラック-ショールズ方程式を使用する価格予測計算「Black-Scholes Euro Option Pricing」と,モンテカルロ法を使う価格予測計算「Monte Carlo Euro Option Pricing」で,i7-6950Xがi7-5960Xに対していずれも30%以上高いスコアを示しているところだ。いずれも並列化や浮動小数点演算が効いてくる計算と考えられるので,i7-6950Xのコア数と,コアあたりの性能向上などが“効いた”ものと推測している。


 続いて,科学技術計算を行う「Processor Scientific Analysis」だ。グラフ24は総合スコアとなる「Aggregate Scientific Performance」で,テストを構成する個別要素のスコアがグラフ25となる。
 ここでは行列計算を行う「General Matrix Multiply (GEMM) FMA」と,多体問題を計算する「N-Body Simulation (NBDY) FMA」の結果が見どころだ。というのも,並列演算に特化したプロセッサでありGPUがこれらのアクセラレータとして多用されているくらい,どちらも並列化が有効な処理として知られており,i7-6950Xの10コア20スレッドが“活きる”可能性が高いからである。

 さて,実際のスコアだが,「General Matrix Multiply (GEMM) FMA」だと,i7-6950Xのスコアはi7-5960Xに対して約169%,「N-Body Simulation (NBDY) FMA」だと約163%で,見事に圧倒した。
 Processor Multi-Mediaの考察で述べたとおり,FMA命令セットに関する大規模な最適化は入っていないはずなので,並列化が有効なアルゴリズムほどi7-6950Xのスコアが高くなる傾向があると見るべきではなかろうか。


 次はCPUの画像処理性能を見る「Processor Image Processing」の結果だ。グラフ26に総合成績にあたるAggregate Image Processing Rateの結果を,また個別スコアをグラフ27〜29にまとめている。個別スコアが3つに分かれているのは,スコアの桁数が大きく異なるからだ。


 さて,その個別スコアを見てみると,すべてでi7-6950Xの成績はi7-5960Xに対して134%から136%の範囲に収まった。図抜けた成績を残したテストは見当たらないが,i7-6950Xがコア数比以上のスコアを残すことができている。画像処理もピクセル計算はスレッドの並列化を行いやすく,並列化を行いやすい処理ではi7-6950Xの成績が伸びるという,ここまでのテストの結果と整合するスコアが出ている。


 以上,並列化が有効な計算ほどi7-6950Xは高速に処理を行えるという,ある意味で当たり前の結果が出たわけだが,その理由の一端が垣間見えるのが,データサイズを変えながらCPUコア間のデータ転送の帯域幅を見るテスト「Multi-Core Efficiency」の結果である(グラフ30)。

 今回はグラフ画像をクリックすると,実スコアをまとめた表3を表示するようにしてあるので,合わせて参考としてほしいが,L1およびL2キャッシュに収まるデータサイズ,具体的には「1x 64bytes Blocks」から「8x 256kB Blocks」だと,i7-6950Xのデータ転送帯域幅がi7-5960Xを14〜27%程度上回る。
 L1およびL2キャッシュはCPUコアに統合され,リングバスを介してデータ転送される仕様なので,i7-6950Xのリングバスはi7-5960Xよりも高速になっていることが分かるわけだ。

 ただし,データサイズがL2キャッシュに収まらない4x 1MB Blocks以上では,i7-5960Xのほうが帯域幅が大きくなった。このサイズではL3キャッシュを介したデータ転送になるはずなので,そこが落ち込んでいるというのは,少し気になるところである。

※グラフ画像をクリックすると,実スコア入りの表3を表示します
Core i7(Broadwell-E)

 グラフ31はメモリバス帯域幅を見る「Memory Bandwidth」の総合スコア「Aggregate Memory Performance」をまとめたもの,グラフ32はその個別スコアだ。

 前述のとおり,テスト期間が極めて短く,4枚組のPC4-19200 DDR4 SDRAMを用意できていないため,i7-6950Xとi7-5960Xとの間に違いは誤差程度しかない。PC4-19200メモリを用意できれば違いを確認できたはずだが,この点はやむを得まい。
 なので,本テストの結果は参考までに,ということになる。


 キャッシュとメモリの遅延を見る「Cache & Memory Latency」の結果がグラフ33である。ここでも,グラフ画像をクリックすると,実スコアがまとまった表4を表示するようにしてある。

 L1およびL2キャッシュに収まる「256kB Range」までだと,i7-6950Xとi7-5960Xの遅延状況は一ほぼ致するが,それ以上,L3キャッシュからメインメモリでカバーされる範囲だと,i7-6950Xのレイテンシがやや大きめになっている。双方とも動作クロックは同じなので,リングバスの改良がレイテンシにも影響を与えている可能性はあるだろう。

 なお,i7-6700Kは定格クロックが4GHzとExtreme Editionの2モデルより高くいため,1クロックサイクルでデータアクセスが可能なL1キャッシュや,3クロック程度でアクセス可能なL2キャッシュの範囲では比較対象と比べて遅延が小さい。
 また,キャッシュを超える64MB以上の範囲でもi7-6700Kのほうが有意に遅延は小さいが,これはLGA2011-v3プラットフォームでメモリが4chアクセスとなり,2chのi7-6700Kと比べて遅延が大きくなるためである。

※グラフ画像をクリックすると,実スコア入りの表4を表示します
Core i7(Broadwell-E)

 グラフ34,そしてそれをクリックすると表示される表5は,キャッシュの帯域幅を見る「Cache Bandwidth」の結果をまとめたものだ。
 L1およびL2キャッシュに収まる「256kB Data Set」以下ではi7-6950Xがi7-5960Xに対して21〜51%程度と,明確に高いスコアを示している。また,L3キャッシュに移る「512kB Data Set」から「16MB Data Set」の範囲だと,19〜90%程度,比較対象を引き離した。

 L3キャッシュ以上はリングバスの高速化に原因を求めることができそうだが,L1,L2キャッシュはCPUコアクロックで動作しており,このテストではクロックを揃えている。なので,これほどの差が出るというのは想定外だったのだが,L1,L2キャッシュに関しても何らかの改良が入っているのだろう。

※グラフ画像をクリックすると,実スコア入りの表5を表示します
Core i7(Broadwell-E)

 「Memory Transaction Throughput」は,複数スレッドからメモリを参照し,書き換えるテストを行うもので,TSX命令セットのサポート有無がスコアを大きく左右する。果たしてグラフ35のとおり,TSX命令セット非対応のi7-5960Xは実に哀れな結果しか残せない。
 一方,TSX命令セットをサポートするi7-6950Xとi7-6700Kは好成績を残している。i7-6950Kのほうがスコアが高いのは,単純にメモリコントローラのチャネル数効果だ。


 Sandra 2016 SP1の結果からは,i7-6950Xは,i7-5960Xに対して,コアアーキテクチャだけでなくリングバスやキャッシュにも大きな改良が入っている可能性が高そうだということが推測できる。
 CINEBENCH R15など全コアを回すようなテストや,並列化が効くテストではコア数の増加分を超える性能を叩き出すのは,これらの改良によるものと考えていい。i7-6950Xは順当か,あるいは順当以上にi7-5960X比で性能が上がった製品と言い切れるように思う。


電力性能比も対i7-5960Xで大幅に向上


 最後に,ログの取得が可能なワットチェッカー「Watts up? PRO」で,3Dおよび一般ベンチマークにおけるシステム全体の消費電力を記録した結果もまとめておこう。
 テストにあたっては,ゲームプレイを想定し,無操作状態が続いてもディスプレイの電源がオフにならないよう設定したうえで,OSの起動後30分放置した時点を「アイドル時」,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点をタイトルごとの実行時とすることにした。

 結果はグラフ36のとおり。
 ゲームテストや3DMarkでは言うまでもなくGPUの消費電力が支配的になる。また,PCMark 8でもゲームテストがワークロードに組み込まれているためGPUの消費電力が支配的だ。ただそれでも,Fallout 4で約18W,Project CARSで約16W低いスコアというのはなかなか興味深い。

 CPUのみの違いを最もよく表すのはCINEBENCH R15の消費電力だ。ほとんどCPUしか使っていないので,CPUがフルパワーになった時の電力差が現れるが,ここで違いは8W。わずかながら確実に下がっているという理解でよさそうだ。


 ここまでお伝えしてきているとおり,性能自体はi7-5960Xと比べて確実に向上しているので,それでいて実消費電力が若干下がっている以上,「電力あたりの性能は大幅に改善している」と述べていい。


Haswell-Eと比べて順当なグレードアップとなったBroadwell-E。ただ,i7-6950Xの価格は高すぎる


Core i7(Broadwell-E)
 以上,Broadwell-Eは,前世代のHaswell-Eに対して,絶対性能と消費電力対性能比を順当に引き上げてきたCPUだとまとめることができるだろう。少なくとも,マルチGPU構成やSSDのポテンシャルをフルに発揮できる可能性が高いことに惹かれ,これからLGA2011-v3プラットフォームを導入するのであれば,Hasewll-EではなくBroadwell-Eを選ぶべきだ。

 ただ,i7-6950Xがゲーマーにとって買いかというと,それはまた別の話となる。
 コアあたりのポテンシャルや,並列演算性能が高いのは間違いないが,ゲーム性能はi7-6700Kと大差があるわけではない。それでいて,i7-6700Kの税込実勢価格は3万9000〜4万4000円程度(※2016年5月31日現在)なのに対し,i7-6950Xは1000個ロット時単価の時点で1569ドルである。普通に考えて,日本円では税込20万円を軽く超えてくるだろう。
 20万円あれば,「GeForce GTX 1080 Founders Edition」とi7-6700K,それにブランドやスペックを問わなければマザーボードとメインメモリモジュールまで買えてしまうという現実は,あまりにも重い。

 Broadwell-Eも,LGA2011-v3もハイエンド志向のゲーマーにはアリだと思うが,今回テストしたi7-6950Xだけは,コスト的,コストパフォーマンス的にお勧めしづらいというのが正直なところである。ゲーム用途では4コア8スレッドあれば,あとは動作クロック勝負となりがちという経験則からすると,高クロックでかつPCIe 3.0を40レーンを持つ「Core i7-6850K」あたりが,ゲーマーにとっての現実的な選択肢となるのではなかろうか。

関連記事:[COMPUTEX 2016]最上位モデル「Core i7-6950X」は10コア20スレッド。Intel,「Broadwell-E」をハイエンドデスクトップPC向けに発表

Intel日本語公式Webサイト

  • 関連タイトル:

    Core i7(Broadwell-E)

  • この記事のURL:
line
4Gamer.net最新情報
最新記事一覧へ新着記事10件
トピックス
スペシャルコンテンツ
注目記事ランキング
集計:04月27日〜04月28日