電電学生の脳内メモ帳.

電気電子工学生の脳内メモです。

2021/2/10~11 RTX3070 スコア低下について

2021/02/10~11

 ※これは個人的な趣味の記録のために書いている日記です。他者が読むことは想定していませんのでご了承ください。稚拙な文章や内容の誤りを多く含みます。また個人が特定できる情報が含まれていることがありますが、知り合いがこのブログを見つけてしまった際はスルーしていただけると助かります。

 

 先日RTX3070購入した際のベンチマークでは、スコアが本来よりも数%程度低い結果となった。

f:id:C14H18N2O5:20210213205312p:plain

Time Spy (DDR4-2133定格/All Core x47,Cache x41,1.290V)

Time SpyのCPUスコアが9900Kに比べて約1,000点低いこと、使用しているメモリが低速な2133MHzであることから、性能低下の原因はCPU性能とメモリ性能にあると先日は結論付けた。今回はそれらの改善を試みた。現在の環境を以下の表に示す。

f:id:C14H18N2O5:20210213224939p:plain

 

 現在使用しているメモリはCorsair CMK16GX4M2B3200C16である。定格2133MHz/XMP3200 CL16であり、所持している個体はSamsung B-Dieが使用されているようだ。XMPプロファイルの3200MHzで動作しなかったので、現状は2133MHzで動作している状態である。XMPが使えないので、今回は手動でクロックとタイミングの調整を行った。結論から言うと、私の環境では2400MHzより高い周波数では全く動作しなかった。JEDEC規格よりタイミングを緩めてみたり、電圧を1.39Vまで盛ったりと色々試行錯誤してみたが、BIOSすら立ち上がらない有様だった。止むを得ないのでタイミングだけ詰め、DDR4-2400 12-14-14-28に設定した。以下にベンチマーク結果を示す。

f:id:C14H18N2O5:20210213174258p:plain

Time Spy (All Core x47,Cache x41,1.290V/DDR4-2400 12-14-14-28)

f:id:C14H18N2O5:20210213174345p:plain

FFXV (All Core x47,1.290V/DDR4-2400 12-14-14-28)

f:id:C14H18N2O5:20210213174414p:plain

FFXIV (All Core x47,Cache x41,1.290V/DDR4-2400 12-14-14-28)

f:id:C14H18N2O5:20210213205454p:plain

DDR4-2400/2133比較 (All Core x47,Cache x41,1.290V)

メモリの影響を受けやすいといわれる*1FFXIVはスコアが8.9%上昇したものの、その他のTime SpyFFXVは殆ど差が出なかった。以上より、今回使用したQQLSとZ170 Extreme4、CMK16GX4M2B3200C16の組み合わせでは2400MHz 12-14-14-28までしか動作せず、2133MHzに比べてFFXIVを除いて大幅な性能の向上は見られないことがわかった。

 

 メモリの高速化が振るわなかったことから、次にCPU性能の改善を試みた。クロックは全コア4.7GHz、電圧は1.260~1.290Vで運用している。現状のCINEBENCH R20のスコアを以下に示す。

f:id:C14H18N2O5:20210213155517p:plain

CINEBENCH R20 (All Core x47,1.250V)

マルチスレッドは4,821pts、シングルは482ptsとなった。マルチは9900Kに比べて遜色ない結果であるが、シングルは若干劣る結果となった。これは9900KのTBの仕様が2コアまで最大5.0GHz、全コア4.7GHzであることに起因すると思われる。ただシングル性能に関しても9900Kと大きな差はなく、Time Spyでここまで差が生じてしまう点については疑問が残る。

 CPU性能を上げる方法についてだが、最も簡単な方法はコアクロックを引き上げることである。しかし4.8GHzで安定動作させるには電圧が1.300V以上必要であり、現在使用しているZ170 Extreme4では供給電流の不足により設定できない。そこで今回はCacheクロックの引き上げを行った。本来CacheクロックはCoreクロックと同時にある程度引き上げるものであるが、今まではQQLSの安定運用に苦心していたため手を触れてこなかった。CacheクロックのOCはCINEBENCHなどのCPUベンチに対しては効果が小さいことから、リスクに対してリターンが小さいと考えていたためである。

 Cacheクロックの設定はコアクロックと同様にintel XTUから行った。以下の画像はintel XTUの設定画面である。

f:id:C14H18N2O5:20210213165213p:plain

intel XTU 設定画面

Core Ratioがx47であることを考慮して、Defaultのx41からx44へ、Cache電圧はコア電圧と同じ1.290Vに設定した。以下にCINEBENCH R20の結果を示す。

f:id:C14H18N2O5:20210213170250p:plain

CINEBENCH R20 (All Core x47,Cache x44,1.290V)

マルチは4,912pts、シングルは484ptsとなった。設定前と比べてマルチ性能が1.9%上昇したものの、ゲームに比較的影響があるといわれるシングル性能は殆ど変化が無かった。Time Spyの結果を以下に示す。

f:id:C14H18N2O5:20210213171619p:plain

Time Spy Score (All Core x47,Cache x44,1.290V/DDR4-2400 12-14-14-28)

CPU Scoreが10,183であり、Cacheクロック4.1GHz,DDR4-2133の時に比べ約6.2%スコアが向上している。したがってCacheクロックの引き上げを行った場合CIENBENCH R20においては大きな変化が見られないが、Time Spyでは明らかなCPU Scoreの向上が確認できることがわかった。今まではCINEBENCHのスコアだけを見ていたためCacheのOCは大きな効果はないと考えていたが、その認識は改めなければならないだろう。Time Spy以外の変化も確認するため、Fire Strike,FFXIV,FFXVのスコアも計測した。結果をまとめたグラフを以下に示す。

f:id:C14H18N2O5:20210213211904p:plain

FFXIV,FFXV,Fire Strike,Time Spy 測定結果

今回計測した4種類のベンチでは、Time SpyのCPU Score以外の明らかなスコア向上は見られなかった。敢えて取り上げるならFFXVが僅かに向上しているくらいだろうか。FF XIVも一応スコアは増加しているものの、メモリの高速化に比べると効果は小さいようだ。また意外な結果だがTime Spyと同じ3DMarkであるFire StrikeのCPU Scoreに変化が見られなかった。Fire Strikeで使用されているAPIであるDirectX 11はTime SpyDirectX 12に比べてCPU依存度が小さいせいだろうか。

 

【まとめ】

 現在使用しているQQLS、Z170 Extreme4、CMK16GX4M2B3200C16の環境ではDDR4-2400 12-14-14-28までの高速化が限界であることがわかった。メモリの高速化を行うことでFFXIVで8.9%のスコアの向上が見られたが、他のFFXVやTime Spy、Fire Strikeでは特に変化は確認できなかった。またCPU Cacheを4.4GHzまで引き上げた結果、Time Spy CPU Scoreの6.2%の向上が確認できた。CIENEBENCHのスコアに大きな変化がないことから今まではCPU CacheのOCは効果が薄いと考えていたが、その認識は誤りだということがわかった。CPU Cacheの速度の影響度はソフトの種類や使用しているAPIなどの構造に左右されると考えられる。