幾個月前NVIDIA推出GK 110核心的GTX TITAN,當時有些人猜測GTX TITAN會不會直接取代GTX 780,成為單核心的頂級旗艦款。現在NVIDIA搶在AMD之前,推出最高階的遊戲卡GTX 780與GTX 770,但仍採用GK 110與GK 104核心,這2顆看似老面孔的GPU,到底跟GTX TITAN、GTX 680相比有何差異?接下去看就知道。
快速瀏覽:
首款GK 110遊戲卡
Kepler架構的GK 110核心,最早在2012年11月就已經發表,先後用在高速運算的Tesla K20X、Tesla K20,以及介於運算與遊戲之間的特殊產品GTX TITAN共3款產品上,算上GTX 780已經是第四款搭載該核心的產品,GK 110其實稱不上是「新核心」。但從定義上來看,GTX 780仍是第一張採用GK 110的純遊戲卡。
那麼,同樣採用GK 110核心的4張卡之間差異在哪?大家都知道要把顯卡或者說是GPU做出產品區隔,最簡單的方法就是「刪減」。藉由刪減硬體架構的方式,可提升晶片的良率,並且能區隔出顯卡的效能。
Tesla
Tesla是NVIDIA的高階運算卡的產品代號,主要用途是用於串連運算,因此卡身上並沒有影像輸出埠。此外,除了雙精度運算沒被封鎖外,也支援ECC校正功能。AMD也類似的高階運算產品,其代號為FireStream,但該產品線已經幾年沒有新產品推出,最高階版本為FireStream 9370。
SP是效能關鍵
理論上來說,核心架構相同的條件下,CUDA Core(等同Stream Processor,串流處理器,簡稱SP)的數量跟效能會成正比。從數量上來看,最多的是2688個CUDA Core的Tesla K20X與GTX TITAN,接著是2496個的Tesla K20,再來則是這次的GTX 780,共有2304個CUDA Core。至於GTX 770則非使用GK 110,而是搭載跟GTX 680相同的GK 104。
架構篇:Kepler強而未完美
從規格來看,最完整的GK 110核心目前不存在市面上,GK 110完整規格共有5組GPC(Graphics Processing Cluster,繪圖處理叢集),每個GPC底下還會有3組SMX,每個SMX(Streaming Multiprocessor)內還會有192個運算最基本的單位CUDA Core,這是GK 110最終完整版的硬體規格。
效能、良率是關鍵
拿出計算機算一下,整個GK 110核心理論上共計會有15個SMX,內藏2880個CUDA Core。但看看那Tesla K20X、Tesla K20、GTX TITAN,甚至是這次的主角GTX 780,架構都並非最完整的版本。
先前有傳言會推出GTX TITAN精進版GTX TITAN ULTRA跟精簡版GTX TITAN LE,但事實上,目前為止仍未有完整版產品。筆者猜測目前精簡版的GK 110已足以應付現階段對手高階卡HD 7990 GHz Edition的效能,甚至是GK 104就夠了,理論上GK 110足以應付下一代HD 8000系列高階卡。此外,更現實的是,若硬是搭載完整版核心,勢必會讓產品良率降低,進而影響出貨量與成本,這對於產品而言也會是致命傷。
規格縮減時脈更高
相較於GTX TITAN的硬體規格,GTX 780的硬體規格明顯縮減,CUDA Core數量相差384個,也就是核心架構少了2組SMX。雖然規格縮減,但是時脈方面卻有所提升,Base時脈從837MHz提升到863MHz,而Boost時脈則是從876MHz提升到900MHz,提升幅度分別為3.1%與2.73%。另外記憶體介面頻寬仍是384bit,並未因為核心架構縮減而有所影響,記憶體頻寬兩者都是288.4 GB/s。
以理論上來說,若不考慮記憶體等影響,GTX 780的核心規模縮減14.2%,時脈僅提升2.73~3.1%,理論效能跟GTX TITAN相比應該還是有段明顯落差。但考量到兩者之間的價差,GTX TITAN市場售價約為33,000~36,000元,而GTX 780則約649美元,折合新台幣約19,470元,估算一下效能差距與價格,性價比而言GTX 780仍會比較出色。
穩定的滴答策略
Intel處理器有穩定的Tick-Tock策略,NVIDIA似乎也依循著類似的腳步前進。只不過Intel的Tick-Tock是製程與架構交替,NVIDIA則是架構與製程同時更換,隔年則是在去年的基礎上進行最佳化。舉例來說GF 100是製程與架構同時更換,GF 110則是在GF 100的基礎上最佳化,而這次的GK 110也是跟GK 104有相似的關係。
然而去年NVIDIA並未推出高階版本GK 100,因此GK 110看起來有點不太像是GK 104的精進版。後來事實也證明,GK 104的效能與硬體規格,已經足以應付去年HD 7970等高階顯卡,並不需要核心架構更完整的GK 110(或稱為GK 100),這也使得玩家一直到今年,才有機會在零售市場上看到Kepler架構的頂級產品。
Intel Tick-Tock
Intel每年依照既定的速度進行研發,Tick時更換製程,Tock時更換架構,今年推出的Haswell屬於更換架構的Tock時期。
規格雷同的GTX 770
換到這次的另一位主角GTX 770,它搭載的是前代GK 104核心,共有4組GPC內含1536個CUDA Core。這規格是不是有些面熟?是的,這就是GTX 680使用的核心規格。簡單來說,GTX 770就是在GTX 680的基礎上進行最佳化,但是硬體架構不做任何改變。記憶體共有2048MB與4096MB版本,核心與記憶體時脈則略高於GTX 680,理論效能應會比GTX 680還要高。
舊核心重複使用的慣例並不少見,經典案例是8800GTS時代的G92核心,一直使用到GTS 250。雖然漫長的G92生命週期中,製程曾經從65nm提升為55nm,但核心架構仍是G92。AMD方面,最近的代表則是HD 5770與HD 6770,搭載的同為Juniper(RV840)核心,這些都是延續使用舊晶片的案例。
至於雙方入門卡「更名再戰」的案例就更多了,並不是稀有的事情。但高階卡代表著是自家的研發實力,以往很少會直接用前代晶片硬上。這也導致GTX 770上市後,GTX 680價格受到影響大幅下降,建議若對高階卡有興趣的玩家,可以趁此時撿個便宜。截稿前得到的消息是GTX 770售價約為399美元,折合新台幣不到12,000元,GTX 680準備大跳水吧!
▲(點圖看大圖)Kepler、Fermi核心規格比較表
延伸閱讀:
NVIDIA GTX 680 完全實測:28nm製程、電力效率變2倍,力壓HD 7970
NVIDIA GTX TITAN 遊戲、運算二合一,打造全新產品線
認識 GTX 690 雙核巨獸效能篇:對決 GTX 680 SLI、功耗、超頻、拆解通通來
決戰多螢幕,大容量 VGA 記憶體實戰:容量多1倍、效能多2%
NVIDIA GTC 大會直擊, Maxwell、Volta、Logan、Parker 特色初公開
(後面還有-效能篇:看不見的架構最佳化)