作為GTC 2012大會的一部分,最后的一天還有個采訪活動,接受采訪的是GK110的兩位設計師,Jonah albums是GPU工程部門的高級副總裁,Danskin則是負責GPU架構的副總裁。
以下就是Heise網站帶來的報道,問答形式,內容很勁爆,提問的一方沒什么客套,植入主題,回答的一方“太極推手”防守嚴密,從中能得到多少收獲就看自己的理解了。
Q:GK110性能比GK104強多少?
Albums:我們已經公布了GK110的規(guī)格,但是最終的頻率之類的還沒有定,這是項目開發(fā)中很自然的事,問題是功能單元的數量還是顯存位寬會影響產品的性能?基于這些因素,你們可以期待性能提升50%,而SGEMM之類對計算性能敏感的應用中,性能幾乎與功能單元的數目成正比。(GK110有15組SMX單元,這么說性能比8組SMX的GK104可以高出近一倍了?)
Q:也是就說,GK110的性能優(yōu)勢在50-70%左右?
Albums:這是一般的情況,如果是在充分利用了Hyper-Q、Dynamic Parallelism以及雙精度運算的HPC應用中,這個(性能提升)比列還會更高。
Q:Kepler開發(fā)了多長時間了?
Albums:這個取決于你問的是誰了。我是在G80架構完成之后開始Kepler項目的,大約是7年前了,直到三年前NVIDIA才開始有大批人手加入這個團隊的。
Q:為什么GK110架構要等到年底才能發(fā)布,比GK104晚了這么久?
Danskin:這個問題很難回答。GK104功能更少,而且主要針對顯卡而非計算應用,它必須要及時發(fā)布。另一方面,GK110則是一款大核心架構,TSMC在流片和制造過程中要扮演更大的角色。(TSMC又中槍了,不過這么復雜的芯片確實是個問題)
Albums:GK110這樣龐大的芯片不可能在新架構的同時再使用新工藝,還需要等28nm工藝更加成熟。
Q:研發(fā)GK110架構最大的挑戰(zhàn)是什么?
Albums:很明顯,就是新開發(fā)的Hyper-Q和Dynamic Parallelism技術。
Danskin:由于GPU需要自動刷新線程,Dynamic Parallelism技術實際上非常復雜,Hyper-Q對有些人很有意義,更容易實現而且會帶來更好的性能。Dynamic Parallelism可以簡化寫代碼的過程,這在以往是不可能的,對我們而言它是最重要的功能。
Q:NVIDIA增強了GK110的雙精度浮點性能,它是靠幾個單精度核心聯合工作實現的嗎?
Danskin:GK110有獨立的雙精度運算單元。(昨天PCGH的解析中已經明確了這一點。)
Q:這是GK110為什么占用這么多核心的原因?
Ablbums:實際上(雙精度單元)占用的并不多。主要還是SMX單元增多帶來的,另一個占面積較大的功能是ECC校驗單元。
Q:GK110的雙精度性能是單精度的1/3,為什么不是1/2?
Danskin:由于架構不同,1/2的比列很難實現。
Albums:簡單來說那樣做需要更多的資源,我們要重新考慮寄存器之類的設計。
Danskin:還有就是每瓦性能比的問題,我們認為目前的(1/3)比列是合適的。
Q:GK110為什么使用384bit位寬而非512bit?
Danskin:使用512bit位寬也會導致功耗及其他代價升高,GK110使用384bit位寬則可以在性能和代價中保持平衡。
Q:目前的GK110只使用了13-14組SMX單元,未來是否會有開啟完整15組SMX單元的產品?
Albums:某種意義上說,很有可能。
Q:GK110的硬件編碼單元與GK104有什么提升嗎?
Ablums:GK110的硬件編碼單元跟GK104是一樣的。
Q:你們認為未來的GPU開發(fā)最困難的挑戰(zhàn)是什么?
Danskin:最大的挑戰(zhàn)是功耗?;仡櫼幌逻^往的歷程,我們以及AMD都是一樣的:更高的性能,更高的功耗?,F在一切都改變了,功耗是明顯的分界線。另外,如以往走過的相似,先進的制造技術有利于改善(功耗)問題。
Albums:主要挑戰(zhàn)還是每瓦性能比,圖形芯片設計中這倒是個次要因素。
更多信息請關注:21ic網友雜談頻道