Loading AI tools
来自维基百科,自由的百科全书
GeForce 400系列[2] 是NVIDIA的第十二代GeForce顯示晶片。採用TSMC的40nm製程,高階型號將首次採用GDDR5顯示記憶體,中低階產品會採用新型SDDR3顯示記憶體。
發佈日期 | 2010年3月 |
---|---|
代號 | Fermi: GF100 GF104(改進版為GF114) GF106(改進版為GF116) GF108(改進版GF119 Tesla: GT218 |
製造工藝 | 40納米 |
顯示卡 | |
入門GPU | 桌面平台:405, GT420, GT430, GT440 流動平台:410M, GT415M, GT420M, GT425M |
中階GPU | 桌面平台:GTS450, GTX460, GTX460 Second Edition, GTX465 流動平台:GT435M, GT445M |
高端GPU | 桌面平台:GTX470, GTX480 流動平台:GTX460M, GTX470M, GTX480M, GTX485M |
API支援 | |
OpenGL | OpenGL |
OpenCL | OpenCL 1.1 |
歷史 | |
前代產品 | NVIDIA GeForce 200和NVIDIA GeForce 300 |
後繼產品 | NVIDIA GeForce 500 |
該系列產品在最初準備發表時,人們曾認為將命名為GeForce 300系列,但在2010年2月初,NVIDIA通過在Twitter和Facebook的官方帳戶發出訊息,下一代Fermi核心的首發兩款產品將被命名為GeForce 400系列,分別為GTX 470和GTX 480。而GeForce 300系列將使用在OEM市場,就像之前的GeForce 100系列。
由於NVIDIA需要針對DirectX 11而重新設計顯示核心,所以GTX 480的推出時程比對手AMD慢了不少。後者只是在舊有顯示核心,加上對新Shader Model指令的支援,並沒有針對DirectX 11而優化[3]。
頂級產品GTX 480擁有30億個電晶體,原設計有512個流處理器(CUDA核心),基於良品率的考慮關閉了32個而只有480個CUDA核心被啟用,但數量仍然是GTX 280的兩倍多,支援GDDR5顯示記憶體,完整支援DirectX 11標準。GTX 480擁有NVIDIA稱之為PolyMorph引擎的技術,在單顆GPU上有16個的鑲嵌繪圖引擎,可執行全球首款可擴充的幾何管線化。GTX 480還擁有32倍反鋸齒模式,3D Vision Surround技術,支援三屏3D顯示輸出(GTX 200系列也同樣支援該技術)[4]。
新的顯示核心特別針對幾何效能而設計。近幾年,顯示核心的彩現效果有了大幅增長,但幾何效能只以幾個倍數的幅度而增加。
在DirectX 11時代,為進一步加強通用可程式化能力,NVIDIA將GPU劃分為多個GPC模組,每個模組實際上除了沒有獨立的顯示記憶體控制器、二級快取以外,幾乎是一顆完整的小型GPU。在GPC內部,內建光柵單元、SM(串流多處理器)陣列/單元,SM單元中包含了一個指令快取、Warp排程器和分派單元各兩個、暫存器、32個/48個流處理器(CUDA核心)、16個載入/儲存單元、4個特殊功能單元、一級快取、4個紋理單元、紋理快取以及一個負責曲面細分的PolyMorph引擎。[5]
透過對GPC單元或SM陣列的增加刪減,效能會隨之成近乎線性的增減,籍此可以快速產生多個不同的GPU產品線。頂級產品GeForce GTX 480上,顯示核心代號『GF100』,共計4組GPC單元,每組4個SM陣列,每個SM陣列32個流處理器,但其中一組SM陣列被關閉。中高端產品GeForce GTX 460,核心代號『GF104』,擁有2組GPC單元,每組4個SM陣列,但每個SM陣列中有48個流處理器,同樣有一個SM陣列被關閉。[6]
Tessellation技術已經被編入為DirectX 11標準。對手AMD則在Radeon 8500時代已經支援相關技術。但當時的Tessellation級別不能夠被有效控制,容易造成圖像失真。現時,Tessellation技術已經可以完全被編程。額外的頂點可以透過不同的演算法而新增。
Direct Compute可以加強圖形特效。例如不同物件的半透明效果,景深效果。
以往的顯示核心只有一個光柵化引擎。而GTX 480則擁有4個,增強抗鋸齒效能。
由於應用了Tessellation技術,場景中的多邊形數量可能會大幅增加。PolyMorph引擎則用來增強多多邊形場景的幾何效能。
亦即是NVIDIA所稱的CUDA核心。GTX 480用的CUDA核心是NVIDIA所標示的第三代版本。所有指令都被打散為1D指令。增加CUDA核心的使用率。在浮點處理方面,GTX 480用的是IEEE754-2008標準。數據只在輸出時四捨五入。以往的做法是每一個步驟都要四捨五入,誤差會累積。整數指令精度方面,支援32位元,而對手AMD則只支援24位元。在執行殊函數運算時,AMD的顯示核心使用流處理器仍計算。而NVIDIA的顯示核心則採用專用的元件。
紋理單元的數量有所下降。NVIDIA聲稱會透過提高單元效率,來彌補紋理單元數目的減少。紋理單元亦已經整合到流處理器中,減少了延遲。
重新設計光柵單元,以追趕對手的抗鋸齒效能。而CSAA的精度亦有所提升,達到32x。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.