Loading AI tools
显卡芯片 来自维基百科,自由的百科全书
GeForce 400系列[2] 是NVIDIA的第十二代GeForce显示晶片。采用TSMC的40nm制程,高阶型号将首次采用GDDR5显示记忆体,中低端产品会采用新型SDDR3显示记忆体。
发布日期 | 2010年3月 |
---|---|
代号 | Fermi: GF100 GF104(改进版为GF114) GF106(改进版为GF116) GF108(改进版GF119 Tesla: GT218 |
制造工艺 | 40奈米 |
显示卡 | |
入门GPU | 桌面平台:405, GT420, GT430, GT440 移动平台:410M, GT415M, GT420M, GT425M |
中端GPU | 桌面平台:GTS450, GTX460, GTX460 Second Edition, GTX465 移动平台:GT435M, GT445M |
高端GPU | 桌面平台:GTX470, GTX480 移动平台:GTX460M, GTX470M, GTX480M, GTX485M |
API支持 | |
OpenGL | OpenGL |
OpenCL | OpenCL 1.1 |
历史 | |
前代产品 | NVIDIA GeForce 200和NVIDIA GeForce 300 |
后继产品 | NVIDIA GeForce 500 |
该系列产品在最初准备发表时,人们曾认为将命名为GeForce 300系列,但在2010年2月初,NVIDIA通过在Twitter和Facebook的官方帐户发出消息,下一代Fermi核心的首发两款产品将被命名为GeForce 400系列,分别为GTX 470和GTX 480。而GeForce 300系列将使用在OEM市场,就像之前的GeForce 100系列。
由于NVIDIA需要针对DirectX 11而重新设计显示核心,所以GTX 480的推出时程比对手AMD慢了不少。后者只是在旧有显示核心,加上对新Shader Model指令的支持,并没有针对DirectX 11而优化[3]。
顶级产品GTX 480拥有30亿个电晶体,原设计有512个流处理器(CUDA核心),基于良品率的考虑关闭了32个而只有480个CUDA核心被启用,但数量仍然是GTX 280的两倍多,支援GDDR5显示记忆体,完整支援DirectX 11标准。GTX 480拥有NVIDIA称之为PolyMorph引擎的技术,在单颗GPU上有16个的镶嵌绘图引擎,可执行全球首款可扩充的几何管线。GTX 480还拥有32倍反锯齿模式,3D Vision Surround技术,支援三屏3D显示输出(GTX 200系列也同样支援该技术)[4]。
新的显示核心特别针对几何性能而设计。近几年,显示核心的渲染效果有了大幅增长,但几何性能只以几个倍数的幅度而增加。
在DirectX 11时代,为进一步加强通用可程式化能力,NVIDIA将GPU划分为多个GPC模组,每个模组实际上除了没有独立的显示记忆体控制器、二级快取以外,几乎是一颗完整的小型GPU。在GPC内部,内建光栅单元、SM(流式多处理器)阵列/单元,SM单元中包含了一个指令快取、Warp排程器和分派单元各两个、寄存器、32个/48个流处理器(CUDA核心)、16个载入/存储单元、4个特殊功能单元、一级快取、4个纹理单元、纹理快取以及一个负责曲面细分的PolyMorph引擎。[5]
透过对GPC单元或SM阵列的增加删减,效能会随之成近乎线性的增减,籍此可以快速产生多个不同的GPU产品线。顶级产品GeForce GTX 480上,显示核心代号‘GF100’,共计4组GPC单元,每组4个SM阵列,每个SM阵列32个流处理器,但其中一组SM阵列被关闭。中高端产品GeForce GTX 460,核心代号‘GF104’,拥有2组GPC单元,每组4个SM阵列,但每个SM阵列中有48个流处理器,同样有一个SM阵列被关闭。[6]
Tessellation技术已经被编入为DirectX 11标准。对手AMD则在Radeon 8500时代已经支援相关技术。但当时的Tessellation级别不能够被有效控制,容易造成图像失真。现时,Tessellation技术已经可以完全被编程。额外的顶点可以透过不同的算法而新增。
Direct Compute可以加强图形特效。例如不同物件的半透明效果,景深效果。
以往的显示核心只有一个光栅化引擎。而GTX 480则拥有4个,增强抗锯齿性能。
由于应用了Tessellation技术,场景中的多边形数量可能会大幅增加。PolyMorph引擎则用来增强多多边形场景的几何性能。
亦即是NVIDIA所称的CUDA核心。GTX 480用的CUDA核心是NVIDIA所标示的第三代版本。所有指令都被打散为1D指令。增加CUDA核心的使用率。在浮点处理方面,GTX 480用的是IEEE754-2008标准。数据只在输出时四舍五入。以往的做法是每一个步骤都要四舍五入,误差会累积。整数指令精度方面,支援32位元,而对手AMD则只支援24位元。在执行殊函数运算时,AMD的显示核心使用流处理器仍计算。而NVIDIA的显示核心则采用专用的元件。
纹理单元的数量有所下降。NVIDIA声称会透过提高单元效率,来弥补纹理单元数目的减少。纹理单元亦已经集成到流处理器中,减少了延迟。
重新设计光栅单元,以追赶对手的抗锯齿效能。而CSAA的精度亦有所提升,达到32x。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.