Loading AI tools
来自维基百科,自由的百科全书
GeForce 8系列,代号G80,是NVIDIA的第八代GeForce显示晶片。在7900 GTX发布后八个月,NVIDIA于2006年11月推出GeForce 8800 GTX,它是建基于G80核心。G80是全球首款支持DirectX 10的显示晶片,核心的架构和技术比前代GeForce 7系列显示晶片有很大的不同。纵使它是为DirectX 10而设计,但由于架构的改进,G80在DirectX 9环境下仍可以发挥出强大的性能。
发布日期 | 2006年11月 |
---|---|
代号 | G80 G84 G86 G92(D8P) G98(D8M) |
制造工艺 | 80纳米/65纳米 |
显卡 | |
入门GPU | 8100,8200,8300,8400 |
中端GPU | 8500,8600 |
高端GPU | 8700,8800 |
API支持 | |
OpenGL | OpenGL 3.3 |
历史 | |
前代产品 | NVIDIA GeForce 7 |
后继产品 | NVIDIA GeForce 9 |
虽然DirectX受人欢迎,但是DirectX 9的规格始终为游戏开发者带来限制。在图形API诞生前,当时的程序开发者能利用指令来控制显卡。但不同的架构就需要不同的指令,这就造成兼容性问题。为此,业界为了统一规格,就发展出最普遍的DirectX和OpenGL两种规格。纵使API能解决兼容性问题,但是派生出新的问题。在3D环境中,所有东西都以物件方式存在,而物件的运算则顺序由程序、API和驱动程式之间传输。而CPU必须参与这个过程。物件愈多,CPU负荷愈重。所以物件数量不能过多,但画面质量就不能大幅提升。 新的DirectX 10则解决了这个问题。当物件第一次运算时,CPU会参与这个过程,但到了第二次时,CPU不会再参与这个过程。物件数量就能大幅提升,画质就能相应提高。
除了以上措施能减低CPU负担,DirectX 10亦新增了两个减低CPU负担的功能。
以往,多纹理转换动作使用大量CPU资源。DirectX 10的纹理阵列功能能解决这个问题。在每个纹理阵列中,最多可以保存512个同样大小的纹理。纹理的最高分辨率由DirectX 9的4096x4096提升至8192x8192。每一个Shader能使用128个纹理,为上一代DirectX 9的8倍。Render Targets由4个增加到8个。所以在DirectX 10中,物件有更多细节,更富真实感。
在一个3D场景中,物件会遮住其他物件,不会在画面显示。预早侦测出不会在画面显示的物件,能减少不必要的运算,增加资源。虽然以往的显示核心已拥有这个功能,但始终有些物件不会被预早侦测。程式设计者会采用绘制断言这个技术,将物件制作成方块,当方块不能在前景中显示,就可以省下该物件的运算。过往这个过程需要CPU介入,但在DirectX 10中,显示核心完全负责这个过程,增加CPU资源。
DirectX 10采用Shader Model 4.0版本,进一步减少资源限制。例如Register的资源不足问题。
以下为减少资源限制的措施的列表:
它在DirectX 9中首次出现。在DirectX 10中,会采用HLSL 10版本。亦新增纹理阵列功能(请参考上面)。
改进列表:
DirectX 10支持两种新的HDR模式。第一种采用11-Bit红色和绿色、10-Bit蓝色。另一种采用5-Bit共享运算,另加每一种颜色以9-Bit作尾数运算。新的HDR模式能增加资源使用效率。DirectX 10亦支持FP32,提高HDR质量。G80提供全新的128bit精度的HDR运算,并可与抗锯齿技术同时运作,让HDR+AA不再是ATI的专利。
DirectX 10首次加入Geometry Shader,功用是将点、线、及三角连接起来,以为此过程由顶点着色器负责。它能有效提升模板阴影特效、动态立方体贴图和位移贴图的执行效率。它能减少CPU的负担,增加系统资源。当顶点着色引擎产生出一组顶点数据后,随后的几何着色引擎能将数据化成最高1024个顶点,即是将数据顶点数据增多。几何着色引擎亦可将多余的顶点数据除去,增加显示核心的运算效率。
几何着色引擎能使位移贴图技术配合镶嵌图形技术。位移贴图十分常见,通常用于非即时3D渲染中。位移贴图的原理是首先建构一个简单的平面模型,然后增加顶点数量。显示核心会根据一张灰阶纹理,去将该平面模型立体化。而镶嵌图形技术则会把一个模型镶嵌更多多边形,增加细节。
上一代的DirectX 9并不可以完好的支持镶嵌图形技术。DirectX 10的几何着色引擎就解决了这个问题。位移贴图技术和镶嵌图形技术可一同进行运算,物件表面更真实。
此外,几何着色引擎的运算结果能直接发送到显示内存中,不用通过像素着色引擎,提升效率。将来,显示核心能集中处理物理运算。
GeForce 8采用统一流水线结构。传统显示核心的架构分为顶点着色引擎和像素着色引擎。当顶点着色引擎负荷很重时,像素着色引擎可能闲置著,反之亦然。这就造成显示核心运算能力不被充分发挥,浪费资源。DirectX 10将顶点着色、几何着色和像素着色合并成一个渲染流程。所以每一个统一流处理器都能处理顶点、几何和像素数据,不会有闲置问题,效率显著提升。
G80显示核心拥有128个流处理器,每16个为一组,每一组有8个材质过滤单元和4个材质寻址单元,每一组流处理器都拥有L1和l2缓冲记忆体。G80可同时执行过千个线程,NVIDIA称之为GigaThread技术。某程度上,NVIDIA参考了ATI的设计,使其显示核心能进行异类运算工作,例如物理运算和影像编码。
物理运算方面,G80已作出强化,NVIDIA称之为Quantum Effects技术,效率比CPU高很多。
NVIDIA终于加入Early-Z技术,它的目的与绘制断言相似,但原理不一样。现先介绍一下Z缓存技术,通过测试像素深度和缓存数据比较,可测量到每一个像素的最后位置。若像素被其他像素遮挡住,被遮挡住的像素的数据则会被去掉。但很多无用的像素数据没有去掉,依然通过像素流水线,造成资源浪费。基于以往的技术限制,要预先侦测无用像素数据,必需通过整条像素流水线。Early-Z技术能解决这个问题。像素数据在进入像素着色器前,会预先被侦测,若果是无用的数据,就不用通过像素单位,省下资源。理论上,支持Early-Z技术的8800GTX比7900 GTX快4倍去筛选无用的像素数据。
G80可并行计算材质数据,而不用像以往的显示核心般,存有等待时间。
G80的强化画质引擎称为Lumenex,它支持Anti-Aliasing(反锯齿技术)、High Dynamic Range和Anisotropic Filtering(各向异性过滤)。反锯齿方面,将同时利用覆盖采样和几何采样。这个新模式称为Coverage Sample Anti-aliasing(CSAA),程度分为8x、8xQ、16x和16xQ。其中的Q版本画质较高。CSAA 16x的画质比常规反锯齿4x好,但是性能趺幅相近。纵使CSAA 16x影像质量高,但当游戏采用大量模板阴影时,会影响到CSAA运算效率。
各向异性过滤方面,G80加入了Angular LOD控制,能有效加强锐利度。
视频输出方面,G80支持10-Bit(十亿种色彩)视频输出,比上一代的8-Bit(一干六百万种色彩)视频输出质量大幅提升。但比ATI迟了一代。
GeForce 8800系列显卡都支持HDCP(High-bandwidth Digital Content Protection)。HDCP会保护HDTV、Blu-Ray及HD-DVD的影像内容,防止非法拷贝。不支持HDCP的显卡,分辨率会强行由1080p降至540p。
暂时只有8800GT和8800GTS(G92,512MB)高阶显卡支持新一代PureVideo HD技术,首次支持高清影讯噪声消除和边缘强化技术。在HQV影像测试中,获取128分高分,为现时最佳成绩。它除了支持720p、1080i及1080p等分辨率外,并支持H.264 、VC-1、WMV-HD及MPEG-HD硬件解码。
而G84和G86所支持的PureVideo HD技术更强,将所有影像解码工作交由显示核心(VP2)负责,大幅降低CPU占用率。亦新加入BitStream Processor,能够完全硬件解码H.264及部分硬件解码VC-1的影片。最后,加入了AES128运算引擎,就能硬件解码AACS,由于Windows Vista的关系,这种解码方式将被频繁使用,硬件解码就变得必要。
是集成于MCP78S晶片组中的显示核心,有16个流处理器,核心频率为500 MHz,不支持PureVideo功能。
同GeForce 8100一样是集成于MCP78S晶片组中的显示核心,规格相同,但支持PureVideo功能。
是GeForce 8系列的最低端独立显卡。只会出现于OEM市场,并不会出现于零售市场。8300 GS把存储器带宽降至64bit,更不支持PureVideo功能。
起初8400 GS(G86)的PureVideo HD是不可以支持VC-1硬件解码。之后,NVIDIA推出了采用新核心的8400 GS显卡。核心代号是G98,是继G92后的第二款采用65nm工艺制造的显示核心。核心由联电生产,核心频率是567MHz。新的核心,已新增支持VC-1硬件解码。所以,新的8400 GS已完整支持,H.264和VC-1解码。但是,HDCP Key Rom仍然未集成到显示核心中,须要另加晶片支持。HDMI方面,音频信号须透过SPIDF输入,显示核心仍然不像HD系列显卡般,能直接处理音频信号。另外,新版本的8400 GS显示核心只有8个流处理器,性能会比第一代差。
在2008年初,第三版的8400GS推出。这次使用与8600GT一样的G84核心,流处理器数量与G86一样。厂商亦会使用较高速的显示内存。[2]
这个系列采用G86显示核心,定位是主流级。它拥有16个统一流处理器,8个Texture Filtering Unit,8个Texture Address Unit和 4个光栅操作单元。目前只有一款形号,就是GeForce 8500 GT。对于HDCP的支持,厂商可自由选择是否支持。显示内存方面,G86核心最高支持GDDR4存储器,而存储器带宽只有128bit,是高端G80的三分一。影像方面,支持第二代的PureVideo HD。
这个系列采用G84显示核心,定位是中端。它拥有32个统一流处理器,16个Texture Filtering Unit,16个Texture Address Unit和 8个光栅操作单元。值得注意的是,在G80核心中,每个可编程运算单元有4个Texture Addressing Unit;而在G84和G86核心中,每个可编程运算单元有8个Texture Addressing Unit。所以G84和G86核心不是单纯的从G80简化而成。整个8600系列有两款显卡形号,它们是Geforce 8600 GTS和8600 GT版本。当中的分别是GTS版本显示核心和存储器的频率较高。还有,GTS版本是强制性支持HDCP,而GT版本则可有可无。显示内存方面,G84核心最高支持GDDR4存储器,而存储器带宽只有128bit,是高端G80的三分一。影像方面支持第二代的PureVideo HD。
G80于2006年11月8日推出。高阶形号为GeForce 8800,核心拥有6亿8千1百万个晶体管,为上一代G70的两倍。现时有三个高阶形号,分别是Ultra、GTX和GTS版本。G80采用90纳米制程由TSMC代工。GTX版本会取代GeForce 7950 GX2,GTS版本则取代GeForce 7900 GTX。GeForce 8800 GTX (G80-300) 拥有128个统一流处理器,64个Texture Filtering Unit,32个Texture Address Unit和 24个光栅操作单元。核心频率是575MHz,但部分流处理器的频率是1.35GHz,运算性能高达519 gigaflops。G80最高支持384-Bit显示内存带宽,最高显示内存容量为768MB,默认显示内存频率是1.8GHz。 显卡长10.5吋,功耗达185W,需要两组外接 6 pin 电源。
下一代G92核心的首张产品是8800 GT,2007年10月29日推出。核心以65纳米制程生产,热量更低,性能更高。显示内存方面,支持256-bit带宽。虽然带宽比旧有的320-bit少,但成本可以大幅下降,只需要8颗存储器就可以实现。事实亦证明,256-bit的性能与320-bit不相伯仲。值得注意的是,在9800 GT推出后,有厂商的8800 GT显卡只支持128-bit存储器带宽,流处理器的数量亦由112下降到96个,性能比9600 GSO更差,NVIDIA表示对此并不知情[3]。G92核心亦支持新的显卡接口PCI-E 2.0。视频播放加速方面,是第一张NVIDIA的高端显卡支持PureVideo HD技术。经过测试在默认频率下性能已更胜同厂产品8800 GTS 320MB及8800 GTS 640MB,以及ATI的HD 2900 XT 512MB及HD 2900 Pro 512MB。而采用G92核心的新板8800 GTS,流处理器的数量亦有所提升,由96个增加到128个。纹理拾取单元的数量亦倍增。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.