ATi的R300(RADEON 9700)在架构上获得了空前的成功,成为ATi在高端显卡市场上赶超nVidia的武器。虽然今天测试的显卡是ATi的中低端产品RV350(具体产品是RADEON 9600 SE),但其架构仍然是沿袭R300,实际上,包括最新推出的R420(RADEON X800),其架构大体上也是继承自R300。因此,这篇文章就先从R300开始,随后再切入主题RADEON 9600 SE。
在DX9时代,ATi对其VPU(视觉处理器)进行了许多行之有效的优化,最显著的莫过于co-issue并行执行性能,R300的顶点着色器(Vertex Shader)和像素着像器(Pixel Shader)都支持矢量(Vector)指令和标量(Scalar)指令的并行执行,例如一个常见的4D矢量(RGBA,代表色彩和alpha混合),可以拆分成一个3D矢量(RGB)及一个标量(A)来执行,这在着色器指令中是很常见的。只要指令优化的好,R300就能获得很高的并行效率。R300的顶点着色器支持Vertex Shader 2.0,它具有一个128位的矢量处理器和一个32位的标量处理器。顶点数据经过顶点着色器处理后,再通过几何装配与三角形设置引擎输送到像素着色器。R300的像素着色器采用了8×1的流水线架构,也就是具有8条并行的管线,每个像素着色器在一个时钟周期内可以完成一次双线性纹理贴图和2条算术指令,我们可以计算出R300每时钟周期能完成8T+16M(8次纹理贴图和16条算术指令),在算术指令的处理能力上远超过NV30(8T+4M)。nVidia随后推出NV35以取代NV30,NV35的像素着色器增加了一个浮点处理单元,可以实现2T+2M的处理能力,即便如此,R300的指令?吐量还是高于NV35。R300的像素着色器也具有co-issue的并行指令执行性能,例如它可以同时执行一条纹理查找指令,一条纹理地址运算指令和一条色彩运算指令,因此R300的效率是很高的。
下面来看看今天的主角RV350/RV360,做为ATi的中低端主力,它实际上是R300的减流水线版本。RV350拥有4条完整的DX9像素流水线和2个顶点着色器,相当于R300的一半:) 同样的,RV350也是基于台积电(TSMC)的130nm工艺。它集成了7千5百万颗晶体管,采用FCBGA封装。RV350内置2个400MHz,10bit的DAC,以及一个165MHz的TMDS转换器,再加上TV输出,R350提供了很全面的显示接口。RV350/RV360核心又分成四款产品,它们从高到低分别是Radeon 9600 XT;Radeon 9600 Pro;Radeon 9600和Radeon 9600 SE,其中Radeon 9600 XT的核心是RV360,其它是RV350。除了频率的区别外,Radeon 9600 SE的显存为64位,是其它兄长的一半。具体参数如下表:
|
|
RADEON 9600 XT |
RADEON 9600 PRO |
RADEON 9600 |
RADEON 9600 SE |
|
显存容量 |
128MB DDR |
128MB DDR |
128MB DDR |
128MB DDR |
|
显存位宽 |
128位 |
128位 |
128位 |
64位 |
|
渲染管线 |
4 |
4 |
4 |
4 |
|
像素填充率(Gpixels/sec) |
2.0 |
1.6 |
1.3 |
1.3 |
|
核心频率(MHz) |
500 |
400 |
325 |
325 |
|
显存频率(MHz) |
600 |
600 |
400 |
400 |
|
输出 |
VGA + TV + DVI |
VGA + TV + DVI |
VGA + TV + DVI |
VGA + TV + DVI |
Radeon 9600对ATi来说是一个重要的里程碑,它是首先采用130nm的半导体技术的产品,也算为后期ATi产品全面转入130nm制程进行投石问路。ATi第一个130nm制程的核心就是RV350,新工艺可以减少核心面积,降低成本。除了工艺上的改变外,RV350的架构基于R300,它拥有和R300一样的DX9特征,但是它还引入了R350(Radeon 9800 PRO)的一些特性。因此RV350可以说有有一部分象R300,还有一部分象R350,是一个混血儿。
SMARTSHADER 2.0,SMARTSHADER是ATi表示着色器能力的术语,RV350保留了和R300完全一致的DX9功能,支持Pixel Shaders 2.0和Vertex Shader 2.0并支持多渲染对象。它的顶点着色器支持128位浮点精度,不过像素着色器仍然保持着96位的浮点精度。RV350不像R350,它没有升级到SMARTSHADER 2.1,因此RV350不具备F-Buffer。
SMOOTHVISION 2.1 ,ATi使用SMOOTHVISION是一个亮点,它提供了非常出色的FSAA和各向异性过滤能力。它的2X,4X和6X多采样FSAA方式具有色彩压缩,RV350可以支持到16X 双线性过滤(性能优先)或三线性过滤(品质优先)。对于用户来说,RV350的画质和R300一样好。RV350的SMOOTHVISION的版本号增加了0.1,这是增加了内存管理来优化使用这些特征。
HyperZ III+ ,HyperZ是ATi的Z优化,它可以减少带宽占用和潜在的渲染周期,它包括无损的Z压缩(这里最大是8:1),快速Z清除,早期Z测试和分级的Z缓存。RV350上的分级Z缓存被去掉以减小核心尺寸。
RV350的2D和视频支持同其它的R3x0系列,它集成了MPEG-2解码和视频过滤,内建两个10bit DAC,集成了TMDS转换和TV输出,RV350支持完善的多显示功能。
除了四款Radeon 9600产品,ATi还新增了Radeon 9550和9550SE,进一步丰富了中低端的产品线。在主力的RV350/RV360芯片上,ATi提供了六种解决方案。它们主要的差别在于时钟频率和显存位宽,这些显卡从高到低排列分别是:
-
RADEON 9600 XT ? 500MHz 视觉处理器,128MB/256MB 600MHz显存工作频率,128-bit位总线宽度;
-
RADEON 9600 PRO ? 400MHz 视觉处理器,128MB/256MB 600MHz显存工作频率,128-bit位总线宽度;
-
RADEON 9600 ? 325MHz 视觉处理器,128MB 400MHz显存工作频率,128-bit位总线宽度;
-
RADEON 9550 ? 250MHz 视觉处理器,128MB 400MHz显存工作频率,128-bit位总线宽度;
-
RADEON 9600 SE ? 325MHz 视觉处理器,128MB 400MHz 显存工作频率,64-bit位总线宽度;
-
RADEON 9550 SE ? 250MHz 视觉处理器,128MB 400MHz 显存工作频率,64-bit位总线宽度;
ATi通过这几员悍将,一路攻城略地,也打下了一大片的中低端显卡市场。
RV350的支持的全部特征:
SMARTSHADER 2.0
SMOOTHVISION 2.1
HYPER Z III+
-
Early Z test
-
无损的Z-Buffer压缩(最高24:1)
-
Fast Z-Buffer Clear
TRUFORM 2.0
-
第二代的N-Patch高序曲面
-
每个多边形支持离散和连续的棋盘格级别
-
位移贴图
VIDEOSHADER
-
视频和像素着色器无纹结合
-
FULLSTREAM 视频去马赛克技术
-
捕捉视频时的噪声移除过滤技术
-
带动态补偿的MPEG-2解码,离散余弦和色彩转换
-
支持全格式DTV/HDTV解码
-
YPrPb组成输出
-
自适应de-interlacing和帧数转化
|