|
本文将以探讨中高端IA服务器的技术发展趋势为主线,并分别从CPU、芯片组、I/O技术等数个子系统的角度逐一介绍,最后再探讨一些热点问题。
记得2001年10月,本刊技术趋势栏目曾介绍各IA服务器上游技术厂商研发中的技术秘闻,并预测了过去一段时间服务器各子系统的技术发展走势。过去18个月的服务器技术可以说是喧喧嚷嚷、异彩纷呈,我们介绍的很多未来技术都走入了现实世界。辉煌过后,服务器技术已经成熟,人们普遍感觉应该复归于平静。而实际上,摩尔定律一直在背后兴风作浪,服务器技术在未来两三年又将迎来一个辉煌时期。
适者生存的IT技术
人不是为了活着而活着,技术发展也不是为了创新而创新。技术创新在驱动服务器世界的生化运演,但创新的技术英雄也需具备用户需求方面的人文关怀。
当历史走到了2003年,全球经济却是轻轻地一声叹息,本就处于寒冬中的经济环境更加黯淡。每个企业都变得前所未有的吝啬,再也不会不假思索地在IT建设上大把大把地投钱。要在充满阴霾的经济环境推动IT技术,必须驶向经济高效的发展轨道。
IBM的一切技术几乎都“On Demand”了,HP的一切企业计算技术也都在努力转向所谓的灵智架构(Adaptive Infrastructure),而Sun和Microsoft似乎招架不住Linux的疯狂进攻势头,技术走向也越来越开放,Linux正在星火燎原中成为开放的代名词。网络计算的集群时代方兴未艾,网格时代就已在宽带互联网上悄然起步,分层计算模型中大部分的后端设备似乎都将在不远的将来演变成公共设施。在这种反映未来用户需求的IT基础架构中,灵活、智能、开放将成为未来服务器技术发展的主题,以满足用户低成本、高效益的技术需求。
再回到技术创新的视野中,超大规模集成半导体制造技术在不断发展,使得很多原先成本过高的服务器技术变得逐渐可行。从长远看,诸如多极晶体管技术、3D处理器技术、硅锗和其他金属材料等技术被引入半导体;
从近期看,半导体生产工艺从0.18mm逐步过渡到0.13mm,在2003年下半年将开始向90nm过渡(见图1),而2005年则开始向65nm过渡。这些技术都使得半导体制造成本不断下降,芯片内可以集成越来越多的晶体管和逻辑电路,从而使服务器乃至整个网络计算环境中的计算、存储和通信能力不断提升,并反映在服务器的各个子系统中。

图1 Intel半导体加工工艺发展规划
用户需求与技术创新的交相辉映,为人们描绘出了未来服务器技术发展演变的主题。
心潮澎湃芯时代 ——处理器技术
采用多内核多线程技术、提高处理器主频和外频、提高处理器缓存容量和速度,都将是未来几年服务器处理器发展的必由之路。
未来处理器还有可能增加许多前所未有的新功能,如集成的I/O功能、内存控制器功能。当前服务器系统的瓶颈主要集中在处理器的运算内核之外,提升I/O子系统和内存子系统与处理器的连接速度将成为今后提高服务器系统性能的关键。因此,在处理器内集成I/O功能和内存控制功能成为理所当然的技术发展思路之一。
在处理器内部添加网络协议处理功能、加密套接字(Socket)功能等则是另外一种思路。在计算和通信紧密结合的时代,在处理器中融合各种通信协议的基本功能、支持常用复杂加密算法,也可以显著提高服务器性能。这是更长远一些的处理器技术发展思路。
不久前来华访问的Intel公司副总裁兼企业平台部总经理Abhi Talwalkar向笔者表示,Intel目前正在研究未来处理器的创新性发展思路,包括在处理器中集成I/O功能、TCP/IP
Offload等,不过还没有明确是否以及何时能将这些技术加入Intel处理器。
虽然技术风云变幻莫测,但是Intel服务器处理器Xeon从Pentium系列中分离出来,为IA服务器技术摆脱PC特征、具备更多服务器运算特征打开了一个良好的开端。
多核多线程技术
2002年2月发布的Intel 1.8GHz Xeon荣获本刊年度产品奖,其原因就在于Intel为单颗处理器引入了两个线程的多线程技术(Intel称之为超线程技术,在2003年还将有改进版面世),开业界之先河。2003年2月Intel又正式宣布,将于2005年面世的代号为Montecito的Itanium系列处理器将采用双核(Dual
Core)设计,即把多内核技术引入Intel处理器。不过,开多内核处理器技术先河的不是Intel,而是2001年末面世的IBM Power4 RISC处理器,该产品同样采用双核设计。
多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。多核多线程设计的处理器在运算性能和性能价格比方面都将非常出色,将成为下一个时期IA服务器处理器技术发展中的最亮点。
HP预计于2004年第一季度发布的PA-8800 RISC处理器将采用双核设计(封装了两个PA-8700内核,单线程设计); 而IBM预计于2004年发布的Power5
RISC处理器将采用双核双线程的设计(即两个内核,每个内核有两个线程),这可能将是率先面世的第一款采用多核多线程设计的处理器产品; Sun的传统S系列中将于2004年面世的UltraSPARC
Ⅳ RISC处理器可能采用双核单线程设计,2005年面世的UltraSPARC Ⅴ RISC处理器则可能采用双核双线程设计,而Sun预计于2005年面世的全新H系列RISC处理器则大胆采用惊人的8核4线程设计,在单一处理器上达到32路SMP的效果。
从上述RISC产品技术的发展来看,未来IA服务器处理器也必将采用多核多线程(Multi-Core Multi-Threading)技术。相比之下,采用双核设计的第四代Itanium(Motecito)在2005年的亮相未免有些姗姗来迟。Intel称,目前尚没有计划在Itanium系列处理器中采用多线程设计。Intel在IA处理器技术上的态度难免给人以略显保守的印象。
至于Xeon系列是否会在2005年后采用多核技术,笔者认为还没有一个定数:从设计、制造和应用等各个技术视角来看,把Xeon变成多核多线程产品没有重大障碍;
但从Intel的处理器产品线定位划分看,Intel不愿把Xeon变成多核多线程产品,这样会妨碍Intel的Itanium发展计划,高性能的Xeon系统肯定会放慢Wintel用户采纳Itanium的步调;再从Intel竞争者的角度分析,如果在高端的Itanium发展计划受到传统64位RISC厂商的有力阻击,或者在低端Xeon系列受到了来自AMD的威胁,那么Intel就不得退而求其次,即在2005年后推出多核多线程的Xeon,固守住自己在32位IA服务器领域的一片地盘。
提速扩容
提升主频和外频,增加二级和三级缓存的容量,都是提高处理器运算速度的传统手段。
处理器主频的逐年提升是必然的。在同主频的前提下,提升处理器的前端总线FSB频率(也称外频)也可显著改善处理器的性能。目前PC处理器的前端总线频率已经直指800MHz,Xeon和Itanium当然不会停留在目前400/533MHz的水平之上,不过出于对SMP稳定性考虑,提升速度要比PC慢半拍。
随着处理器运算核心的性能不断提升,也需要为其准备好更多的数据和指令,迫使处理器中必须集成更大容量、更高速度的缓存。此外,更高速度、更大容量的处理器缓存也可以显著提高SMP环境下的处理器运算效率。因此,服务器处理器的缓存容量以后还将在一段时期内逐年增加。在未来两年,Xeon-DP和Xeon-MP的缓存容量将沿着1MB、2MB、4MB……的速度翻番式增长,而Itanium系列的缓存容量将沿着6MB、9MB……的速度增长。
与一些RISC处理器不同的是,Intel处理器主要采用片上(On-Die)缓存的方式,其存取速度快,工作效率高。因此,未来IA服务器处理器在缓存速度方面的提升空间有限。
芯片=系统?
随着处理器性能的不断提升,以及服务器中处理器数量的不断增加,处理器子系统与其他子系统之间的单一总线接口已经逐渐成为性能瓶颈。如果处理器中集成了I/O和内存控制器,子系统间的瓶颈问题将随之消失。
在处理器中集成I/O功能,就可以打破现有的单一FSB总线接口形式,形成交换式的互联结构,打破现有处理器子系统的瓶颈。使具备I/O功能的处理器实现互联将是一场革命,但是也会面临服务器架构上的兼容性问题。如果兼容性不能解决,这种技术革命就没有前途;如果顾及兼容性的同时丧失了性能优势,那么前途也是渺茫的。
在处理器中集成内存控制器,内存和处理器可以直接以低延迟、高带宽的方式连接起来,显然可以提高数据在内存和处理器之间的存取效率。当然,分布式的内存也会在多处理器环境中面临内存一致性的问题,如果解决内存一致性的相关技术成本过高,也会面临窘境。
乱世出英雄——作为服务器处理器的一个后来者,AMD愿意冒险推动革命,在集成I/O和内存控制器方面可能将走在Intel的前面。AMD计划在2003年推出的Opteron处理器中集成HyperTransport
I/O功能和内存控制器功能(细节在下文中介绍)。
通用+专用
TCP/IP已经成为网络操作系统的必备协议,把TCP/IP的部分功能集成到服务器处理器中由操作系统直接调用,显然可以在网络计算环境中大幅提高服务器的性能表现。目前Sun、Intel等公司先后表示出对这一技术的关注。
在服务器处理器中提供加密套接字功能,可以显著提高服务器加密、解密运算的速度。在安全问题日益严重的未来计算环境中,具有加密套接字功能的处理器无疑会独领风骚。
如同Microsoft当初把众多应用软件都逐步集成到操作系统中一样,未来的处理器巨头有可能把越来越多的专用处理器功能集成到通用处理器中,同时还有“下载”操作系统一些底层功能的趋势。这种趋势的演进速度,很大程度上将取决于处理器生产成本的降低速度,否则处理器的性价比不会被市场接受。笔者因此相信,上述很多激动人心的技术在90nm时代暂时不会出现,但到了65nm时代之后,这些技术或许开始显山露水。
x86-64技术
作为基于x86指令的32位IA服务器向64位计算平滑过渡的技术,AMD的设想及相关处理器引起了业界的普遍关注。据AMD称,配备该处理器的服务器不仅能够完全发挥64位应用程序的威力,同时还能够在不降低运行速度的情况下运行32位应用程序。
Microsoft即将推出的下一代服务器操作系统Windows Server 2003(即Windows .net Server)支持AMD这一技术,为x86-64注入了活力与希望。业内传闻,Intel悄悄出资购买了该技术的使用许可,为x86-64技术又增添了几分神秘感。
在一阵热炒之后我们不妨冷静分析一下,AMD将Opteron主要定位在32位应用,x86-64技术只是使其具备了“64位Ready”的概念。如果用户真的要在Opteron服务器上运行64位应用,那么定位于32位运算的产品有可能有出色的64位表现吗?
笔者认为,至少在Opteron上的x86-64技术只不过是一根“鸡肋”。而且,即使AMD财务状况转好,能驱动x86-64技术在下一代产品上能有良好表现,但作为一种32位和64位之间的过渡性技术,其结果终将是昙花一现。
产品前瞻
在此,本文将尝试对Intel的Xeon系列、Itanium系列和AMD的Opteron做一些前瞻性介绍。需要强调的是:服务器处理器未来产品的发展规划有可能不同于最终产品,技术指标随时有变更的可能。
Xeon系列
在双路服务器处理器Xeon-DP的产品线上,Intel预计在2003年上半年发布主频达3.06GHz的产品;第三季度发布新品,把二级缓存从512KB升级到1MB,继续采用0.13μm工艺生产;第四季度将发布代号为Nocona的Xeon,生产工艺过渡到90nm,二级缓存容量仍然为1MB,内核也没有重大改变,但是处理器内部进行了一些优化改进。据推测,Nocona将包含改进的超线程技术。上述产品都将采用533MHz外频,兼容现有平台(见图2)。

图2 Intel 的IA32双路服务器处理器发展规划
2004年Intel将把双路Xeon服务器升级到新的平台上,处理器代号Jayhawk,外频将升级到667MHz,目前还没有公布其他产品细节。不过从台式处理器Tejas有可能采用的775管脚封装来看,Jayhawk的管脚数量也不会少,对外接口的数据、指令吞吐能力和信号控制能力必然大获增强。
在多路服务器处理器Xeon-MP的产品线上,2003年Intel没有重要的技术变化,仅限于主频的提升;2004年上半年,Intel将把Xeon的三级缓存从2MB升级到4MB;2004年下半年,多路服务器升级到新的平台,处理器代号为Potomac,生产工艺过渡到90nm,估计也将具有上述Jayhawk的一些特点(见图3)。

图3 Intel IA32多路服务器处理器发展规划
Opteron
作为Intel在PC处理器上的死对头,AMD也一直在窥视利润丰厚的服务器处理器市场。预计于2003年上半年面世的Opteron(又名SledgeHammer)处理器支持2~8路服务器系统,采用了x86-64技术,两级缓存结构,在处理器中集成了3个高达6.4GB/s的HyperTransport
I/O接口,以及双通道DDR内存控制器功能,生产工艺为0.13mm(见图4)。

图4 AMD将发展的Opteron处理器架构
在处理器内集成多个I/O接口以及内存控制器的功能,并不是AMD的创意,这个技术起源于原Compaq Alpha处理器EV7和EV79的设计。而AMD第八代处理器Hammer(包括Opteron和ClawHammer)设计团队的首席工程师Dirk
Meyer及Fred Weber恰恰也是出身于原Alpha处理器团队。
Itanium系列
未来几年,3万~5万美元的服务器市场的厮杀将最为激烈,因为Intel在向上扩展地盘,盯上了这个市场中的老大Sun和老二IBM。这部分市场的出货量在服务器领域中所占比例是微不足道的,但是销售额和利润都很高。
面对Itanium磨磨蹭蹭的起步态势,IBM的Unix服务器相关部门已经没有了前两年的慌张,也不再轻言放弃Power处理器,甚至把Linux之上的开发重点从Itanium
2服务器转移到Power4的服务器上了。至于Sun,“豪言壮语”更是不在话下,誓与Intel分庭抗礼。
对手的反击让Intel面临新的挑战。但是从Itanium后继产品已发布的技术特征看,Intel继续稳扎稳打的思路,没有多少新奇的技术改进。笔者认为,Intel大约把开放作为自己最重要的技术竞争力了。
2003年夏季Intel将发布代号为“Madison”的Itanium 2新产品,生产工艺从0.18mm过渡到 0.13mm,三级缓存从3MB提高到6MB,主频从1GHz提升到1.5GHz,功耗约为130W。此外,还有代号为“Deerfield”的低电压版Itanium
2推出,缓存容量为1.5MB,主频为1GHz,功耗降低到62W。
2004年Intel将继续升级Itanium 2到“Madison 9M”的版本,即三级缓存达到9MB,继续沿用0.13mm生产工艺,并有相应的低电压版本推出。据业内传闻,这个产品早先也有采用双核的想法,把两个内核及9MB缓存分布在芯片内两个不同的半导体上。
到2004年为止,Itanium 2都维持在相同的平台上,只要简单升级处理器,系统性能就可以获得大幅提升。
从2005年开始,Intel将推出代号为Montecito的新一代Itanium处理器。目前明确的就是这一产品会采用双核设计,生产工艺为90nm,并具有更高的缓存容量(见图5)。而在2002年的非正式资料上,Montecito的推出计划是在2004年。Itanium发展计划在此环节上的再次推迟意味着什么?Intel是想让人们对Itanium失去信心还是要给人们一个惊喜?

图5 Intel 的IA64服务器处理器发展规划
笔者从Intel获悉,该产品将继续沿用改进了的Intel E8870芯片组。也就是说,Montecito变化不太大,不会像人们原本期望的那样采用很多Alpha的先进技术,至少不会像Alpha
EV7那样在处理器内集成内存控制器和I/O功能。由此分析,Itanium可能不会延续Alpha在系统体系结构上的发展思路。
不过,Montecito的双核设计仍然能给用户及系统厂商不少信心,而且可能代表Intel在Itanium技术发展思路上的选择——注重多核多线程技术。Intel虽然称该产品目前没有计划采用超线程技术,但是笔者认为,该产品最终是否采用超线程还将取决于这一技术的改进水平。
Montecito之后是代号为Chivano的Itanium产品。Chivano会是什么样子?面对雄风依旧的传统64位RISC服务器,Intel自己恐怕也很难断言Chivano的未来。不过,Chivano背后的100多名原Alpha团队的工程师将使Chivano与众不同。
以Itanium 2现有的性能表现来看,其实不需要采用任何革命性的技术,未来一两年内Intel已经在技术层面稳操胜券,而真正决定Itanium 2命运的却是基于Itanium系统的应用。支持Itanium的操作系统、中间件在2002年已经比较丰富,但是真正的行业应用数量还比较少,而且行业应用层面的成长不会很快,至少还需要两年的时间。这大约是Intel在Itanium发展计划中最头痛的环节。
未来Itanium家族能否在64位处理器领域惟我独尊?现在人们反倒没有Itanium问世前那么肯定了。
百花齐放看架构——芯片组和核心逻辑
技术推演
芯片组发展动力
芯片组是服务器架构中的灵魂。随着芯片组在服务器架构中的枢纽作用凸现,芯片组技术包含的服务器核心逻辑正在成为服务器的核心技术。部分上游技术厂商和注重自有技术的系统级厂商都在研发自己的芯片组产品,使得IA服务器差异化增强,呈现百花齐放的局面。
未来IA服务器芯片组变化将主要遵循两个规律:第一,随处理器特性变化而改进;第二,随应用对服务器基本特性的要求而变化。
中端服务器芯片组的发展
随着处理器速度不断提高、内存容量不断攀升、I/O系统带宽成倍增长,为避免阻塞与冲突,中端服务器芯片组的核心逻辑正在从共享总线方式向全交换方式发展。IA服务器核心逻辑的发展已经经历了以下2个阶段。
南北桥结构 回顾PentiumⅢ Xeon和64位PCI总线时代,服务器的系统结构与PC接近,基本是南北桥结构,I/O系统的数据全部通过南北桥之间单一通道进出内存子系统。与PC的差别只不过是在PCI总线上多一些分段(见图6),代表产品有ServerWorks
ServerSetⅢ HE和Intel 460GX等。

图6 IA服务器架构演变
准交换结构 随着PCI-X总线的出现,南北桥之间的瓶颈效应必须解决,于是服务器系统转向了以内存控制器为核心的准交换结构,以PCI-X为主的I/O系统直接连接到了内存控制器,代表产品有ServerWorks
GC-HE和Intel E8870等。之所以称之为准交换结构,是因为全部处理器还是以单一总线的方式连接到内存控制器,而不是以点对点的方式独立连接到具有交换功能的内存控制器上。
当前2~4路IA服务器普遍采用准交换结构,而且这种结构在4路以下IA服务器上还将延续一两年。从长远发展看,处理器的速度不断提升,多处理器共享FSB总线的带宽会成为系统性能发挥的瓶颈。因此,未来4~8路服务器很可能会向以内存控制器为核心的全交换结构过渡。HP
F8芯片组就有类似特征。
如果在处理器中集成I/O和内存控制器,那么服务器的核心逻辑就有可能过渡到以处理器为核心的互联结构。AMD预计在2003年内发布的Opteron处理器及其8100芯片组就能部分实现以处理器为核心的互联结构。
上述的以内存控制器为核心的准交换结构、以内存控制器为核心的全交换结构、以处理器为核心的互联结构等3种服务器核心逻辑基本可以满足8路以下IA服务器的设计需要。
高端服务器芯片组的发展
由于服务器应用模式正在转向具有高度可伸缩性的“公用设施”,高端IA服务器的处理器数量直线攀升,系统结构正在向模块化发展,以适应应用模式的变化。高端IA服务器核心逻辑走向了以交换为核心、多层次的交换结构与总线结构相结合的复杂体系结构,并在复杂的高端服务器上引入大型机的交叉互联架构。复杂的服务器架构虽然带来单机性能的提升,但是也面临如何更开放、如何成为工业标准服务器的问题。
目前高端IA服务器的架构主要有如下两种。
SMP节点互联 以4路SMP处理器和相应内存为一个独立节点,以NUMA(非一致性内存访问)技术和节点控制技术为基础,采用高速总线连接多个单元,从而使系统多达16路以上处理器(见图7)。代表性产品有IBM的EXA(代号Summit)芯片组和Hitachi
ColdFusion-2芯片组等。

图7 SMP节点互联的高端IA服务器架构
基于交叉通道(CrossBar)的蜂窝多处理结构 (CMP) 完全采用大型机的交叉通道互联控制、缓存管理器、I/O管理器等,已经无法用芯片组的概念来包容其核心逻辑。代表性服务器产品有Unisys
ES7000系列和NEC的Itanium系统等。
CMP架构最大的特点在于核心的CrossBar,把系统中任何两个子系统的数据传输时只都降到一个非常低的水平,克服了传统SMP系统内部互联设计的瓶颈。CMP架构在8路及8路以上服务器中优于传统SMP系统的架构。
产品前瞻
IA32芯片组
由于Intel Xeon处理器在2004年将有一些相对比较大的变化,相应的芯片组产品也必然会发生变化。
Intel Intel在Xeon时代开始着手重拾服务器芯片组业务,推出支持双路Xeon的7500/7501并获得成功。出于开放的考虑,Intel在今后的IA32芯片组领域应该不会有垄断的企图,但Intel将占尽“天时地利”。
Lindenhurst是支持下一代双路服务器处理器产品Jayhawk的Intel芯片组代号,目前没有正式公布任何细节。据悉,该芯片组将支持DDR2内存、支持PCI
Express,前端总线带宽至少会提高到5.3GB/s。该产品还将有一个代号为Lindenhurst VS的低端版本。
Twin Castle将是Intel独立开发的第一款支持4路IA32处理器的芯片组,支持Potomac处理器,目前也没有任何正式公开的产品信息。据悉,该产品将支持DDR2内存、支持PCI
Express。据笔者推测,Twin Castle将会吸收E8870在架构方面的特征,并进行优化改造。
ServerWorks ServerWorks被Broadcom收购后,Intel有种“吃醋”似的感觉。昔日听话的小弟弟有了强大的靠山,对于Intel确实不是什么好事,于是Intel开始着手重拾IA32服务器的芯片组业务。Intel也许只希望更好地把握IA32服务器今后的发展方向和步调,但却令以开发芯片组产品为生的ServerWorks公司如临大敌,因此,对其产品发展蓝图也开始实施严格的保密措施。
由于ServerWorks在2~4路服务器芯片组中一直保持技术领先,用户对其未来产品比较关心。但目前,笔者仅获知该公司将推出GC-SLX芯片组支持双路Jayhawk处理器,GC2-HE芯片组支持4路Potomac处理器。这两款芯片组都将采用DDR2内存。GC2-HE将支持PCI-X
2.0全部或部分标准(PCI-X 2.0在1.0版本的基础上增加了对PCI-X 266和PCI-X 533的支持),是否跟随Intel支持PCI Express还没有定数,届时将要看业界对PCI
Express以及PCI-X 2.0的反映。目前ServerWorks比较肯定的仅仅是支持PCI-X 266。
HP 由于Profusion芯片组的优势,原Compaq在8路PentiumⅢ Xeon时代独领风骚。但在2002年Intel推出2MB 三级缓存的Xeon-MP以前,Compaq继承Profusion开发的F8芯片组一直表现不理想,而IBM却因EXA芯片的4级缓存机制而在8路Xeon领域让新HP吃了不少苦头。在2003年3月,基于F8的Proliant
DL700系列8路服务器终于上路了。F8最终也没有设计系统级的第四级缓存。
F8的下一代产品(按照原Compaq的命名习惯,笔者暂且称之为F8 G2)会怎么样?据分析,F8 G2也不会设计第四级缓存,原因在于Intel后继处理器将提供更高的第三级缓存,可以满足多处理器协同计算的需求。根据HP专家的说法,如果第四级缓存设计不当,反而有可能降低系统效率。
另外,F8 G2最多也只会支持8路处理器。HP专家指出,在8路以上系统中,处理器数量的增加所带来的效率将越来越低,这主要受IA32系统寻址能力的限制。出于经济性考虑,HP在8路以上IA32服务器需求中将采用群集方式解决。
IBM EXA芯片组让IBM在2002年在8路服务器上出尽了风头,但是在2003年就已经面临前有Unisys ES7000、后有HP F8的局面,因此年内将推出支持32路Xeon-MP的第二代产品EXA2。据悉,EXA2仍然支持4个节点,但是每个节点中的处理器数量从4路提高到8路。随着Potomac处理器的推出,IBM可能将推出相应的第三代EXA芯片组,但产品细节还无从探知(EXA系列芯片组也可以支持Itanium系列处理器,但尚未有相应服务器推出)。
Unisys 如果说IBM的EXA芯片组下载了很多大型机技术,那么Unisys蜂窝多处理结构 (CMP)的Xeon服务器则是彻彻底底的大型机(见图8),它开启了Wintel的大型机时代。目前,Unisys的CMP架构可以支持32路Xeon和Itanium
2处理器。

图8 基于大型机CrossBar的CMP架构
虽然采用CMP架构的产品在硬件层面上不能与当前工业标准服务器配件(譬如内存)完全通用,但是通过对Windows硬件抽象层的替换,CMP架构服务器可以不加修改地运行基于Windows的各种应用程序。因此笔者认为,也可以将其视之为开放的Wintel服务器。
CMP作为一种先进的架构,在未来只要改变处理器接口、增加各个通道的带宽,就可以不断适应未来处理器的发展。如果在配件一级向工业标准服务器进一步靠拢,在发展中能够实现产品的标准化,那么CMP架构将获得辉煌的发展,并对服务器产业造成深远影响。
CMP架构可以让IA32的应用获得新生,目前不满足于IA32系统性能的应用不再需要向IA64系统迁移了。对于Intel的Itanium发展计划来讲,这大概不是什么好消息。对于传统64位Unix服务器厂商,廉价的Wintel大型机平台的出现更加不会带来什么好运。
IA64芯片组
Intel 按照Intel现在的资料来看,E8870芯片组将继续在Itanium系统中担纲,可以支持Montecito,而E9870芯片组并没有出现。E9870芯片组也许没有太多的改进,Intel在正式产品中继续称之为E8870。
由于Montecito将采用双核设计,届时E8870必然要在各子系统的带宽方面进行一些改进,以充分发挥Montecito的性能。而作为工业标准服务器系统,该产品也必将支持2005年业内流行的I/O接口标准和内存标准。
另外值得一提的是,E8870在开发的时候被设计为同时支持Xeon和Itanium,最终却关闭了对Xeon系列的支持。看来,Intel矢志于推动Itanium发展,为此不惜限制Xeon在中高端向上发展。Intel在Itanium上押的赌注真的很大。
ServerWorks ServerWorks在Itanium系列上目前一直没有采取什么行动,现在看来的确很明智,因为前两代Itanium的投资回报都不高。ServerWorks表示,计划在Deerfields(第三代Itanium的低电压版本)产品上开发相应的芯片组产品,目前没有公布任何产品细节。看来,ServerWorks暂不打算在Itanium服务器领域大干一番。
HP HP和Intel合作打造了Itanium,自然不会在相应的芯片组领域落后。HP在2002年推出的zx1芯片组,支持4路Itanium 2。zx1不过是HP
Itanium策略中的一个小角色,Pinnacles才是HP的杀手锏。
2003年2月HP正式宣布了代号为Pinnacles的芯片组,正式名称为sx1000。它支持多达64路Itanium 2或HP PA-8800处理器,预计将于2003年7月与代号为Madison的新一代Itanium
2 一同登台。无疑,这款芯片组采用了大型机的架构。
名为mx2的双处理器模块可以将采用sx1000芯片组的系统扩展到128路处理器。mx2可以把2个Itanium 2处理器和32MB四级缓存整合在一起,模块的外部接口兼容Itanium
2的处理器插槽。据称,这一模块可以用于所有基于Itanium 2的HP服务器。
其他产品
前面IA32芯片组部分讨论过的IBM EXA芯片组以及Unisys CMP架构都支持IA64处理器,这里不再讨论。Hitachi有代号为ColdFusion-2(简称CF-2)的芯片组,采用节点互联方式,目前可以支持2个节点共8路Itanium
2。NEC也有自己的芯片组,采用CrossBar的大型机架构,支持32路Itanium 2。Bull也有支持8路Itanium 2的芯片组,但没有最终产品面世。
总之,支持Itanium的芯片组产品从低到高,种类繁多。作为一个开放的服务器架构,未来这些芯片组还会面临一个优胜劣汰的过程。
百舸争流看I/O——I/O技术纷争
内部I/O技术
技术推演
I/O总线负责外部网络、外部设备与系统内存总线之间的数据传输,直接制约CPU的外部数据吞吐能力。PCI-X 1.0是当前IA服务器I/O总线的主角,带宽峰值1GB/s。2002年5月通过的PCI-X
2.0在原有PCI-X 66/133(属于PCI-X 1.0标准)的基础上又增加了PCI-X 266/533,带宽峰值分别达到了2.1GB/s和4.2GB/s。
PCI-X 2.0标准尚未在服务器中实现产品化,Intel就已经开始迫不及待地宣布2004年转向PCI-Express,令人倍感疑惑。
回忆几年前Intel积极推动NGIO,经过标准之争形成了InfiniBand最终标准。先进的InfiniBand既可以作为服务器内部的I/O总线取代PCI,也可以在数据中心内延伸成为服务器、存储设备的互联技术。而且在多处理器环境中,InfiniBand基于I/O通路共享机制的通道管理方式比PCI/PCI-X的单一内存映像管理方式具有更多优势。
最终,复杂的3层OSI协议使得InfiniBand的成本居高不下,于是在服务器内部I/O技术中,Intel弃之不用,转而积极推动PCI-Express。
2003年初,恰恰是Intel信誓旦旦地要在2004年转向PCI-Express的时候,Sun却宣布在下一代大批量服务器(即Sun的中低端服务器)中全面集成InfiniBand,与InfiniBand技术的领导厂商Topspin结成联盟,成为业内第一个在大批量服务器中集成InfiniBand的厂商。
Intel已经称霸3万美元以下的服务器市场,下一个发展目标就是向上拓展单价3万~5万美元的服务器市场,主要对手是Sun。于是,PCI-Express与InfiniBand之争演变成了两种I/O标准的主要支持者——Intel与Sun斗争的一部分。
正当PCI-Express与InfiniBand针锋相对之时,又跳出了第三者——PCI-X 1066。PCI标准化组织PCI-SIG正式成立了工作小组,开发带宽8.5GB/s的PCI-X
1066,预计于2004年下半年完成,并且还表示将开发PCI-X 2133,带宽17GB/s(见表1),性能毫不逊色于PCI-Express和InfiniBand。PCI-X
1066/2133最大的竞争力还在于它全面地向前兼容PCI-X 1.0/2.0标准、兼容现有软件。PCI-SIG发言人宣称,PCI-X 1066/2133和PCI-Express有可能同时纳入PCI-X
3.0标准。
到此为止,未来服务器的I/O技术一下就变得迷茫起来。
革新还是革命
PCI-X属于并行连接技术,后继PCI-X 1066/2133向前兼容,是革新技术。PCI-Express与InfiniBand同属于新一代串行连接技术,也应是革命性技术。串行取代并行的技术革命将是历史发展的必然,然而何时以及如何取代还都是未知数。
用户不愿意为技术革命埋单,所以InfiniBand的成本问题继续限制着自身的发展。相对简单的PCI-Express没有太多成本问题,但是要面临兼容性的问题。串行工作的PCI-Express不可能在底层向前兼容并行方式的PCI-X设备,但是又必须通过映射转换来兼容PCI-X标准的软件工作方式,而映射转换又会面临效率降低的问题。
PCI-X 1066/2133作为技术革新者,既没有成本问题,也没有兼容性问题,理应被人们看好。或许正是PCI标准化组织另有图谋,造成Intel在PCI-Expres上提前开始孤军冒进。
笔者在此总结一下服务器I/O技术的发展方向: 2003~2004年PCI-X 2.0 (PCI-X 266/533)将是发展热点; 此后,采取兼收并蓄原则的PCI-X
3.0标准将是发展方向,PCI-Express和PCI-X 1066/2133会持续并行发展一段时间。PCI-Express能否占到上风,还要看该技术的进步速度。从现状看,PCI-Express并没有宣传中的那么好,在带宽、管脚数量上都没有明显优势(见表2)。
如果Intel在2004年的服务器芯片组中集成PCI-Express,那么将对PCI-Express起到强有力的推动作用,但至少要到2005年才有可能流行。2005年以后,并行PCI技术会如同昔日的ISA技术一样,在新标准之后延续发展多年。相比较之下,未来3年InfiniBand技术在IA服务器内部I/O系统中没有太多的机会。
外部I/O技术
基于服务器集群和网络存储的需要,服务器的I/O系统向外延伸,我们也在此对主流的服务器外部I/O技术发展趋势进行简单的讨论。
随着机架服务器和刀片服务器在未来服务器应用中所占的比例增高,服务器间的互联以及外部存储需求都快速提升,服务器外部I/O技术将变得举足轻重。未来外部I/O技术将沿着标准开放、长距离连接、高带宽、高可靠性、高度可伸缩性、低成本的技术方向发展。
未来几年服务器外部I/O技术将会是数种技术并存的局面,InfiniBand最具竞争力,未来高速的以太网技术在中低端应用中也极具价格竞争力。以太网技术随着iSCSI的推行也成为更加重要的服务器I/O技术。而Fibre
Channel(光纤通道)技术作为现在的主流存储技术将在未来延续发展。AdvancedTCA(Advanced Telecom Computing Architecture,高级通信计算架构)作为外部I/O技术的接口标准,是刀片服务器发展的命脉。
InfiniBand技术
InfiniBand在服务器内部I/O技术竞争中碰壁以后,转而在外部I/O技术中发展,并倍受瞩目。在未来的大型数据中心,模块化的服务器将与网络存储设备、IP网络连接在同一个InfiniBand网络上。这将大大简化服务器和网络存储设备间的互联(见图9),IT投资和日常维护费用都可节约。

图9 InfiniBand为用户带来数网合一的改变
以InfiniBand和Fibre Channel为代表的通道技术与以太网的帧中继技术相比,前者在数据中心网络环境下的高速数据通信方面有更高效率。InfiniBand
4x的8Gbps的数据带宽又明显优于同样基于通道技术的2Gbps Fibre Channel,更何况InfiniBand 16x的数据带宽可以高达24Gbps。在集群计算中,InfiniBand
4x的性能已经优于此前最好的专用集群网络Myrinet和Quadrics。
在服务器应用中,InfiniBand技术有独特优势。在硬件方面,InfiniBand的通信连接可采用印刷电路板,不局限于光纤和铜线形式的线缆,因此可以直接连接到服务器的内存控制器,避开服务器的内部I/O总线(PCI/PCI-X)。在软件方面,InfiniBand提供直接文件访问系统(DAFS)、优化群集和网格运算的套接字直通协议(SDP),减少操作系统开销,可以更好地发挥CPU的效率(见表3)。

因此InfiniBand技术在未来服务器外部I/O技术中最被看好。预计2003年将有少量部署(见图10),2004年被开始大量采用,2005~2006年有可能成为主流的服务器外部I/O技术。

图10 InfiniBand(IB)发展规划
以太网和Fibre Channel技术
以太网技术作为服务器的外部I/O技术是必不可少的,目前一些服务器芯片组的外围芯片已经集成了千兆以太网控制器。从开放、融合的角度看,未来中低端服务器和存储设备将以廉价的以太网为组网设备,在其上加载高层协议TCP/IP和iSCSI、iFCP,构建单一IP环境下的存储和通信网络。
作为服务器外部I/O接口,Nortel在2001年就发布了服务器上使用的10Gbps以太网卡,然而2003年万兆以太网才有迹象要真正走入服务器,并在未来几年成为趋势。
相对于2005年以后才能上路的40Gbps/100Gbps以太网技术来说,还有两个并不遥远的热点,就是10GBASE-T 和TOE(TCP/IP Offload)。支持铜缆的10GBASE-T将在2003年11月开始制定,此后将推动万兆以太网在服务器中的普及(集成到服务器芯片组中)。
前面在处理器部分曾提到过TOE技术,但是在处理器内集成该技术比较遥远,在服务器网卡上集成这一技术却近在眼前。Adaptec等厂商已经用ASIC芯片实现了这一设想。TOE可以卸载操作系统中TCP/IP的流量控制、数据完整性检查、数据包重定向、会话进程启动,降低服务器处理器和I/O总线的占用,提高服务器综合性能。据测试,在复杂的TCP/IP通信中,TOE可以使IA32双处理器服务器CPU占用率从50%降低到5%。
Fibre Channel作为网络存储技术的标准,也会成为服务器的外部I/O技术之一,但由于高成本的原因而不会很普遍。Fibre Channel在未来一两年将从现在的1Gbps/2Gbps速率发展到4Gbps,速率仍然有限,但是在网络存储领域的重要地位短期内也难以动摇。但是Fibre
Channel上层协议将分离出来,目前有运行在IP网上的Fibre Channel协议iFCP,跨越广域网实现SAN互联的FCIP等。
AdvancedTCA
AdvancedTCA是PICMG 3.x系列标准的别名,是CompactPCI规范发展的延续,定义下一代电信设备的接口标准和规范。对于服务器而言,AdvancedTCA是未来刀片服务器的外部I/O标准。
目前刀片服务器发展最大的障碍就是缺乏标准的外部I/O技术,这制约着网络存储性能,不同厂商间的刀片服务器互不兼容提高了总拥有成本。当前PICMG 2.x系列标准完成了计算、通信、存储接口分配方案,但是服务器厂商普遍在等待更加完善的AdvancedTCA。
新的AdvancedTCA标准将能更好地支持计算、通信、存储等模块的高速互联,促进计算和通信设备的模块化发展及相互融合。AdvancedTCA包括:
协议基本规范(PICMG 3.0)、以太网和Fibre Channel (PICMG 3.1)、InfiniBand (PICMG 3.2)、StarFabric
(PICMG 3.3)和PCI-Express(PICMG 3.4)。其中前3项标准已经在2003年3月获得通过,后2项标准预计2003年内完成。
AdvancedTCA标准制定的速度比预期要慢了一年,严重影响了刀片服务器的发展。但AdvancedTCA一旦推出,将促进刀片服务器的腾飞。
煮酒论英雄 ——其他相关技术
内存技术
升级到DDR2
处理器的速度以及前端总线频率决定内存速度的提升需求。随着服务器内存容量以GB为单位向上跃进,降低内存功耗也被提上日程。从目前的服务器芯片组资料看,2003年IA服务器主流产品还将继续使用DDR266/333产品。在Intel的大力推动下,部分IA服务器产品计划在2003年底~2004年初开始采用DDR2内存,达到提速和降低功耗的目的。
DDR2最终能否如期推进,要到2003年第二季度才能初见分晓,因为目前服务器系统厂商正在紧张地验证DDR2的可靠性、兼容性等。如果出现任何技术问题,都将使DDR2的登台时间推迟。
此外还应该重视的是,现在很多系统厂商并不积极推动DDR2系统,不少内存厂商也没做好向DDR2过渡的准备,因为没有足够的市场周期让大家回收在DDR1-400上的投入。因此DDR2在服务器领域的推广还会面临着不少变数,很有可能会延后。
2002年6月,DRAM标准化组织JEDEC开始着手制定DDR3的标准。Samsung已经生产出DDR3 SRAM样品,运行速度为1.5GB/s,预计在2003下半年量产。不过预计DDR3产品的大规模上市要到2005年以后。
推广内存容错技术
2001年本刊报道过以HP为代表的热插拔RAID内存阵列技术、以IBM为代表的内存镜像技术等,2002~2003年初这些技术相继在产品中露面。未来几年IA服务器的内存容错方面预计不会有多少新技术出现,应该是现有新技术的推广阶段。
直接存储技术
作为并行技术向串行技术转换的一个环节,服务器的硬盘接口也有串行化的趋势。做为PC和低端服务器的硬盘接口,串行ATA(即SATA 1.0)已经上路,在2003~2004年将逐步取代现有并行ATA的IDE接口,此后还会有进一步完善的SATA
2.0,但不能满足服务器直连存储的扩展性、可靠性、兼容性要求(见图11)。

图11 SAS发展规划
当前最新的Ultra320 SCSI采用的仍然是并行技术,并且SCSI产品的上游技术供应商大多表示将继续基于并行技术开发Ultra640产品,甚至Ultra1280产品。不过支持串行技术的厂商普遍认为,2005~2006年会是Ultra640与全新的串行SCSI标准SAS(SAS即Serial
Attached SCSI)平行发展的时期,此后会逐渐过渡到串行SCSI。
作为企业运算的直连存储接口标准,SAS继续采用现有SCSI的控制命令集(兼容原有SCSI软件),以可伸缩性和可靠性为设计目标,接口和速率标准与SATA
1.0相同(但是会从300MB/s开始,而不是150MB/s),并借鉴了Fiber Channel的传输方式和交换结构。与并行SCSI相比,SAS接口简化了,并能连接更多的设备(至少128个),能更好适应计算中心的直连存储需求(见表4)。SAS的正式标准预计在2004年中正式推出,并在该年内完成各厂商的互操作性验证测试。
|