作为电脑的核心器件:处理器,在去年除了频率的有限提升,并没有划时代的产品的出现。但是Intel提出的一些处理器发展新动向却令人瞩目,将对今后电脑发展产生重大影响。
首先是将“双核心”技术被确立为今后提升CPU性能的重点。其次在未来一年内,Intel会终止Tejas等下一代NetBurst架构处理器的开发计划,转而将目前的移动平台Pentium-M作为未来桌面平台的核心架构,在65nm生产工艺的支持下,构造一个性能强、功耗低、成本适中的桌面处理器平台,这完全颠覆了过去二十年中个人电脑处理器发展的一贯模式。
一、双核心处理器技术
CPU是决定电脑性能的核心部件,而CPU性能与工作频率密切相关。英特尔从P4开始采用增加管线长度的方法来提升工作频率,但前进至3 GHz以上后,遭遇到因漏电流问题导致产生大量废热,限制芯片频率提升的瓶颈,通过增加管线长度来提升工作频率的技术已经走到尽头。使用多个处理器来提高电脑计算能力是很容易想到的解决方案,也在服务器领域得到了广泛应用。
不过由于组建双CPU系统的高成本和复杂性,桌面电脑上并未得到普及。在CPU频率提升遇到困难和双CPU系统难以普及的情况下,Intel推出了在单颗CPU内部模拟两个虚拟逻辑处理器的超线程技术,然而该技术带来的性能提升并不明显,因为只使用了一套执行单元和缓存,在某些情况下,甚至导致性能反而下降。目前长期引领处理器性能发展的“摩尔定律”已经受到挑战,人们发现处理器频率提升的步伐明显放慢,而从提高处理器工作效率入手来提高性能的“基辛格规则”今后必将取代“摩尔定律”。
真正解决CPU性能提升困难的方法是采用“双核心”技术。顾名思义,就是在一颗CPU中真正集成两个物理运行核心,并且每个核心都使用自己独立的高速缓存,因此在实际使用中,这种“双核心处理器”和使用两颗独立CPU组建的系统在工作原理和性能上基本没有区别。
在双内核处理器当中,每个内核都有独立的HyperTransport总线连接系统请求单元(SRQ)和系统内存,能在一个时钟周期之内处理两倍以上的数据,管理一个以上的线程,这种技术使得整个系统性能有相当大的提高,而整体设计难度和制造成本并不高,从而能够在普通桌面系统中得到普及。
双核心处理器将带来的性能提升是毋庸置疑的,尤其对那些用电脑进行视频文件处理工作的朋友特别有益。即使你使用的视频处理软件不支持双核心处理器,但仍可以发挥其善于同时进行多任务的特长,让视频软件利用一个CPU核心在后台运行长时间才能完成的视频文件处理任务,你却可在前台利用另一个CPU核心同时运行其它程序,而且不影响后台的文件处理运算,大大提高工作效率。
目前双核心处理器已经有不少实际的产品推出,象IBM Power4处理器, Sun的UltraSparc IV也采用了双核心设计。预计从明年开始,各厂商将争相发布相关产品。英特尔将在2005推出的首款桌面电脑用双核心处理器:“Smithfield”,更令我们关注。而代号为“Tanglewood”的高端Itanium芯片将包含多达16个独立的处理器。
继Intel、AMD之后,VIA也确认将进军双内核处理器市场,看来64bit运算和双内核将是今后处理器发展的两大趋势。VIA双内核处理器预计将在明年六月前推出,按照这个计划,VIA很可能将成为第一个发布双内核x86处理器的公司。VIA双内核处理器的特点在于体积小巧而且耗电较低,两块处理器可以安装在一块小的Mini-ITX主板上,这样客户可以选择包括两个Mini-ITX主板,总共4个双内核处理器在1U服务器上使用。VIA的双内核处理器包含了两个芯片,每个芯片内都封装了一个Esther处理器。相比而言,AMD和Intel的双内核处理器是在一个单独的芯片内集成两个内核。VIA也计划发布单独的双内核芯片,但是该产品估计不会在短期内上市。
二、新型材料技术的应用
在半导体制造业发展的几十年中,硅原料本身的自然属性一直没有对芯片运行速度的提高产生任何阻碍作用。但是,随着芯片制造技术的不断改进,硅原料自身的一些不足之处逐渐成为了芯片运行速度进一步提高的绊脚石,著名的“摩尔定律”一次次受到挑战。为此涌现出很多新技术用来改进这种状况,但是许多年来,制作芯片的硅衬底本身在本质特性上并未发生任何变化。
目前在一些实验中采用了单一同位素硅(100%的硅28)做原料,大大改善了芯片的发热和能耗问题。尽管这种纯同位素材料与现在的混和同位素材料相比能够带来很高的性能提升,但是其高昂的制造成本也使得该材料被大规模使用的可能性极小。目前在大规模量产中真正可行的改进方案就是应变硅技术。
所谓“应变硅”(Strained Silicon),字面上意思是“受到应力的硅”。该技术的原理是将硅的晶体拉伸,这样沿拉伸方向电子的迁移率就会提升,导致电阻减小。在MOS管的栅极下沟道处的硅做成拉伸的“应变硅”,当MOS管打开的时候电流就会更顺利地沿着拉伸方向在源极和漏极之间流动,速度也能更快。这样,当MOS管工作时,主要电流还是通过沟道,向衬底分散的漏电流就会相应减少,而且MOS管与衬底间的寄生三极管能获得的驱动电流也相应减小,这样就减少了发生“闩锁”效应的可能。
简单说,如果能够迫使硅原子的间距加大,就可以减小电子通行所受到的阻碍,也就相当于减小了电阻,这样一来发热量和能耗都会降低,而运行速度则得以提升。而实现该技术的关键是找到一种成本相对较低,可大规模应用的方法来加大硅原子距。根据硅的自然特性,在添加了相似元素的原子后,晶体结构会发生线性扩张。据此研究人员开发出了的改进的半导体材料:硅锗,硅锗的晶体矩阵与纯硅的相比,原子间距有了明显的扩张,因而这种材料就称作“应变硅”。
目前Intel在其最新版本的P4和Dothan处理器中使用了这项技术。此外AMD也将在其90纳米的Athlon 64产品上使用应变硅制造工艺。应变硅技术的应用在cpu制造工艺中是一个不小的进步,而且其生产成本也并不是很高,预计今后大多数处理器都将广泛使用应变硅技术,能够让速度继续得以提升。
除了“应变硅”技术外,还涌现出一系列的制程技术用来改进处理器速度提升的瓶颈,包括铜互连(copper interconnects)技术,低介电薄膜(low-k dielectrics)技术和硅晶绝缘体(silicon on insulator,SOI)技术等。其中铜互连技术用于提高速度,而另外两项技术主要用于控制电能泄漏和减少电能需求,由于更有效的利用了电能,从而降低了芯片的发热量,这也同样有助于运行速度的提升。
三、移动处理器的新发展
在过去的一年中,Intel所倡导的“迅驰”移动计算技术无疑取得了巨大成功,以Dothan处理器为核心的第二代“迅驰”又在2004年粉墨登场。 经过一再拖延,五月初Intel终于在全球同步发布了Dothan处理器。
同Banias内核产品相比,Dothan处理器主要有三个方面的变化。首先生产工艺从0.13微米提升到了全新的90纳米。90纳米制程是目前业界最先进的半导体制程工艺,通过90纳米制程,可制造出更小更快的晶体管,因此Dothan内核的Pentium-M在比Banias增加了一倍CACHE的情况下,体积和耗电基本保持不变。
其次,Dothan采用了新的“应变硅”材料技术。据Intel测试,应变硅中的电子流动速度比当前的其他硅材料的电子快很多。其电子流动速度的加快,直接使Dothan的主频得到了很大提升。此外,Dothan二级缓存从老版Pentium-M的1MB,提升到惊人的2MB,甚至超过了很多服务器处理器。二级缓存容量的提升,直接提升了产品性能,在保持能耗大致相同的情况下,相对于原先的Banias Pentium-M处理器的性能提升了20%左右。
降低能耗是移动计算的重要要求之一,一款移动处理器是否能取得成功,其耗电高低非常重要。Dothan CPU从多方面来达到节能降耗的目的。首先0.09微米的先进生产工艺确保了Dothan处理器在性能提升的同时功耗不会有太大的增加。Dothan的平均功耗大约只有21W,相对于Banias内核的24.5W而言更低,而核心电压也降低至1.2V以下。
其次,具有“智能型线路”的二级缓存可以有效降低功耗。Dothan CPU芯片的二级缓存采用了8路联合的运行模式,而每路又被分割成为4个功耗区域,由于在处理器工作过程中同一时间只能使用其中的一个功耗区域,所以在专用的堆栈管理技术控制下关闭当前不能被使用到的功耗区域,从而大大降低了二级缓存的功耗。
Dothan CPU的 二级缓存达到了惊人的2M,采用这一技术就更加重要了。除此之外Dothan CPU支持新的Enhanced SpeedStep节能技术,该技术较原有的SpeedStep有了很大的进步。这一技术完全由处理器的电压调整机制来完成,而与芯片组关系不大。在这些模式间切换的操作,全部是自动的,完全根据处理器当时的负荷,这样就会使能耗情况得到精确的控制,达到更加节能的目的
由于Banias处理器的巨大成功,Dothan在移动处理器领域更是一骑绝尘,几乎不存在直接的竞争对手。唯一能分得一杯羹的是最新的Crusoe处理器,这款产品最大特色是采用了21×21mm小型封装 ,比Dothan少了将近一半的面积。另外在功耗上也具有一定的优势,这在超小设备中绝对重要。因此最近引人关注的几款“微型PC”象FlipStart、OQO等,都不约而同采用了小型封装的Crusoe处理器。
四、CPU未来微结构简介
微电脑处理器芯片业走过了30多年的路程,基本上都是按照著名的“摩尔定律”在发展。但随着芯片集成度越来越高、工作频率和计算速度越来越快,芯片的功耗、封装、蚀刻等问题越来越难以处理。如果按照传统技术继续发展芯片业,摩尔定律势必走向终结。为使“摩尔定律”能延续,面对新的形势,世界主要芯片厂商纷纷制定长远发展计划,研究新的策略和技术手段,以保持发展势头。
其中主要有光连接技术、碳纳米管技术、“双门”、“三门”技术、超微晶体管技术以及3D芯片技术等。此外,性能更优越的拉伸硅和金属镍等新材料也将取代传统的硅。同时新型微处理器体系结构也浮出了水面,这些都为“摩尔定律”的延续打下了基础。
为进一步提升处理器性能,目前还有很多处理器的微结构被提出,其中一些技术已经被目前的产品所采用,而另一些技术还在开发或完善之中。
多路超标量结构,采用16/32路超标量结构,其关键特性是处理器设置了2000多条指令的超大指令窗口,以便从中选择足够多的不相关指令来实现动态调度。
超推测和Trace结构,采用超推测结构的处理器可以消除指令串行化的约束,使得程序性能突破数据相关的限制。而所谓“Trace”结构是从任何点开始的动态指令流的一个指令序列,它可以覆盖几个基本块。
单芯片多处理器结构(CMP),随着制造工艺发展,芯片容量足够大时,就可以将大规模并行处理机结构中的SMP(对称多处理机)或DSM(分布共享处理机)节点集成到同一芯片内,各个处理器并行执行不同的线程或进程。与之对应的还有同时多线程结构(SMT)。
PIM结构,为解决处理器速度和DRAM访问延迟差距不断增大的问题,将一个或多个处理器与大容量、高带宽的片上DRAM存储体集成在一起,从而大大缩短了访存延迟,提高了数据带宽。此外还有可重构多处理器结构,将大量的可重配置的处理单元集成在同一芯片内,根据应用的不同,对处理器阵列进行重新配置,以达到更高的性能。
未来十多年,总体来看,新结构、新工艺和新材料的采用将使单个芯片上可集成的晶体管数达到10亿个以上,而芯片的制作工艺水平小于30纳米,时频达到10GHz以上,单片性能可达到每秒万亿次以上。此外生物芯片、全息光学芯片等更新的技术也将在未来十年得到实质性的发展。
五、主要厂商的微处理器发展计划
随着64位处理器时代的来临,Intel特别制定了IA64处理器的发展蓝图,将采用多种方法提升其高端处理器“安腾”的性能,这些方法包括提高时钟频率、加入额外的处理内核、改善总体架构效率,以及提升L1、L2、L3高速缓存容量和速度等。今年,Intel将发售带有9MB L3 Cache代号Madison 9M的处理器,主频为1.5GHz。
2005年后,Montecito将可能使用65nm技术制造,采用双内核,也就是带有巨大的18MB L3 Cache。到2007年,Intel将推出全新的代号为“Tanglewood”的处理器,这是一种集成了16个内核的超级CPU,它将带有海量的缓存和更高的主频,而功耗不会高于目前的安腾2芯片,这将使服务器设计无需采用水冷等特殊散热措施。
当然Intel对IA32结构处理器的研发力度也不会缩减,未来产品将全面采用超线程和多核心技术,新的微结构逐步运用到普通桌面产品上;高速缓存容量和时钟频率将不断攀升。而另一个发展方向是为移动计算开发出,性能适中,但体积更小、更加省电的移动处理器。
Sun公司在去年公布了“吞吐量计算”计划,来作为Sun下一代UltraSPARC处理器的基底策略,目标是建立能够为网络运算负荷提供最大执行能力的处理器,它在处理器的设计上采用崭新的方法,在显著提升实际应用效能的同时协助降低网络运算的成本和复杂性,预期到2006年,系统性能可望在现在基础上提高30倍。
而IBM将在在新款Power4采用CMP技术(一个硅片上集成两个64位超标量微处理器核心)的基础上,进一步采用“Multi-chip Module(MCM)”封装方式,将4个Power4组合成一个较大的封装,类似一个8个CPU的SMP系统。随后IBM将推出Power5芯片。
Power5除采用更新的制造工艺外,还具有SMT能力。这样,Power5将同时采用CMP和SMT,可以在单颗CPU上,获得最多16个处理器的运算能力。当然AMD、VIA、Transmeta等处理器厂商也有各自宏大的发展计划,这里就不一一叙述了。