1.CPU的生产过程
在CPU发展的30多年来,CPU的制造工艺技术也得到长足的发展。CPU是由数百万只在显微镜下才看得见的晶体管组成的,并经过照相平版印刷技术最终蚀刻在一块磨光了的、只有大拇指甲盖大小的硅片上,并且还在不断地缩小。CPU的生产过程可以简单地归纳成以下几个步骤。
第一步:切晶圆。
第二步:影印(Photolithography)。
第三步:蚀刻(Etching)。
第四步:分层。
第五步:离子注入(IonImplantation)。
第六步:不断重复以上过程。
2. CPU的基本组成
CPU中的晶体管用来存储表示0或者1的电荷,构成了计算机的二进制语言。成组的晶体管连在一起存储这些数据就能完成各种各样的运算任务,并且借助于一个石英的晶体钟来协调行动,使其任务一致和同步。这就是计算机内时钟的用途。
存储器中的信息可以是数据,也可以是指令。对于由最简单的信息构成的数据,CPU只需要四个部分来实现对数据的操作:指令、指令指示器、寄存器、算术逻辑单元,另外CPU还包括一些协助基本单元完成工作的附加单元等,如表2-1所示。
基本组成单元部分 |
用 途 |
指令 |
指示CPU处理数据 |
指令指示器 |
告诉CPU它所需要的指令放在内存中的哪个位置 |
寄存器 |
CPU内部的临时存储单元,保存等待处理的数据或是已经处理过的数据(如把两个数相加后的结果) |
ALU(算术逻辑单元) |
CPU的运算器,执行指令所指示的数学和逻辑运算 |
取指器 |
从RAM或者CPU上的存储区取出指令 |
解码器 |
从取指器中取出指令,把它翻译成CPU所能使用的计算机语言,并确定完成该指令所需要的步骤 |
控制器 |
管理和控制CPU的所有操作,如告诉ALU什么时候开始计算,取指器什么时候取一个0、1值,以及解码器什么时候把该值翻译成一条指令 |
FPU(浮点运算单元) |
处理非常大的数和非常小的数 |
ALU及FPU是CPU中不可缺少的组成部分。为提高运算能力,在CPU内部增设了额外的ALU,希望增加一倍的处理能力,并另外增加了FPU。FPU能够处理范围非常大的数。对于计算机来说,若没有这两个部件,完成图形图像、动态模拟等工作就非常困难。
为提高CPU与L2 Cache(二级高速缓存)间的数据交换速度,Intel从Pentium Pro起将原来设置在计算机主板上的高速缓存控制电路和L2 Cache集成到CPU芯片上。这样CPU内核与高速缓存之间的数据交换就不再经过外部总线而直接通过CPU内部的缓存总线进行,使CPU内核与内存、CPU与高速缓存之间的数据交换通道分离,形成了双总线架构模式。
二、CPU的主要技术指标
1.CPU的工作电压
工作电压是指CPU正常工作时所需的电压。工作电压越高,CPU的发热量越大,工作越不稳定,甚至会造成死机或烧坏CPU。早期386、486的工作电压一般为5V,Pentium的工作电压是3.5V、3.3V、2.8V、1.6V等。随着CPU的制造工艺与主频的提高,CPU的工作电压还在逐步下降。低电压的CPU的芯片总功耗降低了,使得系统的运行成本就相应降低,这对于便携式和移动系统来说,可以让电池工作更长的时间,也使电池的使用寿命大大延长。功耗降低还可使发热量减少,让CPU与系统配合更好。可以说降低电压是CPU主频提高的重要因素之一。
586系列以后的CPU按工作电压可分为两种,一种是单电压CPU,另外一种则是双电压CPU。单电压CPU有Intel Pentium系列的P54C、AMD-K5及Cyrix的6x86等系列。双电压CPU则有Intel MMX P55C的PentiumⅡ、AMD的K6、Cyrix的6x86及M2等系列。而这些双电压CPU所使用的工作电压则可以被区分成Vcore(内核电压)和Vio(I/O电压)两个部分。
2.CPU的生产工艺
表明CPU性能的参数中常有“工艺技术”一项,如“0.35mm”或“0.25mm”。目前生产CPU主要采用CMOS技术,这种技术生产CPU采用“光刀”加工各种电路和元器件,并采用金属铝沉淀在硅材料上,然后用“光刀”刻成导线连接各元器件。光刻的精度一般用微米表示,精度越高就可在同样体积的硅材料上生产更多的元件,加工出更细的连线,CPU工作主频就可以更高。
3.CPU的位、字节和字长
CPU可以同时处理的二进制数据位数是其最重要的一个品质标志。通常所说的16位机、32位机就是指该微机中的CPU可以同时处理16位、32位的二进制数据。现在的CPU都是64位机。64位微处理器一次可以处理8个字节的信息。
4.CPU的主频、外频和运算速度
(1)主频
CPU的“工作频率”又称“主频”或“内频(InternalClock)”,是CPU内核电路的实际运行频率,现在常用的为2.4GHz左右。从486DX2开始,CPU主频等于外频乘倍频系数(后面介绍)。主频的高低直接影响CPU的运算速度,是衡量CPU性能高低的重要技术参数。
当然CPU的运算速度主要还要看CPU的流水线的各方面的性能指标。主频是CPU性能表现的一个方面,而不代表CPU的整体性能。比如AMD公司采用了更加模糊的命名方式,企图让消费者淡化以主频率计算性能的观念。比如Athlon 3000+,它的频率有可能是2.20GHz,也有可能是2.0GHz。对于CPU的性能还要参考其他主要参数。
(2)外频
在计算机的主板上,以CPU为主,内存和各种外围设备为辅,有许多设备要共同在一起工作。这些设备之间的联络,数据的交换,都必须正确无误、分秒不差。因此,它们必须要有一个固定的时钟来做时间上的校正、协调或者参考。这时钟由主板上的时钟发生器(Clock Generator或Clock Gen.)产生,就是所谓的外频。常见的指标多为133~200MHz。时钟发生器的品牌,大致有ICS、ICWORKS、WinBond等。
由于计算机技术的飞速发展,CPU的速度也不断提升,而和它搭配的内存与外围设备的速度却跟不上,造成彼此速度搭配上明显的差异。为使它们能协调工作,CPU就得放慢脚步,这就限制了CPU的发展。于是制造厂商规定了一个公式,即“外频×倍频=内频”,规定外频即CPU用来与其他外围设备共同工作的速度。外频也称为CPU的外部时钟(External Clock)或总线时钟(BUS Clock)。从486DX2开始,CPU的内核工作频率和外频就不一致了。
将系统时钟倍频后所得到的时钟信号作为CPU的内核工作时钟即CPU主频,例如IntelPentiumⅡ 300、400和500三款CPU的外部时钟皆为100MHz,其差别只是CPU内部倍频系数不同而已。300MHz(内频)=100MHz(外频)×3(倍频)。
(3)倍频系数(ClockMultiplier Factor)
由上面的介绍我们知道,CPU内部真正的工作时钟(主频)是外部时钟(外频)的倍数,这个所谓的“倍数”就是“倍频系数”。倍频系数越高,主频就越高。
(4)前端总线(FSB-FrontSystem Bus)
前端总线是指北桥芯片与CPU间数据传输的总线,是CPU跟外界沟通的惟一通道,处理器必须通过它才能获得数据或将运算结果传送出其他对应设备。前端总线的速度越快,CPU的数据传输就越迅速。前端总线的速度主要用前端总线的频率来衡量,取决于两个因素:一是总线的物理工作频率(即外频),二是有效工作频率(即FSB频率),它直接决定了前端总线的数据传输速度。Intel和AMD采用了不同的技术,Intel处理器的FSB频率跟外频的关系是:FSB频率=外频×4;AMD的则是:FSB频率=外频×2。
通过介绍可以明白外频与前端总线频率的区别:前端总线的速度是指数据传输的速度,外频是CPU与主板之间同步运行的速度,即100MHz外频是指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8Byte/bit=800MB/s。
(5)运算速度及制约主频、外频提高的因素
CPU的运算速度可用MIPS来表示,即“百万指令集每秒”的意思。它取决于主频,一般1.5GHz主频CPU的运算速度为1700MIPS。但计算机的整体运算速度不仅取决于CPU的运算速度,还取决于存储系统、显示系统等设备,这些分系统也需特定频率的时钟信号来规范运行,这样除了CPU主频和系统时钟(外频)外,还有ISA、PCI总线和AGP显示接口的时钟,这些时钟的频率都低于系统时钟。CPU与各个周边总线、设备就像一个集体,只有相互之间配合协调,才能将整体性能发挥出来。
提高CPU主频和外频可以提高计算机系统的运算速度,但要提高这些指标又有一些制约因素。
首先,提高CPU主频要受到生产工艺的限制。CPU是在半导体硅片上制造的,硅片上的元件之间需要导线进行连接,在高频状态下要求导线越细越短越好,这样才能减小导线分布电容等干扰以保证CPU运算正确,因此CPU的生产工艺很关键,比如0.25mm可以使CPU的主频达到400MHz;0.18mm可以达到700MHz;0.13mm可以达到2GHz;随着工艺技术的提高到90nm、65nm时,CPU的工作主频也就更高。
其次,提高外频受到运行速度较慢的外部器件的制约。计算机外设的发展速度远跟不上CPU的发展速度,比如硬盘,尽管硬盘技术不断更新,但硬盘接口的工作频率远远低于CPU的频率。一旦系统时钟提高过快,硬盘的工作则可能会无法正常进行,为此还提出了“分频”的概念。
分频技术是通过主板的北桥芯片将CPU外频降低,然后再提供给各板卡、硬盘等设备。
用外频除以分频系数,便能得到PCI等外设的工作频率。在主板的外频变化时,PCI等外设的工作频率能够固定在标准频率。早期的外频为66MHz时是PCI设备1:2分频,AGP设备不分频;后来的外频为100MHz时是PCI设备1:3分频,AGP设备2:3分频(有些100MHz的北桥芯片也支持PCI设备1:4分频);目前的北桥芯片一般都支持133MHz外频,即PCI设备1:4分频、AGP设备1:2分频;在CPU外频高达200MHz,支持六分频的主板,即200除以6,就可得到PCI的标准频率33MHz。
总之,在标准外频(66MHz、100MHz、133MHz、200MHz)下,北桥芯片通过分频技术使PCI设备工作在33MHz,AGP设备工作在66MHz。外频改变的同时也改变了PCI等扩展总线的时钟频率,必然影响这些接口上的外部设备的运行状态,这也是制约提高系统时钟频率的一个因素。
三、 CPU的缓存
L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。
L2 Cache(二级缓存)是CPU的第二层高速缓存,设置L2Cache的目的是弥补L1 Cache(一级高速缓存)容量的不足,以最大程度地减小内存对CPU运行造成的延缓。
L3 Cache(三级缓存)早期是外置集成在主板上的,现在都是内置了。而它的实际作用是进一步降低内存延迟,同时提升大数据量计算时处理器的性能。
四、 CPU的超频技术简介
1.什么是超频
超频就是通过提高CPU的外频或者倍频的方法来提高系统的数据传输量和运算速度,进而全面提高计算机系统的整体性能。通过超频可在不增加任何投资的情况下,实现系统升级,提高系统性能。
2.如何超频
超频首先可从提高外频开始,采用的方法是逐一往上调。调的方法也有两种:
一种是对照主板说明书,在关机的情况下调整主板上的跳线或DIP开关,调整到所需的频率后重新开机,看计算机能否正常启动并稳定运行。
另外一种方法是通过BIOS设置更改CPU倍频或外频。
超频损害了CPU生产商的利益,Intel对其多数CPU产品进行了“锁频”技术处理,即采用固定倍频系数的方法限制用户对CPU超频。这样一来,超频者只有调整外频一种办法了,然后CPU的,如果CPU超频后系统不稳定,就可以适当调高CPU工作电压。但是加电压的副作用很大,首先CPU发热量会增大,其次电压加得过高很容易烧毁CPU,所以加电压时一定要慎重,一般以0.025V、0.05V或者0.1V步进向上加就可以了。而多数AMD的倍频都没有锁定,可以通过修改倍频的方法来进行超频。
采用提高CPU倍频系数的方法进行超频时,超频能否成功仅取决CPU本身的性能和质量;而采用提高系统时钟方法对已经“锁频”的CPU进行超频时,超频能否成功则不光取决于CPU的性能和质量,还取决于系统内存、硬盘和显示卡等部件的性能和质量。因为外频提高后,CPU内部的L2 Cache的工作频率也相应被提高,L2 Cache的访问速度有一定限制,当系统时钟频率提高到一定程度,L2 Cache就可能无法正常工作。所以在对CPU进行超频运行时必须要考虑到这些因素,适可而止。
3.超频后有可能出现的问题和解决方法
CPU的工作状态是由输入CPU的电压决定的。输入CPU的电压波形一般呈梯形,假设在波峰和波谷之间存在一个点,在这点之上(即电压高)和之下(即电压低)CPU内部分别处于High和Low状态,达到这两种状态后分别需要稳定地保持一定时间,CPU才能正常工作。而将频率提高后,电压上升和下降所需的时间不变,而处于波峰和波谷稳定状态的时间被缩短了,最终导致CPU无法正确区分High和Low的状态。这就是超频后计算机工作不稳定的根本原因。
最常用的解决方法是提升输入电压,但会产生一系列新的问题。首先电路本身并不是为高电压的环境所设计,无节制地提高工作电压最终会使电路无法工作,甚至有可能破坏精密的晶体管。通常,CPU的许可工作电压比额定电压高0.1V左右,过多提升电压会缩短CPU的寿命,所以,只能往上升一点点。其次,随着CPU工作电压的升高,发热量会增大,散热不好也会造成CPU工作不正常
若想超频,选购CPU时应注意选择实力强的厂商及超频空间较大的产品。另外,还要选择稳定的主板,布局结构要合理,有利于散热,北桥芯片上应该有散热片,以增强系统的稳定性,并有较多可供选择的外频等。
另外当CPU超频在非标准外频时,硬盘、显卡及其他PCI设备同样处于超标准的频率下,长期使用会给这些配件带来一定影响。因此,硬盘、内存、显卡及其他PCI设备在高频下的稳定性同样决定了超频能否成功,应该购买质量较好的名牌产品。
五、 CPU主要技术术语浅析
1.流水线技术和超流水线技术
流水线(Pipeline)是Intel公司在486芯片中开始使用的。在CPU中由取指令、译码、产生地址、执行指令和数据写回等5~6个不同功能的电路单元组成一条指令处理流水线。一条x86指令可分成5~6步,由这些电路单元同时执行,这样在一个CPU时钟周期就能完成一条指令,以提高CPU的运算速度。
CPU流水线长度越长,不同功能的电路单元越多,运算工作就越简单,处理器的工作频率就越高。CPU的流水线长度很大程度上决定了CPU所能达到的最高频率,于是就有了现在的超流水线技术,例如Intel的Willamette和Northwood核心的流水线长度为20步,Prescott核心的Pentium 4流水线长度为30步,而AMD的Clawhammer K8流水线长度为11步。
2.超标量技术和超线程技术
超标量(Superscalar)是指在CPU中有一条以上的流水线,并且每时钟周期内可以完成一条以上的指令,这种设计就叫超标量技术。
超线程(Hyper-Threading,HT)是一种同步多线程执行技术,采用此技术的CPU内部集成了两个逻辑处理器单元,相当于两个处理器实体,可以同时处理两个独立的线程。通俗说就,是让单个CPU能作为两个CPU使用,从而达到加快运算速度的目的。
3.指令特殊扩展技术
CPU在基本功能方面的差别并不太大,基本的指令集也都差不多,但是许多厂家为了提升某一方面性能,又开发了扩展指令集,扩展指令集定义了新的数据和指令,能够大大提高某方面数据处理能力,但必需要有软件支持。CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。
MMX是Muti Media Extended(多媒体指令集)的缩写,是Intel公司于1996年推出的一项多媒体指令增强技术,共有57条指令,主要用于增强CPU对多媒体信息的处理,提高CPU处理3D图形、视频和音频信息能力。但由于只对整数运算进行了优化而没有加强浮点方面的运算能力。
SSE是Internet StreamingSIMDExtensions(因特网数据流单指令序列扩展)的缩写,共有70条指令,涵括了MMX和3D Now!指令集中的绝大部分功能,特别加强了SIMD浮点处理能力,改善了内存的使用效率,使其速度更快。首次被应用于PentiumⅢ中。随后的SSE2包含有144条命令,SSE3包含有13条命令。SSE3是目前最先进、规模最小的指令集,Intel Prescott处理器支持SSE3指令集,AMD在双核心处理器当中加入对SSE3指令集的支持,全美达的处理器也将支持这一指令集。
SSE4指令集是在Intel Core2处理器中率先推出的。从IntelCore微架构针对SSE指令所作出的修改被称为“Intel Advanced Digital Media Boost”技术来看,SSE4将更注重针对视频方面的优化。
4.多核心
多核心,也指单芯片多处理器(Chipmultiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较,SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。
5.Core微架构技术
Core微架构拥有双核心、64bit指令集、4发射的超标量体系结构和乱序执行机制等技术,使用65nm制造工艺生产,支持36bit的物理寻址和48bit的虚拟内存寻址,支持包括SSE4在内的Intel所有扩展指令集。而且它采取共享式二级缓存设计,2个核心共享4MB或2MB的二级缓存是。真正的双核。
基于Core核心的Conroe处理器的流水线从Prescott核心的31级缩短为14级,Core还采用改进后的分支预测设计,这使它拥有更优秀的分支预测能力,避免了流水线周期的浪费。
Core微架构的最大变化之一,是采用了四组指令编译器,即四组解码单元。这四组解码单元由三组简单解码单元(Simple Decoder)与一组复杂解码单元 (ComplexDecoder)组成。Core采用微指令融合技术,可以减少微指令的数目,这相当于在同样的时间 内,它能实际处理更多的指令,显著提高了处理效能。而且,减少微指令的数目还能降低处理器的功耗。
Core微架构采用大容量的共享式二级缓存。这种设计不仅减少了缓存访问延迟,提高了缓存的利用率,而且还可以使单个核心享用完全的4MB缓存。
Core微架构提供内存数据依存性预测功能,可在处理器将数据回存内存的同时,预测后继的加载指令是否采用相同的内存地址,并将未采用相同内存地址的后继指令加载到指定位置。而增强的“预先加载机制”可根据应用程序数据的行为,进行指令与数据的预先抓取动作,让所需要的内存地址数据,尽量存放在缓存中,减少读取内存的次数。这些大大改善了内存读取效率,缩短了内存存取的延迟。
Core微架构具有智能电源管理能力(IntelligentPower Capability),在处理器内各功能单元并非随时保持启动状态,而是根据预测机制,仅启动需要的功能单元。在Core微架构上,新采用的分离式总线(Split Buses)、数字热感应器(Digital Thermal Sensor)以及平台环境控制接口(Platform Environment Control Interface)等技术将带来明显的省电效果,这将大大降低功耗。
在2008和2010年还会有Nehalem和Gesher等新的“微架构”问世。