3.1 CPU概述
中央处理器在整个计算机系统中居于核心地位,是整个计算机系统的指令中枢。它负责计算机系统指令的执行、逻辑运算以及数据存储、传送和输入/输出操作指令的控制。
CPU由运算器和控制器组成,其中运算器主要完成各种算术运算和逻辑运算;而控制器读取各种指令,分析指令,并做出相应的控制。CPU内部结构可分为控制单元、逻辑单元和存储单元三大部分,其工作原理就像一个工厂对产品的加工过程:进入工厂的原料(指令),经过物资管理部门(控制单元)的调度分配,被送往生产线(算术、逻辑运算单元),生产出成品(处理后的数据)后,再存储在仓库(存储器)中,等着拿到市场上去交易(交由应用程序使用)。
图3-1 各代经典的CPU
CPU从最初发展至今已经有40多年的历史,这期间,CPU发展的种类和型号非常多,各代经典的CPU如图3-1所示。
CPU系列有以下几种类型:
1.Intel系列
自1971年Intel推出了世界上第一款微处理器4004(见图3-2)后,又先后推出了8088、8086、80286(见图3-3)、80386和80486处理器,其性能不断提高,制作工艺也越来越精细;1993年,Intel公司推出了划时代的586,并将其命名为Pentium(奔腾)处理器(见图3-4),随后相继推出了Pentium Pro、Pentium MMX、Pentium II和Pentium III处理器(见图3-5),期间为占领低端市场,还推出了低成本的Celeron(赛扬)系列CPU。
图3-2 处理器4004
图3-3 80286处理器
图3-4 Pentium处理器
图3-5 Pentium II
图3-6 Pentium 4
21世纪初Pentium 4(见图3-6)出现。早期的P4处理器采用Willamette核心和Socket 423封装,具有256KB二级缓存以及400MHz前端总线。由于核心类型和接口类型的改变,又出现Willamette核心和Socket 478封装的entium 4产品。随后,Intel公司不断从核心、前端总线、二级缓存、封装形式等方面逐步改进Pentium 4处理器,使之形成了Pentium 4系列。
自2005年Intel CPU开始步入酷睿时代。Core2 Dou(见图3-7)是英特尔推出的x86架构处理器,最初的酷睿2采用Yonah核心,65nm制造工艺,LGA 775接口,L2缓存容量提升到4MB,并通过Smart Cache技术使两个核心共享二级缓存,使性能大大提升。前端总线提升至1066MHz(Conroe)、1333MHz(Woodcrest)、800MHz(Merom)。另外,SBR(Share Bus Router,共享资源协调器)还具有带宽适应能力,可以对两个核心共享前端总线资源进行统一管理和协调,改善了两个核心共享前端总线的效率,减少了不必要的延迟,有效避免了两个核心之间的冲突。自赛扬处理器问世以来,尽管处理器的内核、封装形式以及规格发生了多次改变,但是Intel始终保持了“赛扬”这种型号,其典型的做法是减少二级缓存和前端总线频率。例如,Celeron 420是酷睿2处理器的改版,其主频为1.6GB,二级缓存为512KB,前端总线800MHz,并采用65nm技术,支持硬件病毒防护功能,但不支持增强型英特尔SpeedStep动态节能技术。赛扬处理器如图3-8所示。
图3-7 Core2 Dou
图3-8 赛扬处理器
图3-9 整合GPU的Core i5处理器
在酷睿2大获成功的基础上,Intel改良了CPU架构,诞生了全新的酷睿i系列处理器。酷睿i首次整合了内存控制器、有的还整合了PCI-E控制器及核心显卡,抛弃了FSB启用高速的QPI总线、加入大容量共享式三级缓存,使处理器性能进一步提高。图3-9所示为整合GPU的Core i5处理器。
目前酷睿i处理器主要分为i3系列、i5系列和i7系列。酷睿i3处理属于最低端的。例如,用于移动平台的酷睿i3处理器主要包括i3-350M、i3-330M,其中规格最低的是酷睿i3-330M,它拥有2.13GB主频,3MB二级缓存,1066MHz总线频率。酷睿i5处理器在酷睿i系列处理器中定位中端,酷睿i5处理器开始支持睿频技术,睿频技术会自动关闭闲置核心,并对工作核心进行超频,从而在功耗不变的同时,提供更好的性能表现。酷睿i7处理器属于最高端的。例如,用于移动平台的酷睿i7处理器主要包括i7-620M、i7-640LM、i7-620LM、i7-640UM、i7-620UMi7有4核8线程和2核4线程两种,支持所有新的技术,如睿频技术、QPI总线技术、超线程技术、智能缓存技术等。
2.AMD系列
AMD(Advanced Micro Devices,超微半导体)是美国一家业务遍及全球,专为电子计算机、通信及电子消费类市场供应各种芯片产品的公司,成立于1969年。AMD系列CPU的特点是以较低的核心时钟频率产生相对较高的运算效率,其主频通常会比同效能的Intel CPU低1GHz左右。AMD早期的产品策略主要是产品以较低廉的价格销售,虽然最高性能不如同期的Intel产品,但却拥有较佳的性价比。随着其技术的不断发展,特别是浮点运算能力方面的提高,逐渐赢得不少DIY用户的欢迎。2003年,由于率先于Intel进入64位CPU的市场,使得AMD在64位CPU领域有比较早的发展优势,此阶段的AMD产品仍采取了一贯的低主频高性能策略,解决了因电气性能有限导致CPU不稳定和发热量、耗电功率过大的问题。
(1)Athlon XP处理器
为了争夺高端处理器市场,对抗Intel的Pentium 4处理器,共AMD推出了新一代处理器Athlon XP。Athlon XP有Palomino、Thoroughbred、Thorton和Barton 4种不同的核心类型,其共同之处是都采用Socket A接口而且都采用PR(性能系数)标称值标注。其中Barton核心采用0.13um制造工艺,核心电压1.65V左右,二级缓存512KB,封装方式采用OPGA,前端总线频率为333MHz和400MHz。Barton核心的Athlon XP处理器如图3-10所示。
Athlon XP处理器具有强大的浮点单元设计和优秀的整数计算单元,相比之下Pentium 4无论是在价格上还是性能上都没有优势可言,测试表明,Pentium 4需要多付出300~400MHz的工作频率才可以获得与Athlon XP相当的性能。因此说“高频率不等于高性能”,也就是不能简单的用处理器的频率来衡量微机性能的高低。所以Athlon XP CPU引进了全新的命名方式“PR标称值”,就是以处理器的效能表现值来命名。例如,Athlon XP 2000+的实际主频为1.67GHz,而其2000+的标称就表示与Pentium 4的2.0GHz相对应。
(2)Athlon 64处理器
2003年,AMD推出高端64位处理器(见图3-11)。最初的Athlon 64采用Clawhammer核心,0.13um制造工艺,mPGA封装方式,核心电压1.5V左右,二级缓存为1MB,并分别推出Socket 754、Socket 940和Socket 939三种接口类型。与以往AMD和Intel所有的处理器核心不同,ClawHammer内置1个128bit的内存控制器,使微处理器可以直接与内存联系在一起,大幅降低内存延迟时间。同时,采用HyperTransport技术的高速系统总线,既可消除或缓解输入/输出的瓶颈,又可提高频宽以减少延迟时间,因此能提高系统的整体效能。除此之外,AMD还推出了另一款64位处理器Athlon 64 FX,FX是高端处理器产品的代号。
图3-10 Barton核心的Athlon XP处理器
图3-11 Athlon 64
AMD的Athlon 64处理器是全球首款64位PC处理器,采用基于x86指令体系的64位架构,也就是x86-64架构。该处理器最大亮点就是支持64bit寻址位宽,并提供良好的向下兼容性——支持32bit。除了采用x86-64架构之外,该系列处理器的还有不少值得称道的改进,如整合支持双通道和单通道的DDR SDRAM内存控制器;采用针对芯片组独立的Hyper-Threading总线连接技术,在Athlon 64系统实现AGP 8x和I/O功能。该系列采用的是Socket 754针脚设计,L2缓存分别有1MB和512KB两个版本。
(3)AMD双核处理器
AMD推出的双核处理器,分别是Opteron(皓龙)系列和全新的Athlon 64 X2系列处理器。其中,双核的Athlon 64 X2的大部分规格、功能与我们熟悉的Athlon 64构架没有任何区别,也就是说,新推出的Athlon 64 X2双核处理器仍然支持1GHz规格的Hypertransport总线,并有支持双通道设置的DDR内存控制器。AMD在双核Athlon 64 X2处理器内部提供了一个称为SQR(系统请求队列)的技术,在工作时,每一个核心都将其请求放在SQR中,获得资源后,请求将会被送往相应的执行核心。所有的处理过程都在CPU核心范围之内完成,并不需要处理器之间的延迟。
2006年,AMD将桌面处理器接口升级成了新的Socket AM2,以提供对DDR2内存的支持,此后为支持HT3.0总线和DDR3内存又相继引入了Socket AM2+和Socket AM3两种接口,3种接口保持了很好的向下兼容性,新接口处理器完全可以在旧接口主板上正常使用,2011年发布的AM3+处理器,同样沿袭了这一特点。但是,唯一的损失就是无法支持新特性,如AM3处理器搭配AM2+主板就只能使用DDR2内存。
近几年来,AMD发布了大量各式各样的桌面处理器,生产工艺从90nm进步到32nm,核心数从1个增加到8个,主频从最低1.6GHz提升到4.0GHz,甚至更高,HT总线单向频率从800MHz提升至2GHz,还增加了越来越大的三级缓存,整体热设计功耗也有明显提升。
3.中国龙芯系列
(1)龙芯1号处理器
2002年9月龙芯1号处理器面世,它是一款既兼顾通用又有嵌入式CPU特点的新一代32位处理器,拥有32位MIPS指令系统,并采用0.18µm CMOS工艺制造,具有良好的低功耗特性,平均功耗0.4W,最大功耗不超过1W,主频最高可达266MHz,已用于国产龙腾服务器中。它还可以运行大量的现有应用软件与开发工具,支持Linux、Windows CE等操作系统。从整体上看该处理器无论是在技术上还是应用性上都具有相当的水平,是我国自主研发出处理器的良好开端。
(2)龙芯2号处理器
龙芯2号在2005年4月推出,是国产首款64位高性能通用CPU芯片。它拥有64位MIPS指令架构系统和先进的四发射超标量超流水结构,片内一级高速缓存达64KB,目前龙芯2号暂时未直接集成二级缓存,但支持片外二级高速缓存可达8MB。龙芯2号仍采用0.18um CMOS标准单元工艺制造,但最高频率可达500MHz,功耗3~5W,远远低于国外同类芯片。龙芯2号支持64位Linux操作系统和X-Window视窗系统,能运行全功能Mozilla浏览器、多媒体播放器和一些办公套件。图3-12所示为龙芯2号处理器。
(3)龙芯3号处理器
龙芯3号的结构特征是多平台并行虚拟机结构,即串行程序在多核上可以并行,并通过进程虚拟机实现Linux上的x86兼容。同时龙芯3号处理器将采用45nm制造工艺,可伸缩大CMP结构。龙芯3号多核处理器系列主要面向服务器和高性能机应用,部分低端龙芯3号也可以面向部分桌面应用。图3-13所示为龙芯3号处理器。
图3-12 龙芯2号处理器
图3-13 龙芯3号处理器
2009年,龙芯3A、龙芯2F3、龙芯2号抗辐照SOC流片成功;龙芯2G和龙芯3A+完成流片;龙芯2H和龙芯3C的设计也开始部署。在全面掌握65nm工艺的产品设计技术后龙芯开始32nm工艺的设计。2010年4月,全线自主化的曙光龙腾刀片服务器成功面世。“中国创造”龙腾刀片服务器产品的诞生,填补了国内全线自主化服务器市场的长期空白。2011年9月19日,曙光公司发布基于国产龙芯3A四核处理器的龙腾机架服务器、存储服务器以及塔式服务器。
4.VIA系列
VIA(威盛)推出的CPU比较常见的是威盛凌珑。威盛凌珑(VIA Nano™)处理器是威盛x86平台系列第一款64位的超标量处理器,旨在激活传统台式和笔记本式计算机市场,为广为需求计算技术、娱乐和网络连接应用提供了真正优质性能。
威盛系列处理器采用市场领先的节能科技,威盛凌珑处理器系列在同一功耗范围,把性能提高到原来的4倍,从而进一步提升了其每瓦性能值的领导地位。而与C7系列处理器相同的针脚兼容保证了OEM和主板商能更平顺地实现两者的转换,另外,也让现有系统和主板升级更易行。威盛凌珑处理器采用先进的65nm处理器技术,实现了高性能和低功耗完美的融合。它进一步巩固了威盛在处理器小型化的领导地位,通过超密集设计,实现了x86平台新一代更小型化设计和应用。
VIA的CPU以低功耗、少发热量和低价格而著称,即使CPU不加风扇冷却,也可以工作得很稳定。因此VIA的CPU在笔记本式计算机中很多见。