不同微处理器结构的比较研究
学生姓名
学号:
学生姓名
学号:学生姓名学号:系 部: 自动化
自动化 专
二零一四年九月
不同微处理器结构的比较研究
摘 要:微处理器是微型计算机的核心,从最初发展至今已经有很多年的历史了,这期间,按照其处理信息的字长,可以分为:4位微处理器、8位微处理器、16位微处理器、32位微处理器以及64位微处理器,可以说个人电脑的发展是随着CPU的发展而前进的。近年来微处理器不断发展,人们对它的需求越来越多,对于其功能的要求也越来越高,这就不断推进着微处理器技术上的创新和完善。我们通过比较几种典型的微处理器即Intel系列里的8086,80386以及Pentium的内部结构,了解其功能还有它们的优缺点,对于以后的学习和研究大有益处。
关键词:8086;80385;Pentium;结构
目录
1 前言„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„ 3
2 8086微处理器内部结构分析„„„„„„„„„„„„„„„„„„„„4
2.1 8086简介 „„„„„„„„„„„„„„„„„„„„„„„„„„4
2.2 8086CPU的内部功能结构„„„„„„„„„„„„„„„„„„„„5 2.3 8086CPU的寄存器结构„„„„„„„„„„„„„„„„„„„„„6
2.4 存储器及I/O端口的组织与管理„„„„„„„„„„„„„„„„„8
3 Pentium微处理器内部结构分析„„„„„„„„„„„„„„„„„„8
3.1 Pentium的三种指令处理部件„„„„„„„„„„„„„„„„„„8
3.2指令CACHE和数据CACHE„„„„„„„„„„„„„„„„„„„„8
3.3 Pentium的指令预取缓冲器和转移目标缓冲器„„„„„„„„„„„9
3.4 Pentium的总线设置„„„„„„„„„„„„„„„„„„„„„„9
3.5 Pentium在片CACHE的复写方式„„„„„„„„„„„„„„„„„9
4、80386微处理器内部结构分析„„„„„„„„„„„„„„„„„„9
4.1总线接口部件„„„„„„„„„„„„„„„„„„„„„„„„9
4.2 中央处理部件„„„„„„„„„„„„„„„„„„„„„„„„9
4.3存储器管理部件„„„„„„„„„„„„„„„„„„„„„„„„10
5、三种微处理器的结构比较„„„„„„„„„„„„„„„„„„„„10
5.1 80386与8086内部结构的比较„„„„„„„„„„„„„„„„„„11
5.2 80386和Pentium的内部结构比较„„„„„„„„„„„„„„„„11
6、结论„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„13
参考文献„„„„„„„„„„„„„„„„„„„„„„„„„„„„„13
1、前言 自从人类1947年发明晶体管以来,50多年间半导体技术经历了硅晶体管、集成电路、超大规模集成电路、甚大规模集成电路等几代,发展速度之快是其他产业所没有的。半导体技术对整个社会产生了广泛的影响,因此被称为“产业的种子”。中央处理器是指计算机内部对数据进行处理并对处理过程进行控制的部件,伴随着大规模集成电路技术的迅速发展,芯片集成密度越来越高,CPU可以集成在一个半导体芯片上,这种具有中央处理器功能的大规模集成电路器件,被统称为“微处理器”。
在学习《微型计算机原理与控制技术》这本书的同时,为了更加熟悉的掌握微处理器的结构,了解微处理器的发展以及技术上的革新,我们以“不同微处理器结构的比较研究”为论题撰写了这篇论文,并主要参考了《微机原理与接口技术》第二章、《Intel32位微处理器80386—新一代高性能微处理器的代表》、《Intel80386微处理器结构概述》、《Pentium微处理器结构分析与技术特点》、《第五代微处理器-Intel Pentium》等文献,对Intel 8086、Intel 80386以及Intel Pentium进行了结构分析和比较研究。论文的第一部分主要介绍了8086的CPU内部功能结构、寄存器结构、存储器以及I/O端口的组织与管理;第二部分主要介绍了Pentium的结构、三种指令处理部件和总线设置;第三部分主要介绍了80386的总线接口部件、中央处理部件,存储器管理部件;第四部分主要是对这三种微处理器结构进行比较研究;第五部分主要是整篇论文的结论。
在参考文献方面,我们主要是从期刊杂志、书本上收集有关Intel系列微处理器的资料(主要是Intel 第一代到第五代的资料)。收集这些资料一方面可以让自己多了解一些有关微处理器的知识;另一方面是资料比较权威,不易出现过大的错误,使研究更具可靠性。这些资料为我们的研究提供了很大的理论支持。
这篇论文整体结构清晰,层次分明,内容丰富,循序渐进,并注重介绍了各个类型微处理器的结构及比较,在论文中还特别绘制了部分插图以方便理解和阅读。这篇论文是我组人员共同的成果,论文中可能会存在一定的疏漏和错误,殷切希望读者能够批评指正。
2、 8086微处理器内部结构分析
2.1 8086简介
Intel8086CPU是Intel公司推出的第三代微处理器芯片,,是Intel系列典型的16位或准16位微处理器,它采用HMOS工艺制造,双列直插,有40个引脚。 8086微处理器是以8080和8085的设计为基础,拥有类似的寄存器组,但是数据总线扩充为16位。总线界面单元透过6字节预存的队列喂指令给执行单元,所以取指令和执行是同步的,8086CPU有20条地址线,可直接寻址1MB的存储空间,每一个存储单元可以存放一个字节(8位)二进制信息。
8086微处理器拥有四个16位的通用寄存器,也能够当作八个8位寄存器来存取,以及四个16位索引寄存器(包含了堆栈指标)。资料寄存器通常由指令隐含地使用,针对暂存值需要复杂的寄存器配置。它提供64K8位元的输出输入(或32K16位元),以及固定的向量中断。大部分的指令只能够存取一个内存位址,所以其中一个操作数必须是一个寄存器。运算结果会储存在操作数中的一个寄存器。
Intel8086有四个内存区段寄存器,可以从索引寄存器来设定。区段寄存器可以让CPU利用特殊的方式存取1MB内存。8086把段地址左移4位然后把它加上偏移地址。大部分的人都认为这是一个很不好的设计,因为这样的结果是会让各分段有重叠。尽管这样对组合语言而言大部分被接受(也甚至有用),可以完全地控制分段,,使在编程中使用指针(如C编程语言)变得困难。它导致指针的高效率表示变得困难,且有可能产生两个指向同一个地方的指针拥有不同的地址。更坏的是,这种方式产生要让内存扩充到大于1MB的困难。而8086的寻址方式改变让内存扩充较有效率。
8086处理器的时钟频率介于4.77MHz(在原先的IBMPC频率)和10MHz之间。8086没有包含浮点指令部分(FPU),但是可以通过外接数学辅助处理器来增强浮点计算能力。
2.2 8086CPU的内部功能结构
从功能上讲8086分为两部分,即总线接口部件(BIU)和执行部件(EU)。
1、 总线接口部件
总线接口部件BIU是CPU与外部存储器I/O的接口,负责完成CPU与存储器和I/O系统的数据转换。BIU主要由以下部分组成:
(1)4个16位段址寄存器
2.1 8086CPU的内部结构
用于存放各段的段地址基址,16位的寄存器IP控制指令的读取。
CS——16位的代码段寄存器;
DS——16位的数据段寄存器;
ES——16位的扩展段寄存器;
SS——16位的堆栈段寄存器。
(2)20位物理地址加法器
由于内部寄存器是16位的,为了形成20位的物理地址,8086CPU巧妙地利用20位加法器进行了16位/20位的地址转换。
(3)指令队列缓冲器
8086的BIU中包含了6字节的指令队列缓冲器,可以预取6字节的指令代码。
(4)总线控制电路
总线控制电路用于产生并发出总线控制信号,已实现对存储器和I/O端口的读/写控制。同时它将CPU的内部总线与16位的外部总线相连。
2、执行部件
执行部件EU的功能就是指令的执行。EU包括下列部分:
① 算术逻辑单元ALU:ALU完成16位或8位二进制的算术/逻辑运算,绝大部分指令的执行都由ALU完成。
② 通用寄存器组和标志寄存器FR
③ 控制器EU:接收从BIU中指令队列取来的指令,经过指令译码形成各种定时控制信号,向EU内各功能部件发送相应的控制命令,已完成每条指令所规定的操作。
8086CPU在取指令和执行指令过程中,EU和BIU之间采用了流水线方式。
2.3 8086CPU的寄存器结构
8086CPU内部有14个16位寄存器,可分为通用寄存器、控制寄存器、段寄存器组三类。
1、 通用寄存器
(1)数据寄存器组
数据寄存器包括AX、BX、CX、DX共4个16位寄存器,主要用来保存算术、逻辑运算的操作数、中间结果和地址。她们既可以作为16位寄存器使用,也可以将每个寄存器高字节和低字节分开作为两个独立的8位寄存器使用。8位寄存器只能用于存放数据。
其中:
AX: 具有累加功能,可作16位累加器,AL可作为8位累加器。
BX: 在基址变址寻址时作为基址寄存器。
CX: 在循环类与串处理类指令执行时作为默认的计数器寄存器。
DX: 作为数据寄存器使用,在双字运算中存放高16位数据。
(2)指针和变址寄存器组
指针和变址寄存器组包括指针寄存器SP、BP和变址寄存器SI、DI,是不可拆分的16位寄存器。
SP:堆栈指针寄存器,用来指出堆栈的顶部偏移地址。
BP:基地址指针寄存器,在间接寻址时作为基地址寄存器。
SI:源变址寄存器,在间接寻址时作为地址寄存器或变址寄存器。在字符串处理指令中,作为目的变址寄存器。
DI:目的变址寄存器,在间接寻址时作为地址寄存器或变址寄存器。在字符串处理指令中,作为源变址寄存器。
1、段寄存器租
段寄存器组包括4个段寄存器:
CS:代码段寄存器,存放当前代码段的段基址。
SS:堆栈段寄存器,存放当前堆栈段的段基址。
ES:附加段寄存器,存放当前傅家短的段基址。
DS:
数据段寄存器,存放当前数据段的段基址。
2、 控制寄存器
(1)指令指针IP
16位的指令指针寄存器IP,存放代码段中下一条中将要执行指令的偏移地址。执行部件EU每取走一条指令,总线接口部件BIU自动将IP的内容修改为下一条将要执行指令的地址。
3、标志位寄存器FR
它是一个16位的寄存器,用来记录程序中运行结果的状态信息,它们是根据有关指令的运行结果由 CPU 自动设置的。其中9位有定义, 9位中6位表示状态,3位表示控制标志。
2.2 位寄存器
① 状态标志
a.进位标志(CF):运算指令执行之后,若在最高位上产生进位、借位时,该标志位被置1。 具体地说,两个数相加时,最高位(D15或D7)有进位,或当两个数相减时,最高位有借位,进位标志位被置1,即CF=1;否则CF=0。
b.奇偶标志(PF):8086/8088 CPU中采用奇校验,运算指令执行后,运算结果的低8位中含1的位数为偶数时,该标志位被置1,否则被置0。也称为偶标志位。
c.辅助进位标志(AF):运算指令执行后。当两个数相加(减)时,当D3有向D4进(借)位时,该标志位被置1,否则被置0。
d.全零标志(ZF):运算指令执行后,结果的每一位都为零时该标志位被置1。
e.符号标志(SF):在带符号数运算时,如果运算结果最高位为1,表示结果为负值,SF位被置1,否则SF位被置0。SF也称为负标志位。
f.溢出标志(OF):运算指令执行后,结果的数值产生溢出,该标志位被置1,否则被置0。 ② 控制标志
控制标志用来控制CPU的工作方式,用户可以使用指令设置或清除。
a.方向标志(DF):用于字符串指令操作,当DF=0时,字符串处理由低地址向高地址处理;当DF=1时,则从高位地址向低位地址处理。
b.中断允许标志(IF):用来控制可屏蔽硬件中断。当IF=1时8086微处理器可以接受片外来的可屏蔽中断请求,开中断;IF=0时片外来的中断请求被阻止,关中断,也称被屏蔽。
c.单步标志(TF):该标志用来控制单步中断。在TF=1时,以单步方式执行程序。即8086每执行完—条指令就产生处理器内部单步中断。单步执行指令可使程序员跟踪指令的执行过程,进行积序的调试。
2.4 存储器及I/O端口的组织与管理
1、存储器
存储器是按照字节编址的,即一个存储单元存放一个字节的的内容,8086系统字长是16位的,所以当一个字存入存储器时需要占用两个相邻的存储单元,8086CPU约定字的低字节存放在低地址,高字节存放在高地址,字单元的地址采用它的低地址来表示。
存储器可分为逻辑段、段基址和段起始地址。
2、8086I/O组织
8086系统和外部设备之间是通过I/O芯片连接的。每个I/O芯片都设置有一定数目的端口暂存信息,微机系统为每个端口分配一个地址,称为端口号。各个端口地址是唯一的。
8086CPU可以访问64K个8位的I/O端口,两个编号相邻的8位端口可以合为一个16位端口。
3、Pentium微处理器内部结构分析
Pentium微处理器内部结构如图3.1所示。设有三种指令处理部件和16-21Kb的CACHE部件。
3.1 Pentium的三种指令处理部件
Pentium的三种指令处理部件分别是:RISC体系结构型的整数处理部件CPU,i80386兼容处理部件和浮点处理部件。
Pentium的RlSC型整数处理部件是采用超标量技术实现的,它设有两条流水线—U和V流水线。每条流水线都拥于自己的ALU,一个时钟周期可以并行执行两条整数指
图3.1 Pentium内部结构图
令。Pentium双流水线中的每一条分为5个步骤,即指令预取、指令解码、地址生成、指令执行、回写。Pentjum的i80386兼容处理部件负责处理不能用一个时钟周期完成的复杂指令。也就是说,它是利用微程序来处理RISC型整数处理部件无法执行的复杂命令。Pentium的浮点处理部件采用超级流水线技术来实现,其浮点单元在486的基础上进行了彻底的改进,执行过程分为8级流水,每个时钟周期能完成一个浮点操作。浮点单元流水线的前1步与整数流水相同,后4个步骤的前两步为二级浮点操作,后两步为四舍五入及写结果、出错报告。
3.2指令CACHE和数据CACHE
Pentium在微处理器中,设有在片的指令CACHE和数据CACHE。它们的容量各为8Kb,并且可以分别扩充到12Kb,而且可同时被访问。指令和数据分别使用不同的CACHE,使Pentiun的性能大大提高。例如.流水线的第1步为指令预取,在这一步中,指令从指令CACHE中取出来,如果合用一个CACHE,则预取指今和数据操作之间可能发生冲突。两个独立的CACHE可避免冲突并允许两个操作同时进行
3.3 Pentium的指令预取缓冲器和转移目标缓冲器
Pentium中设置了在片白的指令预取缓冲器。它在前一条指令执行结束后,可以预取多达91个字节的指令。为了高速处理转移操作,Pentium中设置了在片的转移日标缓冲器,它含有256
个头目,可以动态地预测程序分支,当一条指令导致程序分支
时,转移目标缓冲器记忆住在这条指令和分支目标的地址,并用这些信息预测这条指令再次产生分支时的路径,预先从此处预取。
3.4 Pentium的总线设置
Pentium的内部总线为32位,通向存贮器的外部数据总线为64位,在一个周期内,将数据传输量增加了一倍。地址总线扩充到36位,这是因为目前IGb大小的物理地址空间已不能满足要求所致。Pentium还支持多种类型的总线周期,其中包括一种突发模式,该种模式下可以在一个总线周期装入256位数据。
3.5 Pentium在片CACHE的复写方式
Pentium微处理器的在片CACHE,采用了“回写方式”。其目的在于适应共享主存贮器多机系统的需求,它有效地抑制了存取总线的使用次数。
4、80386微处理器内部结构分析
80386内部结构由三大部分组成:总线接口部件、中央处理部件和存储器管理部件。
图4.1 80386内部结构图
4.1总线接口部件
总线接口部件负责与存储器和I/O接口传送数据,并产生产生访问存储器和I/O端口所必须的地址和命令信号。由于总线数据传送与总线地址形成可同时进行,所以80386的总线周期只包含2个时钟周期。平常没有其它总线请求时,BIU将自动取出下条指令送到指令预取队列。
4.2 中央处理部件
中央处理部件包括指令预取单元、指令译码单元和执行单元三部分o
指令预取单元负责从存储器取出指令,放到一个16字节的指令队列中。它管理一个线性地址指针和一个段预取界限,负责段预取界限的检验。它把预取总线周期通过分页部件发给总线接口。每当预取队列不满或发生控制转移时,就向BIU发一个取指请求。指令预取的优先级别低于数据传送等总线操作。因此,绝大部分情况下是利用总线空闲时间预取指令。指令预取队列存放着从存储器取出的未经译码的指令。
指令译码单元从指令预取单元之中取出指令,进行译码。译码后的可执行指令放入已译码指令队列中,以备执行部件执行。每当已译码指令队列中有空间时,就从预取队列中取出指令并译码。
执行单元包括8个32位的寄存器组.32位的算术逻辑单元ALU,一个64位桶形移位寄存器和一个乘法除法器。桶形移位器用来有效地实现移位、循环移位和位操作,被广泛地用于乘法及其他操作中。它可以在一个时钟周期内实现64位同时移位,也可对任何一种数据类型移任意位数。桶形移位器与ALU并行操作,可加速乘法、除法、位操作,移位和循环移位操作。
4.3存储器管理部件
存储器管理器部件由分段部件和分页机构组成。分页与分段的原理。
分段部件的作用是应执行部件的请求,把逻辑地址转换成线性地址。在完成地址转换的同时还要执行总线周期的分段合法性检验。该部件可以实现任务之间的隔离,也可以实现指令和数据区的再定位。
分页机构的作用是把由分段部件或代码预取单元产生的线性地址转换成物理地址,并且要检验访问是否与页属性相符合。为了加快线性地址到物理地址的转换速度,80386内设有一个页描述符高速缓冲存储器,其中可以存储32项页描述符,使得在地
址转换期间,大多数情况下不需要到内存中查页目录表和页表。试验证明TLB的命中率可达98%。对于在TLB内没有命中的地址转换,80386设有硬件查表功能,从而缓解了因查表引起的速度下降问题。
5、三种微处理器的结构比较
8086是16位结构微处理器,它是Intel公司的第三代产品。
80386是与8086相兼容的高性能的32位微处理器,是Intel公司的第四代产品,也是第一代32位微处理器。
PentiumCPU是Intel 80x86系列的第五代产品,是与80386保持完全兼容的64位微处理器。
5.1 80386与8086内部结构的比较 (1)80386内部结构由三大部分组成:总线接口部件(BIU)、中央处理部件(CPU)和存储器管理部件(MMU);而8086内部结构分为两部分,即总线接口部件(BIU)和执行部件(EU)。
(2)80386采用全32位结构,其内部寄存器、ALU和操作是32位,数据线和地址线均为32位;而80386采用16位内部结构,16位双向外外部数据总线,20位地址信号线,其内部寄存器、ALU和操作是16位。
(3)80386提供32位外部总线接口,最大数据传输率为32MB/s,具有自动切换数据总线宽度的功能.CPU读写数据的宽度可以在32位到16位之间自由进行切换;而8086提供16位外部总线接口,最大数据传输率为16MB/s。 (4)80386片内集成存储器管理部件MMU,可支持虚拟存储和特权保护,虚拟存储器空间可达64TB(246字节)。存储器按段组织,每段最长4GB,因此64TB虚拟存储空间允许每个任务可拥有多达16384个段。存储保护机构采用四级特权层,可选择片内分页单元。内部具有多任务机构,能快速完成任务的切换。而8086存储器是按照字节编址的,即一个存储单元存放一个字节的的内容,8086系统字长是16位的,所以当一个字存入存储器时需要占用两个相邻的存储单元,8086CPU约定字的低字节存放在低地址,高字节存放在高地址,字单元的地址采用它的低地址来表示。
(5)80386具有三种工作方式:实地址方式、保护方式和虚拟8086方式。实地址方式和虚拟8086方式与8086相同,已有的8088/8086软件不加修改就能在80386的这
两种方式下运行;保护方式可支持虚拟存储、保护和多任务,包括了80286的保护方式功能。
(6)80386采用了比8086更先进的流水线结构,能高效、并行地完成取指、译码、执行和存储管理功能。它具有增强的指令预取队列,指令队列从8086的6字节增加到16字节。
(7)80386采用引脚栅格阵列封装技术,芯片封装在正方形管壳内,管壳每边3排引脚,共132根引脚,其中数据总线32条,地址线32条,时钟频率16MHz 。80386集成了275万个晶体管;而8086采用40个引脚的双列直插封装形式,并使用了引脚复
既能处理16位数据,也能处理8位数据。
(8)80386共有34个寄存器,可分为七类,它们分别是通用寄存器、指令指针和标志寄存器、段寄存器、系统地址寄存器、控制寄存器、调试和测试寄存器;而8086CPU内部有14个16位寄存器,可分为通用寄存器、控制寄存器、段寄存器组三类。80386有8个32位的通用寄存器,这8个通用寄存器都是由8086的相应16位通用寄存器扩展成32位而得,名字分别是:EAX,EBX,ECX,EDX,ESI,EDI,EBP,ESP。每个32位寄存器的低16位可单独使用,与8086的相应16位通用寄存器作用相同。同时,AX、BX、CX、DX寄存器的高、低8位也可分别当作8位寄存器使用。80386的指令指针EIP是一个32位寄存器,是从8086的IP扩充而来。32位标志寄存器中,除保留8088/8086CPU的9个标志外,另新增加了4个标志,即IOPL I/O特权级、NT 嵌套任务、VM 虚拟8086方式和RF 恢复标志。80386有6个段寄存器,分别是CS,DS,SS,ES,FS和GS。前4个段寄存器的名称与8086相同,在实地址方式下使用方式也和8086相同。除此之外,80386又增加了FS与GS,主要为了减轻对DS段和ES段的压力。
5.2 80386和Pentium的内部结构比较
(1)Pentium微处理器内部结构有三种处理部件(即RISC体系结构型的整数处理部件CPU、i80386兼容处理部件、浮点处理部件)和16-21KB的CACHE部件;80386内部结构由三大部分组成:总线接口部件(BIU)、中央处理部件(CPU)(包括预取单元、指令译码单元、执行单元)和存储器管理部件(包括分段部件、分页机构);
(2)Pentium微处理器与80386保持完全兼容,并采用0.8微米的Bi-COMS技术,使芯片集成度达到310万个晶体管。全部引脚被封装在一个大型的237针PGA中。时钟
频率有60MHz、66MHz、75MHz、90MHz、100MHz、120MHz、133MHz、150MHz及166MHz等多种。
(3)Pentium CPU芯片规模比80386芯片大大提高,除了CPU电路外,还集成了16KB的高速缓存和浮点协处理器。它的可寻址的物理地址空间可达64GB。芯片引脚增加到270多条,其中外部数据总线为64位,提高了读写存储器的速度,使得一个总线周期内的数据传输量比80386提高了一倍。Pentium内部总线与80386一样,数据线和地址线宽度都是32位。Pentium CPU具有比80386更快的运算速度和更高的性能。
(4)与80386相比,Pentium的设计中采用了新的体系结构,主要有以下4个方面: ① 超标量流水线
这种流水线并行作业的方式,使得Pentium在每个周期内可同时执行两条指令。 ② 独立的指令Cache和数据Cache
这种双路高速缓存结构减少了征用高速缓存所造成的冲突,改进了处理器性能。 ③重新设计的浮点运算单元
④ 分支预测
减少了由于转移导致流水线的效率损失,节省了CPU的执行时间
(5)在存储管理中,Pentium的页面大小除可采用80386的4KB页面外,还可选用高达4KB的页面,页面尺寸由控制寄存器CR4中的PSE位来选择。当选用4KB页面时,只需用页组目录项表来寻址4KB页面,无需页表,从而极大地减少了内存用量,并加快了访问内存的速度。
6、结论
微处理器是计算机的核心,它对计算机的发展有着具足轻重的作用,它在我们的日常生活中应用广泛,如可以应用在运动控制,工业自动化、汽车电子、电机控制等等。它从最初的4位微处理器发展到现在的64位,这也说明着微处理器的发展从未停止,并且还会向着更先进的方向发展,这也有待我们去更加深入的了解微处理器,发展微处理器。
参考文献:
[1] 叶青.微机原理与接口技术[M].北京:清华大学出版社,2011:28-51.
[2] 唐翔.微机原理与接口技术[M].北京:中国铁道出版社,2011:24-49.
[3] 张敏情.Pentium微处理器结构分析及技术特点[J].武警技术学院学报,1995,第三期:18-22.
不同微处理器结构的比较研究
学生姓名
学号:
学生姓名
学号:学生姓名学号:系 部: 自动化
自动化 专
二零一四年九月
不同微处理器结构的比较研究
摘 要:微处理器是微型计算机的核心,从最初发展至今已经有很多年的历史了,这期间,按照其处理信息的字长,可以分为:4位微处理器、8位微处理器、16位微处理器、32位微处理器以及64位微处理器,可以说个人电脑的发展是随着CPU的发展而前进的。近年来微处理器不断发展,人们对它的需求越来越多,对于其功能的要求也越来越高,这就不断推进着微处理器技术上的创新和完善。我们通过比较几种典型的微处理器即Intel系列里的8086,80386以及Pentium的内部结构,了解其功能还有它们的优缺点,对于以后的学习和研究大有益处。
关键词:8086;80385;Pentium;结构
目录
1 前言„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„ 3
2 8086微处理器内部结构分析„„„„„„„„„„„„„„„„„„„„4
2.1 8086简介 „„„„„„„„„„„„„„„„„„„„„„„„„„4
2.2 8086CPU的内部功能结构„„„„„„„„„„„„„„„„„„„„5 2.3 8086CPU的寄存器结构„„„„„„„„„„„„„„„„„„„„„6
2.4 存储器及I/O端口的组织与管理„„„„„„„„„„„„„„„„„8
3 Pentium微处理器内部结构分析„„„„„„„„„„„„„„„„„„8
3.1 Pentium的三种指令处理部件„„„„„„„„„„„„„„„„„„8
3.2指令CACHE和数据CACHE„„„„„„„„„„„„„„„„„„„„8
3.3 Pentium的指令预取缓冲器和转移目标缓冲器„„„„„„„„„„„9
3.4 Pentium的总线设置„„„„„„„„„„„„„„„„„„„„„„9
3.5 Pentium在片CACHE的复写方式„„„„„„„„„„„„„„„„„9
4、80386微处理器内部结构分析„„„„„„„„„„„„„„„„„„9
4.1总线接口部件„„„„„„„„„„„„„„„„„„„„„„„„9
4.2 中央处理部件„„„„„„„„„„„„„„„„„„„„„„„„9
4.3存储器管理部件„„„„„„„„„„„„„„„„„„„„„„„„10
5、三种微处理器的结构比较„„„„„„„„„„„„„„„„„„„„10
5.1 80386与8086内部结构的比较„„„„„„„„„„„„„„„„„„11
5.2 80386和Pentium的内部结构比较„„„„„„„„„„„„„„„„11
6、结论„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„13
参考文献„„„„„„„„„„„„„„„„„„„„„„„„„„„„„13
1、前言 自从人类1947年发明晶体管以来,50多年间半导体技术经历了硅晶体管、集成电路、超大规模集成电路、甚大规模集成电路等几代,发展速度之快是其他产业所没有的。半导体技术对整个社会产生了广泛的影响,因此被称为“产业的种子”。中央处理器是指计算机内部对数据进行处理并对处理过程进行控制的部件,伴随着大规模集成电路技术的迅速发展,芯片集成密度越来越高,CPU可以集成在一个半导体芯片上,这种具有中央处理器功能的大规模集成电路器件,被统称为“微处理器”。
在学习《微型计算机原理与控制技术》这本书的同时,为了更加熟悉的掌握微处理器的结构,了解微处理器的发展以及技术上的革新,我们以“不同微处理器结构的比较研究”为论题撰写了这篇论文,并主要参考了《微机原理与接口技术》第二章、《Intel32位微处理器80386—新一代高性能微处理器的代表》、《Intel80386微处理器结构概述》、《Pentium微处理器结构分析与技术特点》、《第五代微处理器-Intel Pentium》等文献,对Intel 8086、Intel 80386以及Intel Pentium进行了结构分析和比较研究。论文的第一部分主要介绍了8086的CPU内部功能结构、寄存器结构、存储器以及I/O端口的组织与管理;第二部分主要介绍了Pentium的结构、三种指令处理部件和总线设置;第三部分主要介绍了80386的总线接口部件、中央处理部件,存储器管理部件;第四部分主要是对这三种微处理器结构进行比较研究;第五部分主要是整篇论文的结论。
在参考文献方面,我们主要是从期刊杂志、书本上收集有关Intel系列微处理器的资料(主要是Intel 第一代到第五代的资料)。收集这些资料一方面可以让自己多了解一些有关微处理器的知识;另一方面是资料比较权威,不易出现过大的错误,使研究更具可靠性。这些资料为我们的研究提供了很大的理论支持。
这篇论文整体结构清晰,层次分明,内容丰富,循序渐进,并注重介绍了各个类型微处理器的结构及比较,在论文中还特别绘制了部分插图以方便理解和阅读。这篇论文是我组人员共同的成果,论文中可能会存在一定的疏漏和错误,殷切希望读者能够批评指正。
2、 8086微处理器内部结构分析
2.1 8086简介
Intel8086CPU是Intel公司推出的第三代微处理器芯片,,是Intel系列典型的16位或准16位微处理器,它采用HMOS工艺制造,双列直插,有40个引脚。 8086微处理器是以8080和8085的设计为基础,拥有类似的寄存器组,但是数据总线扩充为16位。总线界面单元透过6字节预存的队列喂指令给执行单元,所以取指令和执行是同步的,8086CPU有20条地址线,可直接寻址1MB的存储空间,每一个存储单元可以存放一个字节(8位)二进制信息。
8086微处理器拥有四个16位的通用寄存器,也能够当作八个8位寄存器来存取,以及四个16位索引寄存器(包含了堆栈指标)。资料寄存器通常由指令隐含地使用,针对暂存值需要复杂的寄存器配置。它提供64K8位元的输出输入(或32K16位元),以及固定的向量中断。大部分的指令只能够存取一个内存位址,所以其中一个操作数必须是一个寄存器。运算结果会储存在操作数中的一个寄存器。
Intel8086有四个内存区段寄存器,可以从索引寄存器来设定。区段寄存器可以让CPU利用特殊的方式存取1MB内存。8086把段地址左移4位然后把它加上偏移地址。大部分的人都认为这是一个很不好的设计,因为这样的结果是会让各分段有重叠。尽管这样对组合语言而言大部分被接受(也甚至有用),可以完全地控制分段,,使在编程中使用指针(如C编程语言)变得困难。它导致指针的高效率表示变得困难,且有可能产生两个指向同一个地方的指针拥有不同的地址。更坏的是,这种方式产生要让内存扩充到大于1MB的困难。而8086的寻址方式改变让内存扩充较有效率。
8086处理器的时钟频率介于4.77MHz(在原先的IBMPC频率)和10MHz之间。8086没有包含浮点指令部分(FPU),但是可以通过外接数学辅助处理器来增强浮点计算能力。
2.2 8086CPU的内部功能结构
从功能上讲8086分为两部分,即总线接口部件(BIU)和执行部件(EU)。
1、 总线接口部件
总线接口部件BIU是CPU与外部存储器I/O的接口,负责完成CPU与存储器和I/O系统的数据转换。BIU主要由以下部分组成:
(1)4个16位段址寄存器
2.1 8086CPU的内部结构
用于存放各段的段地址基址,16位的寄存器IP控制指令的读取。
CS——16位的代码段寄存器;
DS——16位的数据段寄存器;
ES——16位的扩展段寄存器;
SS——16位的堆栈段寄存器。
(2)20位物理地址加法器
由于内部寄存器是16位的,为了形成20位的物理地址,8086CPU巧妙地利用20位加法器进行了16位/20位的地址转换。
(3)指令队列缓冲器
8086的BIU中包含了6字节的指令队列缓冲器,可以预取6字节的指令代码。
(4)总线控制电路
总线控制电路用于产生并发出总线控制信号,已实现对存储器和I/O端口的读/写控制。同时它将CPU的内部总线与16位的外部总线相连。
2、执行部件
执行部件EU的功能就是指令的执行。EU包括下列部分:
① 算术逻辑单元ALU:ALU完成16位或8位二进制的算术/逻辑运算,绝大部分指令的执行都由ALU完成。
② 通用寄存器组和标志寄存器FR
③ 控制器EU:接收从BIU中指令队列取来的指令,经过指令译码形成各种定时控制信号,向EU内各功能部件发送相应的控制命令,已完成每条指令所规定的操作。
8086CPU在取指令和执行指令过程中,EU和BIU之间采用了流水线方式。
2.3 8086CPU的寄存器结构
8086CPU内部有14个16位寄存器,可分为通用寄存器、控制寄存器、段寄存器组三类。
1、 通用寄存器
(1)数据寄存器组
数据寄存器包括AX、BX、CX、DX共4个16位寄存器,主要用来保存算术、逻辑运算的操作数、中间结果和地址。她们既可以作为16位寄存器使用,也可以将每个寄存器高字节和低字节分开作为两个独立的8位寄存器使用。8位寄存器只能用于存放数据。
其中:
AX: 具有累加功能,可作16位累加器,AL可作为8位累加器。
BX: 在基址变址寻址时作为基址寄存器。
CX: 在循环类与串处理类指令执行时作为默认的计数器寄存器。
DX: 作为数据寄存器使用,在双字运算中存放高16位数据。
(2)指针和变址寄存器组
指针和变址寄存器组包括指针寄存器SP、BP和变址寄存器SI、DI,是不可拆分的16位寄存器。
SP:堆栈指针寄存器,用来指出堆栈的顶部偏移地址。
BP:基地址指针寄存器,在间接寻址时作为基地址寄存器。
SI:源变址寄存器,在间接寻址时作为地址寄存器或变址寄存器。在字符串处理指令中,作为目的变址寄存器。
DI:目的变址寄存器,在间接寻址时作为地址寄存器或变址寄存器。在字符串处理指令中,作为源变址寄存器。
1、段寄存器租
段寄存器组包括4个段寄存器:
CS:代码段寄存器,存放当前代码段的段基址。
SS:堆栈段寄存器,存放当前堆栈段的段基址。
ES:附加段寄存器,存放当前傅家短的段基址。
DS:
数据段寄存器,存放当前数据段的段基址。
2、 控制寄存器
(1)指令指针IP
16位的指令指针寄存器IP,存放代码段中下一条中将要执行指令的偏移地址。执行部件EU每取走一条指令,总线接口部件BIU自动将IP的内容修改为下一条将要执行指令的地址。
3、标志位寄存器FR
它是一个16位的寄存器,用来记录程序中运行结果的状态信息,它们是根据有关指令的运行结果由 CPU 自动设置的。其中9位有定义, 9位中6位表示状态,3位表示控制标志。
2.2 位寄存器
① 状态标志
a.进位标志(CF):运算指令执行之后,若在最高位上产生进位、借位时,该标志位被置1。 具体地说,两个数相加时,最高位(D15或D7)有进位,或当两个数相减时,最高位有借位,进位标志位被置1,即CF=1;否则CF=0。
b.奇偶标志(PF):8086/8088 CPU中采用奇校验,运算指令执行后,运算结果的低8位中含1的位数为偶数时,该标志位被置1,否则被置0。也称为偶标志位。
c.辅助进位标志(AF):运算指令执行后。当两个数相加(减)时,当D3有向D4进(借)位时,该标志位被置1,否则被置0。
d.全零标志(ZF):运算指令执行后,结果的每一位都为零时该标志位被置1。
e.符号标志(SF):在带符号数运算时,如果运算结果最高位为1,表示结果为负值,SF位被置1,否则SF位被置0。SF也称为负标志位。
f.溢出标志(OF):运算指令执行后,结果的数值产生溢出,该标志位被置1,否则被置0。 ② 控制标志
控制标志用来控制CPU的工作方式,用户可以使用指令设置或清除。
a.方向标志(DF):用于字符串指令操作,当DF=0时,字符串处理由低地址向高地址处理;当DF=1时,则从高位地址向低位地址处理。
b.中断允许标志(IF):用来控制可屏蔽硬件中断。当IF=1时8086微处理器可以接受片外来的可屏蔽中断请求,开中断;IF=0时片外来的中断请求被阻止,关中断,也称被屏蔽。
c.单步标志(TF):该标志用来控制单步中断。在TF=1时,以单步方式执行程序。即8086每执行完—条指令就产生处理器内部单步中断。单步执行指令可使程序员跟踪指令的执行过程,进行积序的调试。
2.4 存储器及I/O端口的组织与管理
1、存储器
存储器是按照字节编址的,即一个存储单元存放一个字节的的内容,8086系统字长是16位的,所以当一个字存入存储器时需要占用两个相邻的存储单元,8086CPU约定字的低字节存放在低地址,高字节存放在高地址,字单元的地址采用它的低地址来表示。
存储器可分为逻辑段、段基址和段起始地址。
2、8086I/O组织
8086系统和外部设备之间是通过I/O芯片连接的。每个I/O芯片都设置有一定数目的端口暂存信息,微机系统为每个端口分配一个地址,称为端口号。各个端口地址是唯一的。
8086CPU可以访问64K个8位的I/O端口,两个编号相邻的8位端口可以合为一个16位端口。
3、Pentium微处理器内部结构分析
Pentium微处理器内部结构如图3.1所示。设有三种指令处理部件和16-21Kb的CACHE部件。
3.1 Pentium的三种指令处理部件
Pentium的三种指令处理部件分别是:RISC体系结构型的整数处理部件CPU,i80386兼容处理部件和浮点处理部件。
Pentium的RlSC型整数处理部件是采用超标量技术实现的,它设有两条流水线—U和V流水线。每条流水线都拥于自己的ALU,一个时钟周期可以并行执行两条整数指
图3.1 Pentium内部结构图
令。Pentium双流水线中的每一条分为5个步骤,即指令预取、指令解码、地址生成、指令执行、回写。Pentjum的i80386兼容处理部件负责处理不能用一个时钟周期完成的复杂指令。也就是说,它是利用微程序来处理RISC型整数处理部件无法执行的复杂命令。Pentium的浮点处理部件采用超级流水线技术来实现,其浮点单元在486的基础上进行了彻底的改进,执行过程分为8级流水,每个时钟周期能完成一个浮点操作。浮点单元流水线的前1步与整数流水相同,后4个步骤的前两步为二级浮点操作,后两步为四舍五入及写结果、出错报告。
3.2指令CACHE和数据CACHE
Pentium在微处理器中,设有在片的指令CACHE和数据CACHE。它们的容量各为8Kb,并且可以分别扩充到12Kb,而且可同时被访问。指令和数据分别使用不同的CACHE,使Pentiun的性能大大提高。例如.流水线的第1步为指令预取,在这一步中,指令从指令CACHE中取出来,如果合用一个CACHE,则预取指今和数据操作之间可能发生冲突。两个独立的CACHE可避免冲突并允许两个操作同时进行
3.3 Pentium的指令预取缓冲器和转移目标缓冲器
Pentium中设置了在片白的指令预取缓冲器。它在前一条指令执行结束后,可以预取多达91个字节的指令。为了高速处理转移操作,Pentium中设置了在片的转移日标缓冲器,它含有256
个头目,可以动态地预测程序分支,当一条指令导致程序分支
时,转移目标缓冲器记忆住在这条指令和分支目标的地址,并用这些信息预测这条指令再次产生分支时的路径,预先从此处预取。
3.4 Pentium的总线设置
Pentium的内部总线为32位,通向存贮器的外部数据总线为64位,在一个周期内,将数据传输量增加了一倍。地址总线扩充到36位,这是因为目前IGb大小的物理地址空间已不能满足要求所致。Pentium还支持多种类型的总线周期,其中包括一种突发模式,该种模式下可以在一个总线周期装入256位数据。
3.5 Pentium在片CACHE的复写方式
Pentium微处理器的在片CACHE,采用了“回写方式”。其目的在于适应共享主存贮器多机系统的需求,它有效地抑制了存取总线的使用次数。
4、80386微处理器内部结构分析
80386内部结构由三大部分组成:总线接口部件、中央处理部件和存储器管理部件。
图4.1 80386内部结构图
4.1总线接口部件
总线接口部件负责与存储器和I/O接口传送数据,并产生产生访问存储器和I/O端口所必须的地址和命令信号。由于总线数据传送与总线地址形成可同时进行,所以80386的总线周期只包含2个时钟周期。平常没有其它总线请求时,BIU将自动取出下条指令送到指令预取队列。
4.2 中央处理部件
中央处理部件包括指令预取单元、指令译码单元和执行单元三部分o
指令预取单元负责从存储器取出指令,放到一个16字节的指令队列中。它管理一个线性地址指针和一个段预取界限,负责段预取界限的检验。它把预取总线周期通过分页部件发给总线接口。每当预取队列不满或发生控制转移时,就向BIU发一个取指请求。指令预取的优先级别低于数据传送等总线操作。因此,绝大部分情况下是利用总线空闲时间预取指令。指令预取队列存放着从存储器取出的未经译码的指令。
指令译码单元从指令预取单元之中取出指令,进行译码。译码后的可执行指令放入已译码指令队列中,以备执行部件执行。每当已译码指令队列中有空间时,就从预取队列中取出指令并译码。
执行单元包括8个32位的寄存器组.32位的算术逻辑单元ALU,一个64位桶形移位寄存器和一个乘法除法器。桶形移位器用来有效地实现移位、循环移位和位操作,被广泛地用于乘法及其他操作中。它可以在一个时钟周期内实现64位同时移位,也可对任何一种数据类型移任意位数。桶形移位器与ALU并行操作,可加速乘法、除法、位操作,移位和循环移位操作。
4.3存储器管理部件
存储器管理器部件由分段部件和分页机构组成。分页与分段的原理。
分段部件的作用是应执行部件的请求,把逻辑地址转换成线性地址。在完成地址转换的同时还要执行总线周期的分段合法性检验。该部件可以实现任务之间的隔离,也可以实现指令和数据区的再定位。
分页机构的作用是把由分段部件或代码预取单元产生的线性地址转换成物理地址,并且要检验访问是否与页属性相符合。为了加快线性地址到物理地址的转换速度,80386内设有一个页描述符高速缓冲存储器,其中可以存储32项页描述符,使得在地
址转换期间,大多数情况下不需要到内存中查页目录表和页表。试验证明TLB的命中率可达98%。对于在TLB内没有命中的地址转换,80386设有硬件查表功能,从而缓解了因查表引起的速度下降问题。
5、三种微处理器的结构比较
8086是16位结构微处理器,它是Intel公司的第三代产品。
80386是与8086相兼容的高性能的32位微处理器,是Intel公司的第四代产品,也是第一代32位微处理器。
PentiumCPU是Intel 80x86系列的第五代产品,是与80386保持完全兼容的64位微处理器。
5.1 80386与8086内部结构的比较 (1)80386内部结构由三大部分组成:总线接口部件(BIU)、中央处理部件(CPU)和存储器管理部件(MMU);而8086内部结构分为两部分,即总线接口部件(BIU)和执行部件(EU)。
(2)80386采用全32位结构,其内部寄存器、ALU和操作是32位,数据线和地址线均为32位;而80386采用16位内部结构,16位双向外外部数据总线,20位地址信号线,其内部寄存器、ALU和操作是16位。
(3)80386提供32位外部总线接口,最大数据传输率为32MB/s,具有自动切换数据总线宽度的功能.CPU读写数据的宽度可以在32位到16位之间自由进行切换;而8086提供16位外部总线接口,最大数据传输率为16MB/s。 (4)80386片内集成存储器管理部件MMU,可支持虚拟存储和特权保护,虚拟存储器空间可达64TB(246字节)。存储器按段组织,每段最长4GB,因此64TB虚拟存储空间允许每个任务可拥有多达16384个段。存储保护机构采用四级特权层,可选择片内分页单元。内部具有多任务机构,能快速完成任务的切换。而8086存储器是按照字节编址的,即一个存储单元存放一个字节的的内容,8086系统字长是16位的,所以当一个字存入存储器时需要占用两个相邻的存储单元,8086CPU约定字的低字节存放在低地址,高字节存放在高地址,字单元的地址采用它的低地址来表示。
(5)80386具有三种工作方式:实地址方式、保护方式和虚拟8086方式。实地址方式和虚拟8086方式与8086相同,已有的8088/8086软件不加修改就能在80386的这
两种方式下运行;保护方式可支持虚拟存储、保护和多任务,包括了80286的保护方式功能。
(6)80386采用了比8086更先进的流水线结构,能高效、并行地完成取指、译码、执行和存储管理功能。它具有增强的指令预取队列,指令队列从8086的6字节增加到16字节。
(7)80386采用引脚栅格阵列封装技术,芯片封装在正方形管壳内,管壳每边3排引脚,共132根引脚,其中数据总线32条,地址线32条,时钟频率16MHz 。80386集成了275万个晶体管;而8086采用40个引脚的双列直插封装形式,并使用了引脚复
既能处理16位数据,也能处理8位数据。
(8)80386共有34个寄存器,可分为七类,它们分别是通用寄存器、指令指针和标志寄存器、段寄存器、系统地址寄存器、控制寄存器、调试和测试寄存器;而8086CPU内部有14个16位寄存器,可分为通用寄存器、控制寄存器、段寄存器组三类。80386有8个32位的通用寄存器,这8个通用寄存器都是由8086的相应16位通用寄存器扩展成32位而得,名字分别是:EAX,EBX,ECX,EDX,ESI,EDI,EBP,ESP。每个32位寄存器的低16位可单独使用,与8086的相应16位通用寄存器作用相同。同时,AX、BX、CX、DX寄存器的高、低8位也可分别当作8位寄存器使用。80386的指令指针EIP是一个32位寄存器,是从8086的IP扩充而来。32位标志寄存器中,除保留8088/8086CPU的9个标志外,另新增加了4个标志,即IOPL I/O特权级、NT 嵌套任务、VM 虚拟8086方式和RF 恢复标志。80386有6个段寄存器,分别是CS,DS,SS,ES,FS和GS。前4个段寄存器的名称与8086相同,在实地址方式下使用方式也和8086相同。除此之外,80386又增加了FS与GS,主要为了减轻对DS段和ES段的压力。
5.2 80386和Pentium的内部结构比较
(1)Pentium微处理器内部结构有三种处理部件(即RISC体系结构型的整数处理部件CPU、i80386兼容处理部件、浮点处理部件)和16-21KB的CACHE部件;80386内部结构由三大部分组成:总线接口部件(BIU)、中央处理部件(CPU)(包括预取单元、指令译码单元、执行单元)和存储器管理部件(包括分段部件、分页机构);
(2)Pentium微处理器与80386保持完全兼容,并采用0.8微米的Bi-COMS技术,使芯片集成度达到310万个晶体管。全部引脚被封装在一个大型的237针PGA中。时钟
频率有60MHz、66MHz、75MHz、90MHz、100MHz、120MHz、133MHz、150MHz及166MHz等多种。
(3)Pentium CPU芯片规模比80386芯片大大提高,除了CPU电路外,还集成了16KB的高速缓存和浮点协处理器。它的可寻址的物理地址空间可达64GB。芯片引脚增加到270多条,其中外部数据总线为64位,提高了读写存储器的速度,使得一个总线周期内的数据传输量比80386提高了一倍。Pentium内部总线与80386一样,数据线和地址线宽度都是32位。Pentium CPU具有比80386更快的运算速度和更高的性能。
(4)与80386相比,Pentium的设计中采用了新的体系结构,主要有以下4个方面: ① 超标量流水线
这种流水线并行作业的方式,使得Pentium在每个周期内可同时执行两条指令。 ② 独立的指令Cache和数据Cache
这种双路高速缓存结构减少了征用高速缓存所造成的冲突,改进了处理器性能。 ③重新设计的浮点运算单元
④ 分支预测
减少了由于转移导致流水线的效率损失,节省了CPU的执行时间
(5)在存储管理中,Pentium的页面大小除可采用80386的4KB页面外,还可选用高达4KB的页面,页面尺寸由控制寄存器CR4中的PSE位来选择。当选用4KB页面时,只需用页组目录项表来寻址4KB页面,无需页表,从而极大地减少了内存用量,并加快了访问内存的速度。
6、结论
微处理器是计算机的核心,它对计算机的发展有着具足轻重的作用,它在我们的日常生活中应用广泛,如可以应用在运动控制,工业自动化、汽车电子、电机控制等等。它从最初的4位微处理器发展到现在的64位,这也说明着微处理器的发展从未停止,并且还会向着更先进的方向发展,这也有待我们去更加深入的了解微处理器,发展微处理器。
参考文献:
[1] 叶青.微机原理与接口技术[M].北京:清华大学出版社,2011:28-51.
[2] 唐翔.微机原理与接口技术[M].北京:中国铁道出版社,2011:24-49.
[3] 张敏情.Pentium微处理器结构分析及技术特点[J].武警技术学院学报,1995,第三期:18-22.