计算机体系结构各章简答题及答案

第一章 计算机体系结构的基本概念

1. 什么是计算机系统的多级层次结构?

2. 硬件和软件在什么意义上是等效的?在什么意义上是不等效的?

3. 经典计算机系统结构的实质是什么?

4. 语言实现的两种基本技术是什么?

5. 对于通用寄存器型机器来说,机器语言程序设计者所看到的计算机的属性主要有哪些?

6. 什么是软件兼容?软件兼容有几种?其中哪一种是软件兼容的根本特征?

7. 什么是系列机?它的出现较好地解决了什么矛盾?

8. 对计算机发展非常关键的实现技术有哪些?

9. 实现软件移植的主要途径有哪些?

10. 试以系列机为例,说明计算机系统结构、计算机组成和计算机实现三者之间的关系。

11. 存储程序计算机在系统结构上的主要特点是什么?

12. 从系统结构的发展情况看,新型系统结构的设计主要从哪两方面着手?

13. 软件技术两个最重要的发展趋势是什么?

14. 计算机系统设计人员的技术挑战主要来自哪几个方面?

15. 一种计算机系统结构的生命周期是怎样的?

16. 商品的标价(价格)由哪些因素构成?

17. 对计算机系统成本产生影响的主要因素有哪些?

18. 用户CPU 时间由哪三个因素决定?

19. 目前常用的测试程序分为哪五类?

20. 什么叫测试程序组件?在评价计算机系统设计时最常见的测试程序组件是哪个?

21. SPEC2000测试程序组件中包括哪几个测试程序组件?

22. 测试基于Microsoft 公司的Windows 系列操作系统平台的最常用测试组件有哪些?

23. 常用的专门的性能指标测试程序有哪些?

24. 计算机系统结构设计和分析中最经常使用的三条基本原则是什么?

25. 根据Amdahl 定律,系统加速比由哪两个因素决定?

26. 从执行程序的角度看,并行性等级从低到高可分为哪几级?

27. 从处理数据的角度,并行性等级从低到高可以分为哪几级?

28. 计算机系统中提高并行性的技术途径有哪三种?

29. 多机系统的耦合度可以分为哪几类?

30. 单机系统和多机系统中,都是按哪三种技术途径分别发展为哪三类多处理机?

31. 三种类型的多处理机(同构型多处理机、异构型多处理机、分布处理系统)的主要区别是什么?

1. 什么是计算机系统的多级层次结构?

从计算机语言的角度,把计算机系统按功能划分成以下多级层次结构:

2. 硬件和软件在什么意义上是等效的?在什么意义上是不等效的?

硬件和软件在功能实现上是等效的,即一种功能可以由软件实现,也可以由硬件实现。在实现性能上是不等效的。软件实现的优点是设计容易、改进简单;硬件实现的优点是速度快。

3. 经典计算机系统结构的实质是什么?

计算机系统中软硬件界面的确定,其界面之上的是软件的功能,界面之下的是硬件和固件的功能。

4. 语言实现的两种基本技术是什么?

翻译和解释是语言实现的两种基本技术。它们都是以执行一串N级指令来实现N+1级指令,但二者存在着差别:翻译技术是先把N+1级程序全部变换成N 级程序后,再去执行新产生的N 级程序,在执行过程中N+1级程序不再被访问。而解释技术是每当一条N+1级指令被译码后,就直接去执行一串等效的N 级指令,然后再去取下一条N+1级的指令,依此重复进行。在这个过程中不产生翻译出来的程序,因此解释过程是边变换边执行的过程。

5. 对于通用寄存器型机器来说,机器语言程序设计者所看到的计算机的属性主要有哪些?

(1) 数据表示

(2) 寻址规则

(3) 寄存器定义

(4) 指令集

(5) 中断系统

(6) 机器工作状态的定义和切换

(7) 存储系统

(8) 信息保护

(9) I/O结构

6. 什么是软件兼容?软件兼容有几种?其中哪一种是软件兼容的根本特征?

同一个软件可以不加修改地运行于系统结构相同的各档机器上,而且它们所获得的结果一样,差别只在于运行时间的不同。

软件兼容分为向上兼容、向下兼容、向前兼容和向后兼容。其中向后兼容是软件兼容的根本特征。

7. 什么是系列机?它的出现较好地解决了什么矛盾?

系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。它的出现较好地解决了软件要求环境稳定和硬件、器件技术迅速发展之间的矛盾。

8. 对计算机发展非常关键的实现技术有哪些?

(1) 逻辑电路;

(2) 半导体DRAM(动态随机访问存储器) ;

(3) 磁盘;

(4) 网络。

9. 实现软件移植的主要途径有哪些?

(1) 采用系列机方法

(2) 采用模拟与仿真方法

(3) 采用统一的高级语言

10. 试以系列机为例,说明计算机系统结构、计算机组成和计算机实现三者之间的关系。 计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。

一种系统结构可以有多种组成;一种组成可以有多种实现。同一系列机中各种型号的机器具有相同的系统结构,但采用不同的组成和实现技术,因而具有不同的性能和价格。

11. 存储程序计算机在系统结构上的主要特点是什么?

(1)机器以运算器为中心。

(2)采用存储程序原理。程序和数据放在同一存储器中,并且没有对两者加以区分。

(3)存储器是按地址访问的、线性编址的空间。

(4)控制流由指令流产生。

(5)指令由操作码和地址码组成。操作码指明本指令的操作类型,地址码指明操作数和操作结果的地址。

(6)数据以二进制编码表示,采用二进制运算。

12. 从系统结构的发展情况看,新型系统结构的设计主要从哪两方面着手?

新型系统结构的设计主要从以下两方面着手:

一方面是合理地增加计算机系统中硬件的功能比例,使系统结构对操作系统、高级语言甚至应用软件提供更多更好的支持;

另一方面则是通过多种途径提高计算机系统结构中的并行性等级,使得凡是能并行计算和处理的问题都能并行计算和处理,使这种系统结构和组成对算法提供更多更好的支持。

13. 软件技术两个最重要的发展趋势是什么?

(1) 程序及数据所使用存储器容量的不断增大;

(2) 高级语言的使用越来越广泛,在很多应用领域取代了汇编语言。

14. 计算机系统设计人员的技术挑战主要来自哪几个方面?

计算机系统设计人员的技术挑战主要来自系统结构、设计工具、制造工艺、软件、应用和经济等多个方面。

15. 一种计算机系统结构的生命周期是怎样的?

计算机的生命周期和系统中各个部分的发展密切相关。一种新的系统结构的诞生,往往以硬件为标志,它的发展和成熟,是以配套的系统软件和应用为标志的。一个计算机系统结构,从产生到消亡,大致需要15 ~20年的时间。

16. 商品的标价(价格)由哪些因素构成?

商品标价的构成因素:原料成本、直接成本、毛利和折扣。

17. 对计算机系统成本产生影响的主要因素有哪些?

对计算机系统成本产生影响的主要因素有时间、产量、商品化等因素。对成本产生最直接影响的是时间;产量是决定产品成本的第二个关键因素。

18. 用户CPU 时间由哪三个因素决定?

用户CPU 时间 = CPI × IC / 时钟频率

其中:CPI :指令时钟数

IC :程序执行过程中所处理的指令数

19. 目前常用的测试程序分为哪五类?

(1)实际应用程序;

(2)修正的(或者脚本化)应用程序;

(3)核心测试程序;

(4)小测试程序;

(5)合成测试程序。

20. 什么叫测试程序组件?在评价计算机系统设计时最常见的测试程序组件是哪个?

选择一组各个方面有代表性的测试程序,组成一个通用测试程序集合。这种测试程序集合称为测试程序组件。

在评价计算机系统设计时最常见的测试程序组件是基于UNIX 的SPEC ,其主要版本包括SPEC89、SPEC92、SPEC95和SPEC2000等。

21. SPEC2000测试程序组件中包括哪几个测试程序组件?

SPEC CPU2000:测试CPU ;

SPECviewperf :用于测试图形系统支持OpenGL 库的性能;

SPECapc :测试图形密集型应用的性能;

SPECSFS :基于NFS 文件系统的文件服务器测试程序;

SPECWeb :Web 服务器测试程序。

22. 测试基于Microsoft 公司的Windows 系列操作系统平台的最常用测试组件有哪些? PCMark04包括中央处理器测试组、内存测试组、图形芯片测试组、硬盘测试组等。

Business Winstone 2004主要用于测试计算机系统商业应用的综合性能。

Multimedia Content Creation Winstone 2004主要用于测试计算机系统多媒体应用的综合性能。 SiSoft Sandra Pro 2004是一套功能强大的系统分析评比工具,拥有超过30种以上的分析与测试模组,主要包括有CPU 、存储器、I/O接口、I/O设备、主板等。

23. 常用的专门的性能指标测试程序有哪些?

3DMark03主要测试显卡性能和DirectX 的性能。

Prime95是用来估计分布式计算程序的通信情况,可使计算机高负荷运转,所以也用来测试计算机的稳定性。

SuperPi/SuperE是计算圆周率π/自然指数e 的软件,通常用来测试CPU 的稳定性。

24. 计算机系统结构设计和分析中最经常使用的三条基本原则是什么?

(1)大概率事件优先原则。对于大概率事件(最常见的事件) ,赋予它优先的处理权和资源使用权,以获得全局的最优结果。

(2)Amdahl 定律 。加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

(3)程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

25. 根据Amdahl 定律,系统加速比由哪两个因素决定?

系统加速比依赖于两个因素:

(1)可改进比例:可改进部分在原系统计算时间中所占的比例。

(2)部件加速比:可改进部分改进以后的性能提高。

26. 从执行程序的角度看,并行性等级从低到高可分为哪几级?

从执行程序的角度看,并行性等级从低到高可分为:

(1)指令内部并行:指令内部的微操作之间的并行。

(2)指令级并行:并行执行两条或多条指令。

(3)任务级或过程级并行:并行执行两个或多个过程或任务(程序段) 。

(4)作业或程序级并行:在多个作业或程序间的并行。

27. 从处理数据的角度,并行性等级从低到高可以分为哪几级?

从处理数据的角度,并行性等级从低到高可以分为:

(1)字串位串:同时只对一个字的一位进行处理。

(2)字串位并:同时对一个字的全部位进行处理。

(3)字并位串:同时对许多字的同一位(称位片)进行处理。

(4)全并行:同时对许多字的全部或部分位进行处理。

28. 计算机系统中提高并行性的技术途径有哪三种?

(1)时间重叠:多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

(2)资源重复:通过重复设置资源,尤其是硬件资源,大幅度提高计算机系统的性能。

(3)资源共享:是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。

29. 多机系统的耦合度可以分为哪几类?

(1)最低耦合:除通过某种中间存储介质之外,各计算机之间没有物理连接,也无共享的联机硬件资源。

(2)松散耦合:通过通道或通信线路实现计算机间互连,共享某些外围设备,机间的相互作用是在文件或数据集一级进行。

(3)紧密耦合:机间物理连接的频带较高,往往通过总线或高速开关实现互连,可以共享主存。

30. 单机系统和多机系统中,都是按哪三种技术途径分别发展为哪三类多处理机?

单机系统和多机系统中,都是按时间重叠、资源重复和资源共享三种技术途径,分别发展为同构型多处理机、异构型多处理机、分布处理系统。

31. 三种类型的多处理机(同构型多处理机、异构型多处理机、分布处理系统)的主要区别是什么?

主要区别:

第二章 计算机指令集结构设计

1. 通常可按哪五个因素对计算机指令集结构进行分类?

2. 在对计算机指令集结构进行分类的五个因素中,哪一种是各种指令集结构之间最主要的区别?

3. 根据CPU 内部存储单元类型,可将指令集结构分为哪几类?

4. 堆栈型指令集结构、累加器型指令集结构和通用寄存器型指令集结构分别有什么优缺点?

5. 现代大多数机器均采用通用寄存器型指令集结构,为什么?

6. 通用寄存器型指令集结构可细分为哪三类?

7. 三种通用寄存器型指令集结构分别有什么优缺点?

8. 从当前的计算机技术观点来看,CISC 结构有什么缺点?

9. 增强CISC 机器的指令功能主要从哪几方面着手?

10. RISC的设计原则是什么?

11. RISC和CISC 处理机的指令系统结构在指令格式、寻址方式和每条指令的周期数(CPI )三方面有哪些区别?

12. 计算机指令集结构设计所涉及的内容有哪些?

13. 指令中有哪两种表示操作数类型的方法?

14.指令中表示寻址方式的主要方法有哪些?

15. 指令集格式设计中选择表示寻址方式的方法的依据是什么?

16. 指令集结构中采用多种寻址方式有何优缺点?

17. 在控制指令中使用PC 相对寻址方式有什么优点?

18. 在指令集格式的设计时,通常可选择哪几种指令格式?

19. DLX中有哪些寄存器?

20. DLX有哪几种数据类型?

21. DLX采用哪几种寻址方式?

1. 通常可按哪五个因素对计算机指令集结构进行分类?

(1) 在CPU 中操作数的存储方法;

(2) 指令中显式表示的操作数个数;

(3) 操作数的寻址方式;

(4) 指令集所提供的操作类型;

(5) 操作数的类型和大小。

2. 在对计算机指令集结构进行分类的五个因素中,哪一种是各种指令集结构之间最主要的区别?

CPU 中操作数的存储方法,即在CPU 中用来存储操作数的存储单元的类型,是各种指令集结构之间最主要的区别。

3. 根据CPU 内部存储单元类型,可将指令集结构分为哪几类?

堆栈型指令集结构、累加器型指令集结构、通用寄存器型指令集结构

4. 堆栈型指令集结构、累加器型指令集结构和通用寄存器型指令集结构分别有什么优缺点?

5. 现代大多数机器均采用通用寄存器型指令集结构,为什么?

主要有两个方面的原因,一是寄存器和CPU 内部其他存储单元一样,要比存储器快;其次是对编译器而言,可以更加容易、有效地分配和使用寄存器。

6. 通用寄存器型指令集结构可细分为哪三类?

寄存器-寄存器型

寄存器-存储器型

存储器-存储器型

7. 三种通用寄存器型指令集结构分别有什么优缺点?

8. 从当前的计算机技术观点来看,CISC 结构有什么缺点?

(1)CISC 结构的指令系统中,各种指令的使用频率相差悬殊。

(2)CISC 结构指令系统的复杂性带来了计算机系统结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。

(3)CISC 结构指令系统的复杂性给VLSI 设计增加了很大负担,不利于单片集成。

(4)CISC 结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。

(5)在CISC 结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计算机系统结构技术来提高系统的性能。

9. 增强CISC 机器的指令功能主要从哪几方面着手?

(1) 面向目标程序增强指令功能;

(2) 面向高级语言和编译程序改进指令系统;

(3) 面向操作系统的优化实现改进指令系统。

10. RISC的设计原则是什么?

(1)选取使用频率最高的指令,并补充一些最有用的指令;

(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;

(3)所有指令长度均相同;

(4)只有Load 和Store 操作指令才访问存储器,其它指令操作均在寄存器之间进行;

(5)以简单有效的方式支持高级语言。

11. RISC和CISC 处理机的指令系统结构在指令格式、寻址方式和每条指令的周期数(CPI )三方面有哪些区别?

12. 计算机指令集结构设计所涉及的内容有哪些?

(1) 指令集功能设计:主要有RISC 和CISC 两种技术发展方向

(2) 寻址方式的设计

(3) 操作数表示和操作数类型

(4) 寻址方式的表示:可以将寻址方式编码于操作码中,也可以将寻址方式作为一个单独的域来表示。

(5) 指令集格式的设计:有变长编码格式、固定长度编码格式和混合型编码格式三种。

13. 指令中有哪两种表示操作数类型的方法?

(1)操作数的类型由操作码的编码指定,这是最常见的一种方法;

(2)数据可以附上由硬件解释的标记,由这些标记指定操作数的类型,从而选择适当的运算。

14.指令中表示寻址方式的主要方法有哪些?

表示寻址方式有两种常用的方法:

(1)将寻址方式编于操作码中,操作码在描述指令功能的同时也描述了相应的寻址方式。这种方式译码快,但操作码和寻址方式的结合不仅增加了指令的条数,导致了指令的多样性,而且增加了CPU 对指令译码的难度。

(2)为每个操作数设置一个地址描述符,由该地址描述符表示相应操作数的寻址方式。这种方式译码较慢,但操作码和寻址独立,易于指令扩展。

15. 指令集格式设计中选择表示寻址方式的方法的依据是什么?

主要由指令集结构所采用的寻址方式种类及其适用范围,以及操作码与寻址方式之间的独立程度来决定。

如果某些指令集结构的指令有1~5个操作数,每个操作数有10种寻址方式,对于这种大规模的操作数和寻址方式组合,通常采用增设地址描述符的方法来描述寻址方式。

对诸如Load/Store类型指令集结构的指令,由于只有1~3个操作数,而且只有有限几种寻址方式。通常将寻址方式编码于操作码中。

16. 指令集结构中采用多种寻址方式有何优缺点?

在指令集结构中采用多种寻址方式可以显著地减少程序的指令条数;但同时也可能增加实现的复杂度和使用这些寻址方式的指令的执行时钟周期数(CPI )。

17. 在控制指令中使用PC 相对寻址方式有什么优点?

(1) 有效地缩短指令中表示目标地址的字段的长度;

(2) 使得代码在执行时与它被载入的位置无关。

18. 在指令集格式的设计时,通常可选择哪几种指令格式?

(1) 变长编码格式。这种编码方式可以有效减少程序的目标代码大小。

(2) 固定长度编码格式。这种编码方式可以降低译码的复杂度,提高译码的性能。

(3) 混合型编码格式。兼顾降低目标代码长度和降低译码复杂度。

19. DLX中有哪些寄存器?

(1)32个通用寄存器;

(2)32个浮点寄存器;

(3)一些特别的寄存器。

20. DLX有哪几种数据类型?

多种长度的整型数据和浮点数据。

(1)整型数据:8位、16位和32位多种长度。

(2)浮点数据:32位单精度浮点数和64位双精度浮点数。

21. DLX采用哪几种寻址方式?

寄存器寻址、立即值寻址、偏移寻址和寄存器间接寻址

第三章 流水线技术

1. 流水技术有哪些特点?

2. 按照流水线所完成的功能来分,流水线可分为哪两类?

3. 按照同一时间内各段之间的连接方式来分,流水线可分为哪两类?

4. 按照流水的级别来分,流水线可分为哪三类?

5. 按照数据表示来分,流水线可分为哪两类?

6. 按照流水线中是否有反馈回路来分,流水线可分为哪两类?

7. 一条DLX 指令的执行需要几个时钟周期?它们分别是什么?

8. DLX流水线寄存器的作用是什么?

9. 消除流水线的瓶颈段有哪些方法?

10. 评价流水线的性能指标是什么?

11. 流水线中有哪三种相关?各是什么原因造成的?

12. 解决流水线结构相关的方法有哪些?

13. 为什么流水线设计者有时会允许结构相关的存在?

14. 定向技术的主要思想是什么?

15. DLX流水线中所有数据相关都可以通过定向技术消除,而不需要暂停吗?试举例说明。

16.根据指令对寄存器的读写顺序,可将数据相关分为哪三种类型?

17.解决流水线数据相关的方法有哪些?

18. 减少流水线处理分支指令时的暂停时钟周期数有哪两种途径?

19. 在DLX 基本流水线中可采用哪些静态方法降低分支损失?

20.从编译技术的角度,降低流水线分支损失的方法有哪些?

21. 预测分支失败方法的主要思想是什么?

22. “延迟分支”方法的主要思想是什么?

23.为了在分支延迟槽中填入有效指令,一般采用哪三种方法?

24. 调度分支延迟指令的三种常用方法的特点和局限性是什么?

25.有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?

26.什么是向量链接技术?

27. 衡量向量处理机性能的主要参数有哪些?

1. 流水技术有哪些特点?

(1)流水过程由多个相联系的子过程组成,每个过程称为流水线的“级”或“段”;

(2)每个子过程由专用的功能段实现;

(3)各个功能段所需时间应尽量相等;

(4)流水线需要有“通过时间”,在此之后流水过程才进入稳定工作状态,每一个时钟周期(拍) 流出一个结果;

(5)流水技术适合于大量重复的时序过程,只有在输入端能连续地提供任务,流水线的效率才能充分发挥。

2. 按照流水线所完成的功能来分,流水线可分为哪两类?

(1)单功能流水线:只能完成一种固定功能的流水线。

(2)多功能流水线:流水线的各段可以进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。

3. 按照同一时间内各段之间的连接方式来分,流水线可分为哪两类?

(1)静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。

(2)动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。

4. 按照流水的级别来分,流水线可分为哪三类?

(1)部件级流水线(运算操作流水线):把处理机的算术逻辑部件分段,以便为各种数据类型进行流水操作。

(2)处理机级流水线(指令流水线):把解释指令的过程按照流水方式处理。

(3)处理机间流水线(宏流水线):由两个以上的处理机串行地对同一数据流进行处理,每个处理机完成一项任务。

5. 按照数据表示来分,流水线可分为哪两类?

(1)标量流水处理机:处理机不具有向量数据表示,仅对标量数据进行流水处理。

(2)向量流水处理机:处理机具有向量数据表示,并通过向量指令对向量的各元素进行处理。

6. 按照流水线中是否有反馈回路来分,流水线可分为哪两类?

(1)线性流水线:流水线的各段串行连接,没有反馈回路。

(2)非线性流水线:流水线中除有串行连接的通路处,还有反馈回路。

7. 一条DLX 指令的执行需要几个时钟周期?它们分别是什么?

一条DLX 指令的执行需要5个时钟周期。它们分别是:取指令周期(IF )、指令译码/读寄存器周期(ID )、执行/有效地址计算周期(EX )、存储器/分之完成周期(MEM )、写回周期(WB )。

8. DLX流水线寄存器的作用是什么?

把数据和控制信息从一个流水段传送到下一个流水段。

9. 消除流水线的瓶颈段有哪些方法?

(1) 细分瓶颈段;

(2) 重复设置瓶颈段。

10. 评价流水线的性能指标是什么?

(1) 吞吐率:指在单位时间内流水线所完成的任务数或输出结果的数量。

(2) 流水线的加速比:指m 段流水线的速度与等功能的非流水线的速度之比。

(3) 效率:指流水线的设备利用率。

11. 流水线中有哪三种相关?各是什么原因造成的?

(1)结构相关:当硬件资源满足不了指令重叠执行的要求, 而发生资源冲突时, 就发生了结构相关。

(2)数据相关:当一条指令需要用到前面指令的执行结果,而这些指令均在流水线中重叠执行时,就可能引起数据相关。

(3)控制相关:当流水线遇到分支指令和其它能够改变PC 值的指令时,就会发生控制相关。

12. 解决流水线结构相关的方法有哪些?

(1)流水化功能单元;(2)资源重复;(3)暂停流水线。

13. 为什么流水线设计者有时会允许结构相关的存在?

主要有两个原因:一是为了减少硬件开销,二是为了减少功能单元的延迟。

14. 定向技术的主要思想是什么?

在发生数据相关时,后面的指令并不是马上就要用到前一条指令的计算结果。如果能够将计算结果从其产生的地方直接送到需要它的地方,就可以避免暂停。当定向硬件检测到前面某条指令的结果寄存器就是当前指令的源寄存器时,控制逻辑会将前面那条指令的结果直接从其产生的地方定向到当前指令所需的位置。

15. DLX流水线中所有数据相关都可以通过定向技术消除,而不需要暂停吗?试举例说明。 DLX 流水线中有需要暂停的数据相关。

例:在下列指令序列中,需要在LW 指令之后插入一个暂停周期,然后再用定向技术消除相关。 LW R1 , 0(R2)

SUB R4 , R1 ,R5

AND R6 , R1 ,R7

16.根据指令对寄存器的读写顺序,可将数据相关分为哪三种类型?

(1)写后读相关

(2)写后写相关

(3)读后写相关

17.解决流水线数据相关的方法有哪些?

(1)定向技术:在某条指令产生一个结果之前,其他指令并不真正需要该计算结果,如果将该计结果从其产生的地方直接送到其他指令需要它的地方,就可以避免暂停。

(2)暂停技术:设置一个“流水线互锁”的功能部件,一旦流水线互锁检测到数据相关,流水线暂停执行发生数据相关指令后续的所有指令。直到该数据相关解决为止。

(3)采用编译器调度。

(4)重新组织代码顺序。

18. 减少流水线处理分支指令时的暂停时钟周期数有哪两种途径?

(1) 在流水线中尽早判断出分支转移是否成功;

(2) 尽早计算出分支转移成功时的PC 值(即分支的目标地址)。

19. 在DLX 基本流水线中可采用哪些静态方法降低分支损失?

(1) 修改硬件:在ID 段增加一个加法器,将计算分支目标地址的操作移到ID 段完成。

(2) 预测分支失败的方法

(3) 延迟分支方法

20.从编译技术的角度,降低流水线分支损失的方法有哪些?

(1) 冻结或排空流水线的方法;

(2) 预测分支失败的方法;

(3) 预测分支成功的方法;

(4) 延迟分支方法。

21. 预测分支失败方法的主要思想是什么?

当流水线译码到一条分支指令时,流水线继续取指令,并允许该分支指令后的指令继续在流水线中流动。当流水线确定分支转移成功与否以及分支的目标地址之后,如果分支转移成功,流水线必须将在分支指令之后取出的所有指令转化为空操作,并在分支的目标地址处重新取出有效的指令;如果分支转移失败,那么可以将分支指令看作是一条普通指令,流水线正常流动,无需将在分支指令之后取出的所有指令转化为空操作。

22. “延迟分支”方法的主要思想是什么?

其主要思想是从逻辑上“延长”分支指令的执行时间。设延迟长度为n 的分支指令后面有n 个分支延迟槽,选择n 条有效和有用的指令放入分支延迟槽中,无论分支成功与否,流水线都会执行这些指令。处于分支延迟槽中的指令“掩盖”了流水线原来所必须插入的暂停周期。

23.为了在分支延迟槽中填入有效指令,一般采用哪三种方法?

从前调度、从目标处调度、从失败处调度

24. 调度分支延迟指令的三种常用方法的特点和局限性是什么?

25.有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?

(1) 水平处理方式:不适合对向量进行流水处理。

(2) 垂直处理方式:适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入、输出端直接与存储器相联,构成M-M 型的运算流水线。

(3) 分组处理方式:适合流水处理。可设长度为n 的向量寄存器,使每组向量运算的源/目向量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成R-R 型运算流水线。

26.什么是向量链接技术?

当两条向量指令出现“写后读”相关时,若它们不存在功能部件冲突和向量寄存器(源或目的) 冲突,就有可能把它们所用的功能部件头尾相接,形成一个链接流水线,进行流水处理。

27. 衡量向量处理机性能的主要参数有哪些?

(1) 向量指令的处理时间

(2) 峰值性能:向量长度为无穷大时,向量处理机的最高性能。

(3) 半性能向量长度:向量处理机的性能为其峰值性能一半时所需的向量长度。

(4) 向量长度临界值:对同一段程序代码而言,向量方式的处理速度优于标量串行方式处理速度时所需的最小向量长度。

第五章 存储层次

1. 单级存储器的主要矛盾是什么?通常采取什么方法来解决?

2. 评价存储层次的主要参数有哪些?

3. “Cache —主存”和“主存—辅存”层次的主要区别是什么?

4. 在存储层次中应解决哪四个问题?

5. 地址映象方法有哪几种?它们各有什么优缺点?

6. 组相联Cache 比相同容量的直接映象Cache 的失效率低。由此是否可以得出结论:采

7. Cache中,有哪两种实现并行查找的方法?

8. 替换算法有哪几种?它们各有什么优缺点?

9. 写策略主要有哪两种?它们各有什么优点?

10. 在写回法中,可采用什么方法减少在替换时块的写回?

11. 当发生Cache 写失效时,是否调入相应的块,有哪两种选择?

12. 按照Cache 产生失效的原因不同,可以把失效分为哪三类?

13. 3C失效与Cache 的相联度、容量有什么样的关系?

14. 增加Cache 块大小一定会降低失效率吗?

15.伪相联的基本思想是什么?

16.伪相联的优点是什么?

17. 降低Cache 失效率有哪些方法?

18. 减少Cache 失效开销有哪些方法?。

19. 子块放置技术的基本思想是什么?

20. 请求字处理技术有哪两种具体的实现方法?

21. 采用二级Cache 的基本思想是什么?

22. 采用容量小且结构简单的Cache 有什么好处?

23. “虚拟索引+物理标识” Cache的基本思想是什么?

1. 单级存储器的主要矛盾是什么?通常采取什么方法来解决?

主要矛盾:

(1) 速度越快,每位价格就越高;

(2) 容量越大,每位价格就越低;

(3) 容量越大,速度越慢。

采取多级存储层次方法来解决。

2. 评价存储层次的主要参数有哪些?

存储层次的平均每位价格、命中率或失效率、平均访问时间

3. “Cache —主存”和“主存—辅存”层次的主要区别是什么?

4. 在存储层次中应解决哪四个问题?

(1)映象规则:当把一个块调入高一层存储器时,可以放到哪些位置上?

(2)查找算法:当所要访问的块在高一层存储器中时,如何找到该块?

(3)替换算法:当发生失效时,应替换哪一块?

(4)写策略:当进行写访问时,应进行哪些操作?

5. 地址映象方法有哪几种?它们各有什么优缺点?

(1)全相联映象。实现查找的机制复杂,代价高,速度慢。Cache 空间的利用率较高,块冲突概率较低,因而Cache 的失效率也低。

(2)直接映象。实现查找的机制简单,速度快。Cache 空间的利用率较低,块冲突概率较高,因而Cache 的失效率也高。

(3)组相联映象。组相联是直接映象和全相联的一种折衷。

6. 组相联Cache 比相同容量的直接映象Cache 的失效率低。由此是否可以得出结论:采用组相联Cache 一定能带来性能上的提高?为什么?

不一定。因为组相联命中率的提高是以增加命中时间为代价的,组相联需要增加多路选择开关。

7. Cache中,有哪两种实现并行查找的方法?

(1)用相联存储器实现;

(2)用单体多字存储器和比较器来实现。

8. 替换算法有哪几种?它们各有什么优缺点?

(1)随机法。简单、易于用硬件实现,但这种方法没有考虑Cache 块过去被使用的情况,反映不了程序的局部性,所以其失效率比LRU 的高。

(2)先进先出法。容易实现。它虽然利用了同一组中各块进入Cache 的顺序这一“历史”信息,但还是不能正确地反映程序的局部性。

(3)最近最少使用法LRU 。 失效率最低。但是LRU 比较复杂,硬件实现比较困难。

9. 写策略主要有哪两种?它们各有什么优点?

(1) 写直达法。 易于实现,而且下一级存储器中的数据总是最新的。

(2) 写回法。速度快,写操作能以Cache 存储器的速度进行。而且对于同一单元的多个写最后只需一次写回下一级存储器,有些“写”只到达Cache ,不到达主存,因而所使用的存储器频带较低。

10. 在写回法中,可采用什么方法减少在替换时块的写回?

常采用“污染位”标志。即为Cache 中的每一块设置一个“污染位”(设在与该块相应的目录表项中),用于指出该块是“脏”的(被修改过)还是干净的(没被修改过)。替换时,若被替换的块是干净的,则不必写回下一级存储器,因为这时下一级存储器中相应块的内容与Cache 中的一致。

11. 当发生Cache 写失效时,是否调入相应的块,有哪两种选择?

按写分配法:写失效时,先把所写单元所在的块调入Cache ,然后再进行写入。这种方法也称为写时取方法。

不按写分配法:写失效时,直接写入下一级存储器而不将相应的块调入Cache 。这种方法也称为绕写法。

12. 按照Cache 产生失效的原因不同,可以把失效分为哪三类?

强制性失效、容量失效、冲突失效

13. 3C失效与Cache 的相联度、容量有什么样的关系?

⑴ 相联度越高,冲突失效就越少;

⑵ 强制性失效和容量失效不受相联度的影响;

⑶ 强制性失效不受Cache 容量的影响,但容量失效却随着容量的增加而减少;

⑷ 2:1的Cache 经验规则:大小为N 的直接映象Cache 的失效率约等于大小为N/2的两路组相联Cache 的失效率。

14. 增加Cache 块大小一定会降低失效率吗?

不一定。

对于给定的Cache 容量,当块大小增加时,失效率开始是下降,后来反而上升了。主要因为增加块大小会产生双重作用。一方面它减少了强制性失效;另一方面,可能会增加冲突失效。

15.伪相联的基本思想是什么?

采用这种方法时,在命中情况下,访问Cache 的过程和直接映象Cache 中的情况相同;而发生失效时,在访问下一级存储器之前,会先检查Cache 另一个位置(块),看是否匹配。确定这个另一块的一种简单的方法是将索引字段的最高位取反,然后按照新索引去寻找伪相联组中的对应块。如果这一块的标识匹配,则称发生了伪命中。否则,就只好访问下一级存储器。

16.伪相联的优点是什么?

伪相联既能获得多路组相联Cache 的低失效率又能保持直接映象Cache 的命中速度。

17. 降低Cache 失效率有哪些方法?

增加Cache 块大小、提高相联度、Victim Cache 、伪相联Cache 、硬件预取技术、由编译器控制的预取、编译器优化

18. 减少Cache 失效开销有哪些方法?

(1) 让读失效优先于写;

(2) 子块放置技术;

(3)请求字处理技术;

(4) 非阻塞Cache 或非锁定Cache 技术;

(5) 采用二级Cache 。

19. 子块放置技术的基本思想是什么?

把一个Cache 块划分为若干个小块,称之为子块。为每一个子块赋一位有效位,用于说明该子块中的数据是否有效。访问Cache 时,进行标识匹配比较,并检查该字所在子块的有效位是否为“1”。失效时只需从下一级存储器调入一个子块。这样,一个Cache 中就有可能有的子块有效,有的子块无效。

20. 请求字处理技术有哪两种具体的实现方法?

⑴ 尽早重启动: 在请求字没有到达时,CPU 处于等待状态。一旦请求字到达,就立即发送给CPU ,让等待的CPU 尽早重启动,继续执行

⑵ 请求字优先: 调块时,首先向存储器请求CPU 所要的请求字。请求字一旦到达,就立刻送往CPU ,让CPU 继续执行,同时从存储器调入该块的其余部分。请求字优先也称为回绕读取或关键字优先。

21. 采用二级Cache 的基本思想是什么?

通过在原有Cache 和存储器之间增加另一级Cache ,构成两级Cache 。把第一级Cache 做得足够小,使其速度和快速CPU 的时钟周期相匹配,而把第二级Cache 做得足够大,使它能捕获更多本来需要到主存去的访问,从而降低实际失效开销。

22. 采用容量小且结构简单的Cache 有什么好处?

(1)可以有效地提高Cache 的访问速度。因为硬件越简单,速度就越快。小容量Cache 可以实现快速标识检测,对减少命中时间有益。

(2)Cache 足够小,可以与处理器做在同一芯片上,以避免因芯片外访问而增加时间开销。

(3)保持Cache 结构简单可采用直接映象Cache 。直接映象Cache 的主要优点是可以让标识检测和数据传送重叠进行,这样可以有效地减少命中时间。

23. “虚拟索引+物理标识” Cache的基本思想是什么?

直接用虚地址中的页内位移(页内位移在虚→实地址的变换中保持不变)作为访问Cache 的索引,但标识却是物理地址。CPU 发出访存请求后,在进行虚→实地址变换的同时,可并行进行标识的读取。在完成地址变换之后,再把得到的物理地址与标识进行比较。

第六章 输入/输出系统

1. 评价I/O系统性能的参数主要有哪些?

2. 外部存储设备有哪些相似之处?

3. 磁盘始终占据着后备存储器的主宰地位,原因主要有哪两个?

4. 反映磁盘性能的主要参数有哪几个?

5. 将多台光盘机组合在一起有哪三种结构?

6. 自动磁带库有什么优缺点?

7. 根据故障产生的原因,将故障分为哪几种?

8. 按照故障出现的周期,将故障分为哪几种?

9. 反映存储外设可靠性能的参数有哪些?

10. 故障、错误和失效之间存在着什么样的关系?

11. 盘阵列有哪些分级?

12. 通道分为哪三种类型?它们分别适合为哪种外围设备服务?

13. 通道的主要功能有哪些?

14. 通道完成一次数据传输的主要过程?

1. 评价I/O系统性能的参数主要有哪些?

(1) 连接特性(哪些I/O设备可以和计算机系统相连接);

(2) I/O系统容量(I/O系统可以容纳的I/O设备数);

(3) 响应时间;

(3) 吞吐量。

2. 外部存储设备有哪些相似之处?

(1)记录原理类似;

(2)作为计算机部件,均包括磁、光、电等记录机构、精密机械和马达等驱动机构;

(3)作为存储设备,它们都包括控制器及接口逻辑;

(4)均采用了自同步技术、定位和校正技术以及相似的读写系统。

3. 磁盘始终占据着后备存储器的主宰地位,原因主要有哪两个?

(1)磁盘一直是虚拟存储器技术的物质基础,执行程序时,磁盘用作为交换缓冲区。

(2)关机时,磁盘作为操作系统和所有应用程序的非易失性的驻留介质。

4. 反映磁盘性能的主要参数有哪几个?

磁盘访问时间:磁盘访问时间 = 寻道时间 + 旋转时间 + 传输时间 + 控制器开销

磁盘容量:磁盘可以记录的信息量。

磁盘数据传输率:可分为外部传输率和内部传输率两种。

5. 将多台光盘机组合在一起有哪三种结构?

光盘塔(CD-ROM Tower)、光盘库(Jukebox )和光盘阵列(CD-ROM Array)

6. 自动磁带库有什么优缺点?

优点:自动换带,加载速度快,单位数据的价格低。并且,可以通过加大规模,以达到进一步降低成本的目的。

缺点:带宽比较低,可靠性差。

7. 根据故障产生的原因,将故障分为哪几种?

(1)硬件故障:设备失效产生的故障;

(2)设计故障:大部分的这种故障由软件引起,小部分由硬件引起;

(3)操作故障:由于用户操作的失误引起的故障;

(4)环境故障:由于火灾、洪水、地震等引起的故障。

8. 按照故障出现的周期,将故障分为哪几种?

暂时性故障:只持续有限的时间,并且以后不会出现。

间歇性故障:故障的出现具有间歇性。

永久性故障:故障总会出现,并不会因为时间的流逝而消失。

9. 反映存储外设可靠性能的参数有哪些?

可靠性:系统从初始状态开始一直提供服务的能力。

可用性:系统正常工作时间在连续两次正常服务间隔时间中所占的比率。

可信性:服务的质量,即在多大程度上可以合理地认为服务是可靠的。

10. 故障、错误和失效之间存在着什么样的关系?

(1)一个故障可能会导致一个或者多个错误;

(2)错误通常具有以下特性:

·错误具有两种状态:潜在状态和有效状态,并且会相互转换;

·潜在的错误可能通过激活而有效;

·有效错误的影响可以从一个部件传送到另外一个部件,产生新的错误。

(3)如果错误影响到部件正常的服务时,部件就发生了失效;

(4)系统中的所有部件的故障、错误和失效均存在这样的关系。

11. 盘阵列有哪些分级?

(1) RAID0。亦称数据分块,即把数据分布在多个盘上,无冗余信息。

(2) RAID1。镜像盘,使用双备份磁盘。

(3) RAID2。位交叉式海明编码阵列。

(4) RAID3。位交叉奇偶校验盘阵列。即数据以位或字节交叉的方式存于各盘,冗余的奇偶校验信息存储在一台专用盘上。

(5) RAID4。专用奇偶校验独立存取盘阵列。即数据以块(块大小可变) 交叉的方式存于各盘,冗余的奇偶校验信息存在一台专用盘上。

(6) RAID5。块交叉分布式奇偶校验盘阵列。即数据以块交叉的方式存于各盘,冗余的奇偶校验信息均匀地分布在所有磁盘上。

(7) RAID6。双维奇偶校验独立存取盘阵列。可容忍双盘出错。(8)RAID7。是采用Cache 和异步技术的RAID6,使响应速度和传输速率有了较大提高。

12. 通道分为哪三种类型?它们分别适合为哪种外围设备服务?

(1)字节多路通道。一种简单的共享通道,主要为多台低速或中速的外围设备服务。

(2)数组多路通道。适于为高速设备服务。

(3)选择通道。为多台高速外围设备服务。

13. 通道的主要功能有哪些?

(1) 接受CPU 发来的I/O指令,根据指令要求选择一台指定的外围设备与通道相连接。

(2) 执行CPU 为通道组织的通道程序,从主存中取出通道指令,对通道指令进行译码,并根据需要向被选中的设备控制器发出各种操作命令。

(3) 给出外围设备的有关地址,即进行读/写操作的数据所在的位置。

(4) 给出主存缓冲区的首地址,这个缓冲区用来暂时存放从外围设备上输入的数据,或者暂时存放将要输出到外围设备中去的数据。

(5) 控制外围设备与主存缓冲区之间数据交换的个数,对交换的数据个数进行计数,并判断数据传送工作是否结束。

(6) 指定传送工作结束时要进行的操作。

(7) 检查外围设备的工作状态是正常或故障。根据需要将设备的状态信息送往主存指定单元保存。

(8) 在数据传输过程中完成必要的格式变换。

14. 通道完成一次数据传输的主要过程?

(1) 在用户程序中使用访管指令进入管理程序,由CPU 通过管理程序组织一个通道程序,并启动通道。

(2) 通道处理机执行CPU 为它组织的通道程序,完成指定的数据I/O工作。

(3) 通道程序结束后向CPU 发中断请求。CPU 响应这个中断请求后,第二次进入操作系统,调用管理程序对I/O中断请求进行处理。

第七章 多处理机

1. Flynn分类法是根据什么对计算机进行分类的?将计算机分成哪几类?

2. 根据多处理机系统中处理器个数的多少,可把现有的MIMD 机器分为哪两类?

3. 在分布式存储器结构的机器中,将存储器分布到各结点有什么好处?

4. 在分布式存储器结构的机器中,目前有哪两种存储器地址空间的组织方案?

5. 在分布式存储器结构的机器中,对应于两种地址空间的组织方案,分别有哪两种通信机制?它们是怎么实现的?

6. 用哪三个关键的性能指标来衡量通信机制的性能?

7. 共享存储器通信机制主要有哪些优点?

8. 消息传递通信机制主要有哪些优点?

9. 在消息传递通信机制的硬件上怎样支持共享存储器?

10. 并行处理面临着哪两个重要挑战?

11. 一致的存储系统应满足哪些条件?

12. 实现Cache 一致性协议的关键是什么?

13. 实现Cache 一致性协议时,有哪两种跟踪共享数据状态的技术?

14. 实现Cache 一致性协议有哪两类?

15. 写更新协议和写作废协议在性能上有哪些差别?

16. 目录协议中,Cache 块有哪三种状态?

17. 影响互连网络性能的因素有哪些?

18. 动态连接网络有哪几种?

19. 采用多处理机的一致性机制实现旋转锁有什么好处?

1. Flynn分类法是根据什么对计算机进行分类的?将计算机分成哪几类?

Flynn 分类法,根据计算机中指令和数据的并行状况把计算机分成:

(1)单指令流单数据流(SISD );

(2)单指令流多数据流(SIMD );

(3)多指令流单数据流(MISD );

(4)多指令流多数据流(MIMD )。

2. 根据多处理机系统中处理器个数的多少,可把现有的MIMD 机器分为哪两类?

根据多处理机系统中处理器个数的多少,把现有的MIMD 机器分为:

第一类为集中式共享存储器结构;

第二类为分布式存储器结构;

每一类代表了一种存储器的结构和互连策略。

3. 在分布式存储器结构的机器中,将存储器分布到各结点有什么好处?

将存储器分布到各结点有两个好处:

第一,如果大多数的访问是针对本结点的局部存储器,则可降低对存储器和互连网络的带宽要求; 第二,对局部存储器的访问延迟低。分布式存储器结构最主要的缺点是处理器之间的通信较为复杂,且各处理器之间访问延迟较大。

4. 在分布式存储器结构的机器中,目前有哪两种存储器地址空间的组织方案?

(1) 第一种方案:物理上分离的多个存储器作为一个逻辑上共享的存储空间进行编址。

(2) 第二种方案:整个地址空间由多个独立的地址空间构成,它们在逻辑上也是独立的,远程的处理器不能对其直接寻址。

5. 在分布式存储器结构的机器中,对应于两种地址空间的组织方案,分别有哪两种通信机制?它们是怎么实现的?

(1)共享地址空间的机器:可利用Load 和Store 指令中的地址隐含地进行数据通信,因而可称为共享存储器机器。

(2) 多个地址空间的机器:根据简单的网络协议,通过传递消息来请求某些服务或传输数据,从而完成通信。因而这种机器常称为消息传递机器。

6. 用哪三个关键的性能指标来衡量通信机制的性能?

通信带宽:理想状态下的通信带宽受限于处理器、存储器和互连网络的带宽。

通信延迟:通信延迟=发送开销+跨越时间+传输延迟+接收开销

通讯延迟的隐藏:如何才能较好地将通信和计算或多次通信之间重叠起来。

7. 共享存储器通信机制主要有哪些优点?

(1) 与常用的集中式多处理机使用的通信机制兼容。

(2) 当处理器通信方式复杂或程序执行动态变化时,易于编程;同时在简化编译器设计方面占有优势。

(3) 当通信数据较小时,通信开销较低,带宽利用较好。

(4) 通过硬件控制的Cache 减少了远程通信的频度,减少了通信延迟以及对共享数据的访问冲突。

8. 消息传递通信机制主要有哪些优点?

(1) 硬件较简单。 (2) 通信是显式的,从而引起编程者和编译程序的注意,着重处理开销大的通信。

9. 在消息传递通信机制的硬件上怎样支持共享存储器?

所有对共享存储器的访问均要求操作系统提供地址转换和存储保护功能,即将存储器访问转换为消息的发送和接收。

10. 并行处理面临着哪两个重要挑战?

第一个是程序中有限的并行性。有限的并行性使机器要达到高的加速比十分困难。

第二个是相对较高的通信开销。

11. 一致的存储系统应满足哪些条件?

若一个存储系统满足以下三点,则称该存储系统是一致的:

(1) 处理器P 对X 单元进行一次写之后又对X 单元进行读,读和写之间没有其它处理器对X 单元

进行写,则读的返回值总是写进的值。

(2) 一个处理器对X 单元进行写之后,另一处理器对X 单元进行读,读和写之间无其它写,则读X 单元的返回值应为写进的值。

(3) 对同一单元的写是顺序化的,即任意两个处理器对同一单元的两次写,从所有处理器看来顺序都应是相同的。

12. 实现Cache 一致性协议的关键是什么?

关键是跟踪共享数据块的状态。目前有两类协议,它们采用了不同的共享数据状态跟踪技术。

13. 实现Cache 一致性协议时,有哪两种跟踪共享数据状态的技术?

(1) 目录:物理存储器中共享数据块的状态及相关信息均被保存在一个称为目录的地方。

(2) 监听:每个Cache 除了包含物理存储器中块的数据拷贝之外,也保存着各个块的共享状态信息。Cache 通常连在共享存储器的总线上,各个Cache 控制器通过监听总线来判断它们是否有总线上请求的数据块。

14. 实现Cache 一致性协议有哪两类?

(1) 写作废协议:在一个处理器写某个数据项之前保证它对该数据项有唯一的访问权。

(2) 写更新协议:当一个处理器写某数据项时,通过广播使其它Cache 中所有对应的该数据项拷贝进行更新。

15. 写更新协议和写作废协议在性能上有哪些差别?

(1) 对同一数据的多个写而中间无读操作的情况,写更新协议需进行多次写广播操作,而在写作废协议下只需一次作废操作。

(2) 对同一块中多个字进行写,写更新协议对每个字的写均要进行一次广播,而在写作废协议下仅在对本块第一次写时进行作废操作即可。写作废是针对Cache 块进行操作,而写更新则是针对字(或字节) 进行操作。

(3) 从一个处理器写到另一个处理器读之间的延迟通常在写更新模式中较低,因为它写数据时马上更新了相应的其它Cache 中的内容(假设读的处理器Cache 中有此数据) 。而在写作废协议中,需要读一个新的拷贝。

16. 目录协议中,Cache 块有哪三种状态?

共享:在一个或多个处理器上具有这个块的拷贝,且主存中的值是最新值(所有Cache 均相同) 。 未缓冲:所有处理器的Cache 都没有此块的拷贝。

专有:仅有一个处理器上有此块的拷贝,且已对此块进行了写操作,而主存的拷贝仍是旧的。这个处理器称为此块的拥有者。

17. 影响互连网络性能的因素有哪些?

(1) 功能特性——网络如何支持路由、中断处理、同步、请求/消息组合和一致性。

(2) 网络时延——单位消息通过网络传送时最坏情况下的时间延迟。

(3) 带宽——通过网络的最大数据传输率,用MB /s 表示。

(4) 硬件复杂性——诸如导线、开关、连接器、仲裁和接口逻辑等的造价。

(5 )可扩展性——在增加机器资源使性能可扩展的情况下,网络具备模块化可扩展的能力。

18. 动态连接网络有哪几种?

(1)总线。价格较低、带宽较窄 、容易产生故障。(2)交叉网络。价格昂贵、带宽和互连特性最好。 (3)多端口存储器结构。介于低成本低性能的总线系统和高成本高带宽的交叉开关系统之间。(4)多级网络。采用模块结构,扩展性较好;其时延随网络的级数而上升。

19. 采用多处理机的一致性机制实现旋转锁有什么好处?

第一,可使“环绕”的进程(不停测试请求锁的循环) 对本地Cache 块进行操作,而不用每次请求锁时必须先进行一次全局的存储器访问;

第二,可利用锁访问的局部性,即处理器最近使用过的锁不久又会使用,这种状况下锁可驻留在那个处理器的Cache 中,大大降低了请求的时间。

第一章 计算机体系结构的基本概念

1. 什么是计算机系统的多级层次结构?

2. 硬件和软件在什么意义上是等效的?在什么意义上是不等效的?

3. 经典计算机系统结构的实质是什么?

4. 语言实现的两种基本技术是什么?

5. 对于通用寄存器型机器来说,机器语言程序设计者所看到的计算机的属性主要有哪些?

6. 什么是软件兼容?软件兼容有几种?其中哪一种是软件兼容的根本特征?

7. 什么是系列机?它的出现较好地解决了什么矛盾?

8. 对计算机发展非常关键的实现技术有哪些?

9. 实现软件移植的主要途径有哪些?

10. 试以系列机为例,说明计算机系统结构、计算机组成和计算机实现三者之间的关系。

11. 存储程序计算机在系统结构上的主要特点是什么?

12. 从系统结构的发展情况看,新型系统结构的设计主要从哪两方面着手?

13. 软件技术两个最重要的发展趋势是什么?

14. 计算机系统设计人员的技术挑战主要来自哪几个方面?

15. 一种计算机系统结构的生命周期是怎样的?

16. 商品的标价(价格)由哪些因素构成?

17. 对计算机系统成本产生影响的主要因素有哪些?

18. 用户CPU 时间由哪三个因素决定?

19. 目前常用的测试程序分为哪五类?

20. 什么叫测试程序组件?在评价计算机系统设计时最常见的测试程序组件是哪个?

21. SPEC2000测试程序组件中包括哪几个测试程序组件?

22. 测试基于Microsoft 公司的Windows 系列操作系统平台的最常用测试组件有哪些?

23. 常用的专门的性能指标测试程序有哪些?

24. 计算机系统结构设计和分析中最经常使用的三条基本原则是什么?

25. 根据Amdahl 定律,系统加速比由哪两个因素决定?

26. 从执行程序的角度看,并行性等级从低到高可分为哪几级?

27. 从处理数据的角度,并行性等级从低到高可以分为哪几级?

28. 计算机系统中提高并行性的技术途径有哪三种?

29. 多机系统的耦合度可以分为哪几类?

30. 单机系统和多机系统中,都是按哪三种技术途径分别发展为哪三类多处理机?

31. 三种类型的多处理机(同构型多处理机、异构型多处理机、分布处理系统)的主要区别是什么?

1. 什么是计算机系统的多级层次结构?

从计算机语言的角度,把计算机系统按功能划分成以下多级层次结构:

2. 硬件和软件在什么意义上是等效的?在什么意义上是不等效的?

硬件和软件在功能实现上是等效的,即一种功能可以由软件实现,也可以由硬件实现。在实现性能上是不等效的。软件实现的优点是设计容易、改进简单;硬件实现的优点是速度快。

3. 经典计算机系统结构的实质是什么?

计算机系统中软硬件界面的确定,其界面之上的是软件的功能,界面之下的是硬件和固件的功能。

4. 语言实现的两种基本技术是什么?

翻译和解释是语言实现的两种基本技术。它们都是以执行一串N级指令来实现N+1级指令,但二者存在着差别:翻译技术是先把N+1级程序全部变换成N 级程序后,再去执行新产生的N 级程序,在执行过程中N+1级程序不再被访问。而解释技术是每当一条N+1级指令被译码后,就直接去执行一串等效的N 级指令,然后再去取下一条N+1级的指令,依此重复进行。在这个过程中不产生翻译出来的程序,因此解释过程是边变换边执行的过程。

5. 对于通用寄存器型机器来说,机器语言程序设计者所看到的计算机的属性主要有哪些?

(1) 数据表示

(2) 寻址规则

(3) 寄存器定义

(4) 指令集

(5) 中断系统

(6) 机器工作状态的定义和切换

(7) 存储系统

(8) 信息保护

(9) I/O结构

6. 什么是软件兼容?软件兼容有几种?其中哪一种是软件兼容的根本特征?

同一个软件可以不加修改地运行于系统结构相同的各档机器上,而且它们所获得的结果一样,差别只在于运行时间的不同。

软件兼容分为向上兼容、向下兼容、向前兼容和向后兼容。其中向后兼容是软件兼容的根本特征。

7. 什么是系列机?它的出现较好地解决了什么矛盾?

系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。它的出现较好地解决了软件要求环境稳定和硬件、器件技术迅速发展之间的矛盾。

8. 对计算机发展非常关键的实现技术有哪些?

(1) 逻辑电路;

(2) 半导体DRAM(动态随机访问存储器) ;

(3) 磁盘;

(4) 网络。

9. 实现软件移植的主要途径有哪些?

(1) 采用系列机方法

(2) 采用模拟与仿真方法

(3) 采用统一的高级语言

10. 试以系列机为例,说明计算机系统结构、计算机组成和计算机实现三者之间的关系。 计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。

一种系统结构可以有多种组成;一种组成可以有多种实现。同一系列机中各种型号的机器具有相同的系统结构,但采用不同的组成和实现技术,因而具有不同的性能和价格。

11. 存储程序计算机在系统结构上的主要特点是什么?

(1)机器以运算器为中心。

(2)采用存储程序原理。程序和数据放在同一存储器中,并且没有对两者加以区分。

(3)存储器是按地址访问的、线性编址的空间。

(4)控制流由指令流产生。

(5)指令由操作码和地址码组成。操作码指明本指令的操作类型,地址码指明操作数和操作结果的地址。

(6)数据以二进制编码表示,采用二进制运算。

12. 从系统结构的发展情况看,新型系统结构的设计主要从哪两方面着手?

新型系统结构的设计主要从以下两方面着手:

一方面是合理地增加计算机系统中硬件的功能比例,使系统结构对操作系统、高级语言甚至应用软件提供更多更好的支持;

另一方面则是通过多种途径提高计算机系统结构中的并行性等级,使得凡是能并行计算和处理的问题都能并行计算和处理,使这种系统结构和组成对算法提供更多更好的支持。

13. 软件技术两个最重要的发展趋势是什么?

(1) 程序及数据所使用存储器容量的不断增大;

(2) 高级语言的使用越来越广泛,在很多应用领域取代了汇编语言。

14. 计算机系统设计人员的技术挑战主要来自哪几个方面?

计算机系统设计人员的技术挑战主要来自系统结构、设计工具、制造工艺、软件、应用和经济等多个方面。

15. 一种计算机系统结构的生命周期是怎样的?

计算机的生命周期和系统中各个部分的发展密切相关。一种新的系统结构的诞生,往往以硬件为标志,它的发展和成熟,是以配套的系统软件和应用为标志的。一个计算机系统结构,从产生到消亡,大致需要15 ~20年的时间。

16. 商品的标价(价格)由哪些因素构成?

商品标价的构成因素:原料成本、直接成本、毛利和折扣。

17. 对计算机系统成本产生影响的主要因素有哪些?

对计算机系统成本产生影响的主要因素有时间、产量、商品化等因素。对成本产生最直接影响的是时间;产量是决定产品成本的第二个关键因素。

18. 用户CPU 时间由哪三个因素决定?

用户CPU 时间 = CPI × IC / 时钟频率

其中:CPI :指令时钟数

IC :程序执行过程中所处理的指令数

19. 目前常用的测试程序分为哪五类?

(1)实际应用程序;

(2)修正的(或者脚本化)应用程序;

(3)核心测试程序;

(4)小测试程序;

(5)合成测试程序。

20. 什么叫测试程序组件?在评价计算机系统设计时最常见的测试程序组件是哪个?

选择一组各个方面有代表性的测试程序,组成一个通用测试程序集合。这种测试程序集合称为测试程序组件。

在评价计算机系统设计时最常见的测试程序组件是基于UNIX 的SPEC ,其主要版本包括SPEC89、SPEC92、SPEC95和SPEC2000等。

21. SPEC2000测试程序组件中包括哪几个测试程序组件?

SPEC CPU2000:测试CPU ;

SPECviewperf :用于测试图形系统支持OpenGL 库的性能;

SPECapc :测试图形密集型应用的性能;

SPECSFS :基于NFS 文件系统的文件服务器测试程序;

SPECWeb :Web 服务器测试程序。

22. 测试基于Microsoft 公司的Windows 系列操作系统平台的最常用测试组件有哪些? PCMark04包括中央处理器测试组、内存测试组、图形芯片测试组、硬盘测试组等。

Business Winstone 2004主要用于测试计算机系统商业应用的综合性能。

Multimedia Content Creation Winstone 2004主要用于测试计算机系统多媒体应用的综合性能。 SiSoft Sandra Pro 2004是一套功能强大的系统分析评比工具,拥有超过30种以上的分析与测试模组,主要包括有CPU 、存储器、I/O接口、I/O设备、主板等。

23. 常用的专门的性能指标测试程序有哪些?

3DMark03主要测试显卡性能和DirectX 的性能。

Prime95是用来估计分布式计算程序的通信情况,可使计算机高负荷运转,所以也用来测试计算机的稳定性。

SuperPi/SuperE是计算圆周率π/自然指数e 的软件,通常用来测试CPU 的稳定性。

24. 计算机系统结构设计和分析中最经常使用的三条基本原则是什么?

(1)大概率事件优先原则。对于大概率事件(最常见的事件) ,赋予它优先的处理权和资源使用权,以获得全局的最优结果。

(2)Amdahl 定律 。加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

(3)程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

25. 根据Amdahl 定律,系统加速比由哪两个因素决定?

系统加速比依赖于两个因素:

(1)可改进比例:可改进部分在原系统计算时间中所占的比例。

(2)部件加速比:可改进部分改进以后的性能提高。

26. 从执行程序的角度看,并行性等级从低到高可分为哪几级?

从执行程序的角度看,并行性等级从低到高可分为:

(1)指令内部并行:指令内部的微操作之间的并行。

(2)指令级并行:并行执行两条或多条指令。

(3)任务级或过程级并行:并行执行两个或多个过程或任务(程序段) 。

(4)作业或程序级并行:在多个作业或程序间的并行。

27. 从处理数据的角度,并行性等级从低到高可以分为哪几级?

从处理数据的角度,并行性等级从低到高可以分为:

(1)字串位串:同时只对一个字的一位进行处理。

(2)字串位并:同时对一个字的全部位进行处理。

(3)字并位串:同时对许多字的同一位(称位片)进行处理。

(4)全并行:同时对许多字的全部或部分位进行处理。

28. 计算机系统中提高并行性的技术途径有哪三种?

(1)时间重叠:多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

(2)资源重复:通过重复设置资源,尤其是硬件资源,大幅度提高计算机系统的性能。

(3)资源共享:是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。

29. 多机系统的耦合度可以分为哪几类?

(1)最低耦合:除通过某种中间存储介质之外,各计算机之间没有物理连接,也无共享的联机硬件资源。

(2)松散耦合:通过通道或通信线路实现计算机间互连,共享某些外围设备,机间的相互作用是在文件或数据集一级进行。

(3)紧密耦合:机间物理连接的频带较高,往往通过总线或高速开关实现互连,可以共享主存。

30. 单机系统和多机系统中,都是按哪三种技术途径分别发展为哪三类多处理机?

单机系统和多机系统中,都是按时间重叠、资源重复和资源共享三种技术途径,分别发展为同构型多处理机、异构型多处理机、分布处理系统。

31. 三种类型的多处理机(同构型多处理机、异构型多处理机、分布处理系统)的主要区别是什么?

主要区别:

第二章 计算机指令集结构设计

1. 通常可按哪五个因素对计算机指令集结构进行分类?

2. 在对计算机指令集结构进行分类的五个因素中,哪一种是各种指令集结构之间最主要的区别?

3. 根据CPU 内部存储单元类型,可将指令集结构分为哪几类?

4. 堆栈型指令集结构、累加器型指令集结构和通用寄存器型指令集结构分别有什么优缺点?

5. 现代大多数机器均采用通用寄存器型指令集结构,为什么?

6. 通用寄存器型指令集结构可细分为哪三类?

7. 三种通用寄存器型指令集结构分别有什么优缺点?

8. 从当前的计算机技术观点来看,CISC 结构有什么缺点?

9. 增强CISC 机器的指令功能主要从哪几方面着手?

10. RISC的设计原则是什么?

11. RISC和CISC 处理机的指令系统结构在指令格式、寻址方式和每条指令的周期数(CPI )三方面有哪些区别?

12. 计算机指令集结构设计所涉及的内容有哪些?

13. 指令中有哪两种表示操作数类型的方法?

14.指令中表示寻址方式的主要方法有哪些?

15. 指令集格式设计中选择表示寻址方式的方法的依据是什么?

16. 指令集结构中采用多种寻址方式有何优缺点?

17. 在控制指令中使用PC 相对寻址方式有什么优点?

18. 在指令集格式的设计时,通常可选择哪几种指令格式?

19. DLX中有哪些寄存器?

20. DLX有哪几种数据类型?

21. DLX采用哪几种寻址方式?

1. 通常可按哪五个因素对计算机指令集结构进行分类?

(1) 在CPU 中操作数的存储方法;

(2) 指令中显式表示的操作数个数;

(3) 操作数的寻址方式;

(4) 指令集所提供的操作类型;

(5) 操作数的类型和大小。

2. 在对计算机指令集结构进行分类的五个因素中,哪一种是各种指令集结构之间最主要的区别?

CPU 中操作数的存储方法,即在CPU 中用来存储操作数的存储单元的类型,是各种指令集结构之间最主要的区别。

3. 根据CPU 内部存储单元类型,可将指令集结构分为哪几类?

堆栈型指令集结构、累加器型指令集结构、通用寄存器型指令集结构

4. 堆栈型指令集结构、累加器型指令集结构和通用寄存器型指令集结构分别有什么优缺点?

5. 现代大多数机器均采用通用寄存器型指令集结构,为什么?

主要有两个方面的原因,一是寄存器和CPU 内部其他存储单元一样,要比存储器快;其次是对编译器而言,可以更加容易、有效地分配和使用寄存器。

6. 通用寄存器型指令集结构可细分为哪三类?

寄存器-寄存器型

寄存器-存储器型

存储器-存储器型

7. 三种通用寄存器型指令集结构分别有什么优缺点?

8. 从当前的计算机技术观点来看,CISC 结构有什么缺点?

(1)CISC 结构的指令系统中,各种指令的使用频率相差悬殊。

(2)CISC 结构指令系统的复杂性带来了计算机系统结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。

(3)CISC 结构指令系统的复杂性给VLSI 设计增加了很大负担,不利于单片集成。

(4)CISC 结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。

(5)在CISC 结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计算机系统结构技术来提高系统的性能。

9. 增强CISC 机器的指令功能主要从哪几方面着手?

(1) 面向目标程序增强指令功能;

(2) 面向高级语言和编译程序改进指令系统;

(3) 面向操作系统的优化实现改进指令系统。

10. RISC的设计原则是什么?

(1)选取使用频率最高的指令,并补充一些最有用的指令;

(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;

(3)所有指令长度均相同;

(4)只有Load 和Store 操作指令才访问存储器,其它指令操作均在寄存器之间进行;

(5)以简单有效的方式支持高级语言。

11. RISC和CISC 处理机的指令系统结构在指令格式、寻址方式和每条指令的周期数(CPI )三方面有哪些区别?

12. 计算机指令集结构设计所涉及的内容有哪些?

(1) 指令集功能设计:主要有RISC 和CISC 两种技术发展方向

(2) 寻址方式的设计

(3) 操作数表示和操作数类型

(4) 寻址方式的表示:可以将寻址方式编码于操作码中,也可以将寻址方式作为一个单独的域来表示。

(5) 指令集格式的设计:有变长编码格式、固定长度编码格式和混合型编码格式三种。

13. 指令中有哪两种表示操作数类型的方法?

(1)操作数的类型由操作码的编码指定,这是最常见的一种方法;

(2)数据可以附上由硬件解释的标记,由这些标记指定操作数的类型,从而选择适当的运算。

14.指令中表示寻址方式的主要方法有哪些?

表示寻址方式有两种常用的方法:

(1)将寻址方式编于操作码中,操作码在描述指令功能的同时也描述了相应的寻址方式。这种方式译码快,但操作码和寻址方式的结合不仅增加了指令的条数,导致了指令的多样性,而且增加了CPU 对指令译码的难度。

(2)为每个操作数设置一个地址描述符,由该地址描述符表示相应操作数的寻址方式。这种方式译码较慢,但操作码和寻址独立,易于指令扩展。

15. 指令集格式设计中选择表示寻址方式的方法的依据是什么?

主要由指令集结构所采用的寻址方式种类及其适用范围,以及操作码与寻址方式之间的独立程度来决定。

如果某些指令集结构的指令有1~5个操作数,每个操作数有10种寻址方式,对于这种大规模的操作数和寻址方式组合,通常采用增设地址描述符的方法来描述寻址方式。

对诸如Load/Store类型指令集结构的指令,由于只有1~3个操作数,而且只有有限几种寻址方式。通常将寻址方式编码于操作码中。

16. 指令集结构中采用多种寻址方式有何优缺点?

在指令集结构中采用多种寻址方式可以显著地减少程序的指令条数;但同时也可能增加实现的复杂度和使用这些寻址方式的指令的执行时钟周期数(CPI )。

17. 在控制指令中使用PC 相对寻址方式有什么优点?

(1) 有效地缩短指令中表示目标地址的字段的长度;

(2) 使得代码在执行时与它被载入的位置无关。

18. 在指令集格式的设计时,通常可选择哪几种指令格式?

(1) 变长编码格式。这种编码方式可以有效减少程序的目标代码大小。

(2) 固定长度编码格式。这种编码方式可以降低译码的复杂度,提高译码的性能。

(3) 混合型编码格式。兼顾降低目标代码长度和降低译码复杂度。

19. DLX中有哪些寄存器?

(1)32个通用寄存器;

(2)32个浮点寄存器;

(3)一些特别的寄存器。

20. DLX有哪几种数据类型?

多种长度的整型数据和浮点数据。

(1)整型数据:8位、16位和32位多种长度。

(2)浮点数据:32位单精度浮点数和64位双精度浮点数。

21. DLX采用哪几种寻址方式?

寄存器寻址、立即值寻址、偏移寻址和寄存器间接寻址

第三章 流水线技术

1. 流水技术有哪些特点?

2. 按照流水线所完成的功能来分,流水线可分为哪两类?

3. 按照同一时间内各段之间的连接方式来分,流水线可分为哪两类?

4. 按照流水的级别来分,流水线可分为哪三类?

5. 按照数据表示来分,流水线可分为哪两类?

6. 按照流水线中是否有反馈回路来分,流水线可分为哪两类?

7. 一条DLX 指令的执行需要几个时钟周期?它们分别是什么?

8. DLX流水线寄存器的作用是什么?

9. 消除流水线的瓶颈段有哪些方法?

10. 评价流水线的性能指标是什么?

11. 流水线中有哪三种相关?各是什么原因造成的?

12. 解决流水线结构相关的方法有哪些?

13. 为什么流水线设计者有时会允许结构相关的存在?

14. 定向技术的主要思想是什么?

15. DLX流水线中所有数据相关都可以通过定向技术消除,而不需要暂停吗?试举例说明。

16.根据指令对寄存器的读写顺序,可将数据相关分为哪三种类型?

17.解决流水线数据相关的方法有哪些?

18. 减少流水线处理分支指令时的暂停时钟周期数有哪两种途径?

19. 在DLX 基本流水线中可采用哪些静态方法降低分支损失?

20.从编译技术的角度,降低流水线分支损失的方法有哪些?

21. 预测分支失败方法的主要思想是什么?

22. “延迟分支”方法的主要思想是什么?

23.为了在分支延迟槽中填入有效指令,一般采用哪三种方法?

24. 调度分支延迟指令的三种常用方法的特点和局限性是什么?

25.有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?

26.什么是向量链接技术?

27. 衡量向量处理机性能的主要参数有哪些?

1. 流水技术有哪些特点?

(1)流水过程由多个相联系的子过程组成,每个过程称为流水线的“级”或“段”;

(2)每个子过程由专用的功能段实现;

(3)各个功能段所需时间应尽量相等;

(4)流水线需要有“通过时间”,在此之后流水过程才进入稳定工作状态,每一个时钟周期(拍) 流出一个结果;

(5)流水技术适合于大量重复的时序过程,只有在输入端能连续地提供任务,流水线的效率才能充分发挥。

2. 按照流水线所完成的功能来分,流水线可分为哪两类?

(1)单功能流水线:只能完成一种固定功能的流水线。

(2)多功能流水线:流水线的各段可以进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。

3. 按照同一时间内各段之间的连接方式来分,流水线可分为哪两类?

(1)静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。

(2)动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。

4. 按照流水的级别来分,流水线可分为哪三类?

(1)部件级流水线(运算操作流水线):把处理机的算术逻辑部件分段,以便为各种数据类型进行流水操作。

(2)处理机级流水线(指令流水线):把解释指令的过程按照流水方式处理。

(3)处理机间流水线(宏流水线):由两个以上的处理机串行地对同一数据流进行处理,每个处理机完成一项任务。

5. 按照数据表示来分,流水线可分为哪两类?

(1)标量流水处理机:处理机不具有向量数据表示,仅对标量数据进行流水处理。

(2)向量流水处理机:处理机具有向量数据表示,并通过向量指令对向量的各元素进行处理。

6. 按照流水线中是否有反馈回路来分,流水线可分为哪两类?

(1)线性流水线:流水线的各段串行连接,没有反馈回路。

(2)非线性流水线:流水线中除有串行连接的通路处,还有反馈回路。

7. 一条DLX 指令的执行需要几个时钟周期?它们分别是什么?

一条DLX 指令的执行需要5个时钟周期。它们分别是:取指令周期(IF )、指令译码/读寄存器周期(ID )、执行/有效地址计算周期(EX )、存储器/分之完成周期(MEM )、写回周期(WB )。

8. DLX流水线寄存器的作用是什么?

把数据和控制信息从一个流水段传送到下一个流水段。

9. 消除流水线的瓶颈段有哪些方法?

(1) 细分瓶颈段;

(2) 重复设置瓶颈段。

10. 评价流水线的性能指标是什么?

(1) 吞吐率:指在单位时间内流水线所完成的任务数或输出结果的数量。

(2) 流水线的加速比:指m 段流水线的速度与等功能的非流水线的速度之比。

(3) 效率:指流水线的设备利用率。

11. 流水线中有哪三种相关?各是什么原因造成的?

(1)结构相关:当硬件资源满足不了指令重叠执行的要求, 而发生资源冲突时, 就发生了结构相关。

(2)数据相关:当一条指令需要用到前面指令的执行结果,而这些指令均在流水线中重叠执行时,就可能引起数据相关。

(3)控制相关:当流水线遇到分支指令和其它能够改变PC 值的指令时,就会发生控制相关。

12. 解决流水线结构相关的方法有哪些?

(1)流水化功能单元;(2)资源重复;(3)暂停流水线。

13. 为什么流水线设计者有时会允许结构相关的存在?

主要有两个原因:一是为了减少硬件开销,二是为了减少功能单元的延迟。

14. 定向技术的主要思想是什么?

在发生数据相关时,后面的指令并不是马上就要用到前一条指令的计算结果。如果能够将计算结果从其产生的地方直接送到需要它的地方,就可以避免暂停。当定向硬件检测到前面某条指令的结果寄存器就是当前指令的源寄存器时,控制逻辑会将前面那条指令的结果直接从其产生的地方定向到当前指令所需的位置。

15. DLX流水线中所有数据相关都可以通过定向技术消除,而不需要暂停吗?试举例说明。 DLX 流水线中有需要暂停的数据相关。

例:在下列指令序列中,需要在LW 指令之后插入一个暂停周期,然后再用定向技术消除相关。 LW R1 , 0(R2)

SUB R4 , R1 ,R5

AND R6 , R1 ,R7

16.根据指令对寄存器的读写顺序,可将数据相关分为哪三种类型?

(1)写后读相关

(2)写后写相关

(3)读后写相关

17.解决流水线数据相关的方法有哪些?

(1)定向技术:在某条指令产生一个结果之前,其他指令并不真正需要该计算结果,如果将该计结果从其产生的地方直接送到其他指令需要它的地方,就可以避免暂停。

(2)暂停技术:设置一个“流水线互锁”的功能部件,一旦流水线互锁检测到数据相关,流水线暂停执行发生数据相关指令后续的所有指令。直到该数据相关解决为止。

(3)采用编译器调度。

(4)重新组织代码顺序。

18. 减少流水线处理分支指令时的暂停时钟周期数有哪两种途径?

(1) 在流水线中尽早判断出分支转移是否成功;

(2) 尽早计算出分支转移成功时的PC 值(即分支的目标地址)。

19. 在DLX 基本流水线中可采用哪些静态方法降低分支损失?

(1) 修改硬件:在ID 段增加一个加法器,将计算分支目标地址的操作移到ID 段完成。

(2) 预测分支失败的方法

(3) 延迟分支方法

20.从编译技术的角度,降低流水线分支损失的方法有哪些?

(1) 冻结或排空流水线的方法;

(2) 预测分支失败的方法;

(3) 预测分支成功的方法;

(4) 延迟分支方法。

21. 预测分支失败方法的主要思想是什么?

当流水线译码到一条分支指令时,流水线继续取指令,并允许该分支指令后的指令继续在流水线中流动。当流水线确定分支转移成功与否以及分支的目标地址之后,如果分支转移成功,流水线必须将在分支指令之后取出的所有指令转化为空操作,并在分支的目标地址处重新取出有效的指令;如果分支转移失败,那么可以将分支指令看作是一条普通指令,流水线正常流动,无需将在分支指令之后取出的所有指令转化为空操作。

22. “延迟分支”方法的主要思想是什么?

其主要思想是从逻辑上“延长”分支指令的执行时间。设延迟长度为n 的分支指令后面有n 个分支延迟槽,选择n 条有效和有用的指令放入分支延迟槽中,无论分支成功与否,流水线都会执行这些指令。处于分支延迟槽中的指令“掩盖”了流水线原来所必须插入的暂停周期。

23.为了在分支延迟槽中填入有效指令,一般采用哪三种方法?

从前调度、从目标处调度、从失败处调度

24. 调度分支延迟指令的三种常用方法的特点和局限性是什么?

25.有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?

(1) 水平处理方式:不适合对向量进行流水处理。

(2) 垂直处理方式:适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入、输出端直接与存储器相联,构成M-M 型的运算流水线。

(3) 分组处理方式:适合流水处理。可设长度为n 的向量寄存器,使每组向量运算的源/目向量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成R-R 型运算流水线。

26.什么是向量链接技术?

当两条向量指令出现“写后读”相关时,若它们不存在功能部件冲突和向量寄存器(源或目的) 冲突,就有可能把它们所用的功能部件头尾相接,形成一个链接流水线,进行流水处理。

27. 衡量向量处理机性能的主要参数有哪些?

(1) 向量指令的处理时间

(2) 峰值性能:向量长度为无穷大时,向量处理机的最高性能。

(3) 半性能向量长度:向量处理机的性能为其峰值性能一半时所需的向量长度。

(4) 向量长度临界值:对同一段程序代码而言,向量方式的处理速度优于标量串行方式处理速度时所需的最小向量长度。

第五章 存储层次

1. 单级存储器的主要矛盾是什么?通常采取什么方法来解决?

2. 评价存储层次的主要参数有哪些?

3. “Cache —主存”和“主存—辅存”层次的主要区别是什么?

4. 在存储层次中应解决哪四个问题?

5. 地址映象方法有哪几种?它们各有什么优缺点?

6. 组相联Cache 比相同容量的直接映象Cache 的失效率低。由此是否可以得出结论:采

7. Cache中,有哪两种实现并行查找的方法?

8. 替换算法有哪几种?它们各有什么优缺点?

9. 写策略主要有哪两种?它们各有什么优点?

10. 在写回法中,可采用什么方法减少在替换时块的写回?

11. 当发生Cache 写失效时,是否调入相应的块,有哪两种选择?

12. 按照Cache 产生失效的原因不同,可以把失效分为哪三类?

13. 3C失效与Cache 的相联度、容量有什么样的关系?

14. 增加Cache 块大小一定会降低失效率吗?

15.伪相联的基本思想是什么?

16.伪相联的优点是什么?

17. 降低Cache 失效率有哪些方法?

18. 减少Cache 失效开销有哪些方法?。

19. 子块放置技术的基本思想是什么?

20. 请求字处理技术有哪两种具体的实现方法?

21. 采用二级Cache 的基本思想是什么?

22. 采用容量小且结构简单的Cache 有什么好处?

23. “虚拟索引+物理标识” Cache的基本思想是什么?

1. 单级存储器的主要矛盾是什么?通常采取什么方法来解决?

主要矛盾:

(1) 速度越快,每位价格就越高;

(2) 容量越大,每位价格就越低;

(3) 容量越大,速度越慢。

采取多级存储层次方法来解决。

2. 评价存储层次的主要参数有哪些?

存储层次的平均每位价格、命中率或失效率、平均访问时间

3. “Cache —主存”和“主存—辅存”层次的主要区别是什么?

4. 在存储层次中应解决哪四个问题?

(1)映象规则:当把一个块调入高一层存储器时,可以放到哪些位置上?

(2)查找算法:当所要访问的块在高一层存储器中时,如何找到该块?

(3)替换算法:当发生失效时,应替换哪一块?

(4)写策略:当进行写访问时,应进行哪些操作?

5. 地址映象方法有哪几种?它们各有什么优缺点?

(1)全相联映象。实现查找的机制复杂,代价高,速度慢。Cache 空间的利用率较高,块冲突概率较低,因而Cache 的失效率也低。

(2)直接映象。实现查找的机制简单,速度快。Cache 空间的利用率较低,块冲突概率较高,因而Cache 的失效率也高。

(3)组相联映象。组相联是直接映象和全相联的一种折衷。

6. 组相联Cache 比相同容量的直接映象Cache 的失效率低。由此是否可以得出结论:采用组相联Cache 一定能带来性能上的提高?为什么?

不一定。因为组相联命中率的提高是以增加命中时间为代价的,组相联需要增加多路选择开关。

7. Cache中,有哪两种实现并行查找的方法?

(1)用相联存储器实现;

(2)用单体多字存储器和比较器来实现。

8. 替换算法有哪几种?它们各有什么优缺点?

(1)随机法。简单、易于用硬件实现,但这种方法没有考虑Cache 块过去被使用的情况,反映不了程序的局部性,所以其失效率比LRU 的高。

(2)先进先出法。容易实现。它虽然利用了同一组中各块进入Cache 的顺序这一“历史”信息,但还是不能正确地反映程序的局部性。

(3)最近最少使用法LRU 。 失效率最低。但是LRU 比较复杂,硬件实现比较困难。

9. 写策略主要有哪两种?它们各有什么优点?

(1) 写直达法。 易于实现,而且下一级存储器中的数据总是最新的。

(2) 写回法。速度快,写操作能以Cache 存储器的速度进行。而且对于同一单元的多个写最后只需一次写回下一级存储器,有些“写”只到达Cache ,不到达主存,因而所使用的存储器频带较低。

10. 在写回法中,可采用什么方法减少在替换时块的写回?

常采用“污染位”标志。即为Cache 中的每一块设置一个“污染位”(设在与该块相应的目录表项中),用于指出该块是“脏”的(被修改过)还是干净的(没被修改过)。替换时,若被替换的块是干净的,则不必写回下一级存储器,因为这时下一级存储器中相应块的内容与Cache 中的一致。

11. 当发生Cache 写失效时,是否调入相应的块,有哪两种选择?

按写分配法:写失效时,先把所写单元所在的块调入Cache ,然后再进行写入。这种方法也称为写时取方法。

不按写分配法:写失效时,直接写入下一级存储器而不将相应的块调入Cache 。这种方法也称为绕写法。

12. 按照Cache 产生失效的原因不同,可以把失效分为哪三类?

强制性失效、容量失效、冲突失效

13. 3C失效与Cache 的相联度、容量有什么样的关系?

⑴ 相联度越高,冲突失效就越少;

⑵ 强制性失效和容量失效不受相联度的影响;

⑶ 强制性失效不受Cache 容量的影响,但容量失效却随着容量的增加而减少;

⑷ 2:1的Cache 经验规则:大小为N 的直接映象Cache 的失效率约等于大小为N/2的两路组相联Cache 的失效率。

14. 增加Cache 块大小一定会降低失效率吗?

不一定。

对于给定的Cache 容量,当块大小增加时,失效率开始是下降,后来反而上升了。主要因为增加块大小会产生双重作用。一方面它减少了强制性失效;另一方面,可能会增加冲突失效。

15.伪相联的基本思想是什么?

采用这种方法时,在命中情况下,访问Cache 的过程和直接映象Cache 中的情况相同;而发生失效时,在访问下一级存储器之前,会先检查Cache 另一个位置(块),看是否匹配。确定这个另一块的一种简单的方法是将索引字段的最高位取反,然后按照新索引去寻找伪相联组中的对应块。如果这一块的标识匹配,则称发生了伪命中。否则,就只好访问下一级存储器。

16.伪相联的优点是什么?

伪相联既能获得多路组相联Cache 的低失效率又能保持直接映象Cache 的命中速度。

17. 降低Cache 失效率有哪些方法?

增加Cache 块大小、提高相联度、Victim Cache 、伪相联Cache 、硬件预取技术、由编译器控制的预取、编译器优化

18. 减少Cache 失效开销有哪些方法?

(1) 让读失效优先于写;

(2) 子块放置技术;

(3)请求字处理技术;

(4) 非阻塞Cache 或非锁定Cache 技术;

(5) 采用二级Cache 。

19. 子块放置技术的基本思想是什么?

把一个Cache 块划分为若干个小块,称之为子块。为每一个子块赋一位有效位,用于说明该子块中的数据是否有效。访问Cache 时,进行标识匹配比较,并检查该字所在子块的有效位是否为“1”。失效时只需从下一级存储器调入一个子块。这样,一个Cache 中就有可能有的子块有效,有的子块无效。

20. 请求字处理技术有哪两种具体的实现方法?

⑴ 尽早重启动: 在请求字没有到达时,CPU 处于等待状态。一旦请求字到达,就立即发送给CPU ,让等待的CPU 尽早重启动,继续执行

⑵ 请求字优先: 调块时,首先向存储器请求CPU 所要的请求字。请求字一旦到达,就立刻送往CPU ,让CPU 继续执行,同时从存储器调入该块的其余部分。请求字优先也称为回绕读取或关键字优先。

21. 采用二级Cache 的基本思想是什么?

通过在原有Cache 和存储器之间增加另一级Cache ,构成两级Cache 。把第一级Cache 做得足够小,使其速度和快速CPU 的时钟周期相匹配,而把第二级Cache 做得足够大,使它能捕获更多本来需要到主存去的访问,从而降低实际失效开销。

22. 采用容量小且结构简单的Cache 有什么好处?

(1)可以有效地提高Cache 的访问速度。因为硬件越简单,速度就越快。小容量Cache 可以实现快速标识检测,对减少命中时间有益。

(2)Cache 足够小,可以与处理器做在同一芯片上,以避免因芯片外访问而增加时间开销。

(3)保持Cache 结构简单可采用直接映象Cache 。直接映象Cache 的主要优点是可以让标识检测和数据传送重叠进行,这样可以有效地减少命中时间。

23. “虚拟索引+物理标识” Cache的基本思想是什么?

直接用虚地址中的页内位移(页内位移在虚→实地址的变换中保持不变)作为访问Cache 的索引,但标识却是物理地址。CPU 发出访存请求后,在进行虚→实地址变换的同时,可并行进行标识的读取。在完成地址变换之后,再把得到的物理地址与标识进行比较。

第六章 输入/输出系统

1. 评价I/O系统性能的参数主要有哪些?

2. 外部存储设备有哪些相似之处?

3. 磁盘始终占据着后备存储器的主宰地位,原因主要有哪两个?

4. 反映磁盘性能的主要参数有哪几个?

5. 将多台光盘机组合在一起有哪三种结构?

6. 自动磁带库有什么优缺点?

7. 根据故障产生的原因,将故障分为哪几种?

8. 按照故障出现的周期,将故障分为哪几种?

9. 反映存储外设可靠性能的参数有哪些?

10. 故障、错误和失效之间存在着什么样的关系?

11. 盘阵列有哪些分级?

12. 通道分为哪三种类型?它们分别适合为哪种外围设备服务?

13. 通道的主要功能有哪些?

14. 通道完成一次数据传输的主要过程?

1. 评价I/O系统性能的参数主要有哪些?

(1) 连接特性(哪些I/O设备可以和计算机系统相连接);

(2) I/O系统容量(I/O系统可以容纳的I/O设备数);

(3) 响应时间;

(3) 吞吐量。

2. 外部存储设备有哪些相似之处?

(1)记录原理类似;

(2)作为计算机部件,均包括磁、光、电等记录机构、精密机械和马达等驱动机构;

(3)作为存储设备,它们都包括控制器及接口逻辑;

(4)均采用了自同步技术、定位和校正技术以及相似的读写系统。

3. 磁盘始终占据着后备存储器的主宰地位,原因主要有哪两个?

(1)磁盘一直是虚拟存储器技术的物质基础,执行程序时,磁盘用作为交换缓冲区。

(2)关机时,磁盘作为操作系统和所有应用程序的非易失性的驻留介质。

4. 反映磁盘性能的主要参数有哪几个?

磁盘访问时间:磁盘访问时间 = 寻道时间 + 旋转时间 + 传输时间 + 控制器开销

磁盘容量:磁盘可以记录的信息量。

磁盘数据传输率:可分为外部传输率和内部传输率两种。

5. 将多台光盘机组合在一起有哪三种结构?

光盘塔(CD-ROM Tower)、光盘库(Jukebox )和光盘阵列(CD-ROM Array)

6. 自动磁带库有什么优缺点?

优点:自动换带,加载速度快,单位数据的价格低。并且,可以通过加大规模,以达到进一步降低成本的目的。

缺点:带宽比较低,可靠性差。

7. 根据故障产生的原因,将故障分为哪几种?

(1)硬件故障:设备失效产生的故障;

(2)设计故障:大部分的这种故障由软件引起,小部分由硬件引起;

(3)操作故障:由于用户操作的失误引起的故障;

(4)环境故障:由于火灾、洪水、地震等引起的故障。

8. 按照故障出现的周期,将故障分为哪几种?

暂时性故障:只持续有限的时间,并且以后不会出现。

间歇性故障:故障的出现具有间歇性。

永久性故障:故障总会出现,并不会因为时间的流逝而消失。

9. 反映存储外设可靠性能的参数有哪些?

可靠性:系统从初始状态开始一直提供服务的能力。

可用性:系统正常工作时间在连续两次正常服务间隔时间中所占的比率。

可信性:服务的质量,即在多大程度上可以合理地认为服务是可靠的。

10. 故障、错误和失效之间存在着什么样的关系?

(1)一个故障可能会导致一个或者多个错误;

(2)错误通常具有以下特性:

·错误具有两种状态:潜在状态和有效状态,并且会相互转换;

·潜在的错误可能通过激活而有效;

·有效错误的影响可以从一个部件传送到另外一个部件,产生新的错误。

(3)如果错误影响到部件正常的服务时,部件就发生了失效;

(4)系统中的所有部件的故障、错误和失效均存在这样的关系。

11. 盘阵列有哪些分级?

(1) RAID0。亦称数据分块,即把数据分布在多个盘上,无冗余信息。

(2) RAID1。镜像盘,使用双备份磁盘。

(3) RAID2。位交叉式海明编码阵列。

(4) RAID3。位交叉奇偶校验盘阵列。即数据以位或字节交叉的方式存于各盘,冗余的奇偶校验信息存储在一台专用盘上。

(5) RAID4。专用奇偶校验独立存取盘阵列。即数据以块(块大小可变) 交叉的方式存于各盘,冗余的奇偶校验信息存在一台专用盘上。

(6) RAID5。块交叉分布式奇偶校验盘阵列。即数据以块交叉的方式存于各盘,冗余的奇偶校验信息均匀地分布在所有磁盘上。

(7) RAID6。双维奇偶校验独立存取盘阵列。可容忍双盘出错。(8)RAID7。是采用Cache 和异步技术的RAID6,使响应速度和传输速率有了较大提高。

12. 通道分为哪三种类型?它们分别适合为哪种外围设备服务?

(1)字节多路通道。一种简单的共享通道,主要为多台低速或中速的外围设备服务。

(2)数组多路通道。适于为高速设备服务。

(3)选择通道。为多台高速外围设备服务。

13. 通道的主要功能有哪些?

(1) 接受CPU 发来的I/O指令,根据指令要求选择一台指定的外围设备与通道相连接。

(2) 执行CPU 为通道组织的通道程序,从主存中取出通道指令,对通道指令进行译码,并根据需要向被选中的设备控制器发出各种操作命令。

(3) 给出外围设备的有关地址,即进行读/写操作的数据所在的位置。

(4) 给出主存缓冲区的首地址,这个缓冲区用来暂时存放从外围设备上输入的数据,或者暂时存放将要输出到外围设备中去的数据。

(5) 控制外围设备与主存缓冲区之间数据交换的个数,对交换的数据个数进行计数,并判断数据传送工作是否结束。

(6) 指定传送工作结束时要进行的操作。

(7) 检查外围设备的工作状态是正常或故障。根据需要将设备的状态信息送往主存指定单元保存。

(8) 在数据传输过程中完成必要的格式变换。

14. 通道完成一次数据传输的主要过程?

(1) 在用户程序中使用访管指令进入管理程序,由CPU 通过管理程序组织一个通道程序,并启动通道。

(2) 通道处理机执行CPU 为它组织的通道程序,完成指定的数据I/O工作。

(3) 通道程序结束后向CPU 发中断请求。CPU 响应这个中断请求后,第二次进入操作系统,调用管理程序对I/O中断请求进行处理。

第七章 多处理机

1. Flynn分类法是根据什么对计算机进行分类的?将计算机分成哪几类?

2. 根据多处理机系统中处理器个数的多少,可把现有的MIMD 机器分为哪两类?

3. 在分布式存储器结构的机器中,将存储器分布到各结点有什么好处?

4. 在分布式存储器结构的机器中,目前有哪两种存储器地址空间的组织方案?

5. 在分布式存储器结构的机器中,对应于两种地址空间的组织方案,分别有哪两种通信机制?它们是怎么实现的?

6. 用哪三个关键的性能指标来衡量通信机制的性能?

7. 共享存储器通信机制主要有哪些优点?

8. 消息传递通信机制主要有哪些优点?

9. 在消息传递通信机制的硬件上怎样支持共享存储器?

10. 并行处理面临着哪两个重要挑战?

11. 一致的存储系统应满足哪些条件?

12. 实现Cache 一致性协议的关键是什么?

13. 实现Cache 一致性协议时,有哪两种跟踪共享数据状态的技术?

14. 实现Cache 一致性协议有哪两类?

15. 写更新协议和写作废协议在性能上有哪些差别?

16. 目录协议中,Cache 块有哪三种状态?

17. 影响互连网络性能的因素有哪些?

18. 动态连接网络有哪几种?

19. 采用多处理机的一致性机制实现旋转锁有什么好处?

1. Flynn分类法是根据什么对计算机进行分类的?将计算机分成哪几类?

Flynn 分类法,根据计算机中指令和数据的并行状况把计算机分成:

(1)单指令流单数据流(SISD );

(2)单指令流多数据流(SIMD );

(3)多指令流单数据流(MISD );

(4)多指令流多数据流(MIMD )。

2. 根据多处理机系统中处理器个数的多少,可把现有的MIMD 机器分为哪两类?

根据多处理机系统中处理器个数的多少,把现有的MIMD 机器分为:

第一类为集中式共享存储器结构;

第二类为分布式存储器结构;

每一类代表了一种存储器的结构和互连策略。

3. 在分布式存储器结构的机器中,将存储器分布到各结点有什么好处?

将存储器分布到各结点有两个好处:

第一,如果大多数的访问是针对本结点的局部存储器,则可降低对存储器和互连网络的带宽要求; 第二,对局部存储器的访问延迟低。分布式存储器结构最主要的缺点是处理器之间的通信较为复杂,且各处理器之间访问延迟较大。

4. 在分布式存储器结构的机器中,目前有哪两种存储器地址空间的组织方案?

(1) 第一种方案:物理上分离的多个存储器作为一个逻辑上共享的存储空间进行编址。

(2) 第二种方案:整个地址空间由多个独立的地址空间构成,它们在逻辑上也是独立的,远程的处理器不能对其直接寻址。

5. 在分布式存储器结构的机器中,对应于两种地址空间的组织方案,分别有哪两种通信机制?它们是怎么实现的?

(1)共享地址空间的机器:可利用Load 和Store 指令中的地址隐含地进行数据通信,因而可称为共享存储器机器。

(2) 多个地址空间的机器:根据简单的网络协议,通过传递消息来请求某些服务或传输数据,从而完成通信。因而这种机器常称为消息传递机器。

6. 用哪三个关键的性能指标来衡量通信机制的性能?

通信带宽:理想状态下的通信带宽受限于处理器、存储器和互连网络的带宽。

通信延迟:通信延迟=发送开销+跨越时间+传输延迟+接收开销

通讯延迟的隐藏:如何才能较好地将通信和计算或多次通信之间重叠起来。

7. 共享存储器通信机制主要有哪些优点?

(1) 与常用的集中式多处理机使用的通信机制兼容。

(2) 当处理器通信方式复杂或程序执行动态变化时,易于编程;同时在简化编译器设计方面占有优势。

(3) 当通信数据较小时,通信开销较低,带宽利用较好。

(4) 通过硬件控制的Cache 减少了远程通信的频度,减少了通信延迟以及对共享数据的访问冲突。

8. 消息传递通信机制主要有哪些优点?

(1) 硬件较简单。 (2) 通信是显式的,从而引起编程者和编译程序的注意,着重处理开销大的通信。

9. 在消息传递通信机制的硬件上怎样支持共享存储器?

所有对共享存储器的访问均要求操作系统提供地址转换和存储保护功能,即将存储器访问转换为消息的发送和接收。

10. 并行处理面临着哪两个重要挑战?

第一个是程序中有限的并行性。有限的并行性使机器要达到高的加速比十分困难。

第二个是相对较高的通信开销。

11. 一致的存储系统应满足哪些条件?

若一个存储系统满足以下三点,则称该存储系统是一致的:

(1) 处理器P 对X 单元进行一次写之后又对X 单元进行读,读和写之间没有其它处理器对X 单元

进行写,则读的返回值总是写进的值。

(2) 一个处理器对X 单元进行写之后,另一处理器对X 单元进行读,读和写之间无其它写,则读X 单元的返回值应为写进的值。

(3) 对同一单元的写是顺序化的,即任意两个处理器对同一单元的两次写,从所有处理器看来顺序都应是相同的。

12. 实现Cache 一致性协议的关键是什么?

关键是跟踪共享数据块的状态。目前有两类协议,它们采用了不同的共享数据状态跟踪技术。

13. 实现Cache 一致性协议时,有哪两种跟踪共享数据状态的技术?

(1) 目录:物理存储器中共享数据块的状态及相关信息均被保存在一个称为目录的地方。

(2) 监听:每个Cache 除了包含物理存储器中块的数据拷贝之外,也保存着各个块的共享状态信息。Cache 通常连在共享存储器的总线上,各个Cache 控制器通过监听总线来判断它们是否有总线上请求的数据块。

14. 实现Cache 一致性协议有哪两类?

(1) 写作废协议:在一个处理器写某个数据项之前保证它对该数据项有唯一的访问权。

(2) 写更新协议:当一个处理器写某数据项时,通过广播使其它Cache 中所有对应的该数据项拷贝进行更新。

15. 写更新协议和写作废协议在性能上有哪些差别?

(1) 对同一数据的多个写而中间无读操作的情况,写更新协议需进行多次写广播操作,而在写作废协议下只需一次作废操作。

(2) 对同一块中多个字进行写,写更新协议对每个字的写均要进行一次广播,而在写作废协议下仅在对本块第一次写时进行作废操作即可。写作废是针对Cache 块进行操作,而写更新则是针对字(或字节) 进行操作。

(3) 从一个处理器写到另一个处理器读之间的延迟通常在写更新模式中较低,因为它写数据时马上更新了相应的其它Cache 中的内容(假设读的处理器Cache 中有此数据) 。而在写作废协议中,需要读一个新的拷贝。

16. 目录协议中,Cache 块有哪三种状态?

共享:在一个或多个处理器上具有这个块的拷贝,且主存中的值是最新值(所有Cache 均相同) 。 未缓冲:所有处理器的Cache 都没有此块的拷贝。

专有:仅有一个处理器上有此块的拷贝,且已对此块进行了写操作,而主存的拷贝仍是旧的。这个处理器称为此块的拥有者。

17. 影响互连网络性能的因素有哪些?

(1) 功能特性——网络如何支持路由、中断处理、同步、请求/消息组合和一致性。

(2) 网络时延——单位消息通过网络传送时最坏情况下的时间延迟。

(3) 带宽——通过网络的最大数据传输率,用MB /s 表示。

(4) 硬件复杂性——诸如导线、开关、连接器、仲裁和接口逻辑等的造价。

(5 )可扩展性——在增加机器资源使性能可扩展的情况下,网络具备模块化可扩展的能力。

18. 动态连接网络有哪几种?

(1)总线。价格较低、带宽较窄 、容易产生故障。(2)交叉网络。价格昂贵、带宽和互连特性最好。 (3)多端口存储器结构。介于低成本低性能的总线系统和高成本高带宽的交叉开关系统之间。(4)多级网络。采用模块结构,扩展性较好;其时延随网络的级数而上升。

19. 采用多处理机的一致性机制实现旋转锁有什么好处?

第一,可使“环绕”的进程(不停测试请求锁的循环) 对本地Cache 块进行操作,而不用每次请求锁时必须先进行一次全局的存储器访问;

第二,可利用锁访问的局部性,即处理器最近使用过的锁不久又会使用,这种状况下锁可驻留在那个处理器的Cache 中,大大降低了请求的时间。


相关内容

  • 广东省2014年公需课[粤东西北地区振兴战略]在线考试答案(各章)
  • 广东省2014年公需课 <粤东西北地区振兴战略>在线考试答案(各章) <粤东西北地区振兴战略思路>在线考试 第 1 题 从2007年到2013年,粤东西北GDP 占全省比重只增加了( )个百分点. (5分) A. 0.6 B. 0.7 C. 0.8 D. 0.9 答题情况: ...

  • 自考[公文写作与处理]串讲讲义
  • <公文写作与处理>串讲讲义 应考指导 一.考试相关情况说明 (一)课程基本情况 <公文写作与处理>是秘书.行政管理等9个专业本科生和专科生的必修课程之一.本课程的指定教材是全国高等教育自学考试指导委员会组编,湖北大学饶士奇主编,2000年3月发行版本.大纲的编写是以当时国家有 ...

  • 04 课程考试大纲--过程设备机械基础
  • 课程考试大纲编制方法与要求 主讲教师在制定考试大纲时应注意以下几点: 1. 考试大纲的格式需规范统一(参照格式模板,保留页眉页脚): 2. 考试基本要求明确,题型基本固定: 3. 考试难易程度恰当,能基本反映成人教育特点,本科和专科的考试大纲要有不同难度的 区分: 4. 在第二部分:考查的知识范围与 ...

  • 基础会计考试大纲
  • <基础会计学>考试大纲 一.总体要求 本课程的考试目的在于检查和测试学生对基础会计学的基本概念.基本原理及基本方法的掌握程度,是否具有初步应用这些基本原理和基本方法分析.解决实际工作中有关问题的能力.因此,考试可能涉及到课程所包含的任何一部分内容.考生需要注意以下几个方面,具体地说: ( ...

  • 基础会计学考试大纲
  • <基础会计学(第二版)>考试大纲 一.总体要求 本课程的考试目的在于检查和测试学生对基础会计学的基本概念.基本原理及基本方法的掌握程度,是否具有初步应用这些基本原理和基本方法分析.解决实际工作中有关问题的能力.因此,考试可能涉及到课程所包含的任何一部分内容.考生需要注意以下几个方面,具体 ...

  • 计算机网络基础书本练习题答案
  • 各章竞技擂台答案 第一章 话说网络------网络概述 一. 填空题 1. 数据通信:资源共享:分布式处理与负载均衡:提高计算机的可靠性: 综合信息服务 2. LAN;WAN;MAN 3. 电路交换网:报文交换网:分组交换网 4. 开放系统互连参考模型 5. 交换节点:访问节点 6. 广播式:点到点 ...

  • 烹饪学概论
  • 扬州大学编 (高纲号 0325) 一.烹饪学概论的性质与设置目的要求 <烹饪学概论>课程是江苏省自学考试烹饪专业必修课程,是为培养和检验自学应考者的中国烹饪基本理论和基本知识而设置的一门专门基础课. <烹饪学概论>所涉及的范围相当广泛,它融技术性.实践性.理论性.科学性.艺术 ...

  • 注册会计师答题经验
  • 会计: 1.会计综合题的题目很长,考试时我们如何才能做到快速准确的解答呢? 会计综合题的阅读量确认比较大,如果仔细的把题目看完一遍再答题,会花费不少时间的.建议先仔细看一下题目的开头.假设条件及要求,浏览题干中间部分,然后带着问题,边看题目边解答,这样可以提高效率.比如涉及会计政策变更及日后事项调整 ...

  • 三学一考心得体会
  • 俗话说:"一份耕耘,一份收获" .考试也如春种秋收一样,没有精耕细作,就不会有喜人的收成。参加注册咨询工程师考试给我体会最深的一点就是一定要认真复习准备,同时还要注意学习方法与考试技巧。下面简单谈谈我的学习和考试体会,所谓仁者见仁,智者见智,未必是什么经验,希望能与同仁们共勉。 1、树立信心 我认为 ...

  • 新题型快速阅读方法
  • 新题型快速阅读方法 快速阅读,就是在有限的时间内找到所需要的信息--既强调速度(Speed)又强调准确度(Accuracy),那么快速阅读如何提分呢?本文为大家整理:2014年英语四六级备考初期如何提高快速阅读分数. 快速阅读,就是在有限的时间内找到所需要的信息--既强调速度(Speed)又强调准确 ...