计算机系统结构
姓名: 学号:
一、简答题(每小题10分,共20分)
1. 简述使用物理地址进行DMA 存在的问题,及其解决办法。
2. 从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。
二、(60分)现有如下表达式:
Y = a × X
其中:X 和Y 是两个有64个元素的32位的整数的向量,a 为32位的整数。假设在存储器中,X 和Y 的起始地址分别为1000和5000,a 的起始地址为6000。
1.请写出实现该表达式的MIPS 代码。
2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。
3.将上述MIPS 代码在MIPS 流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS 指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS 代码序列执行的流水线时空图,计算调度前和调度后的MIPS 代码序列执行所需的时钟周期数,以及调度前后的MIPS 流水线执行的加速比。
4.根据3的结果说明流水线相关对CPU 性能的影响。
三、(20分)请分析I/O对于性能的影响有多大?假设:
1. I/O操作按照页面方式进行,每页大小为16 KB,Cache 块大小为64 B;且对应新页的地址不在Cache 中;而CPU 不访问新调入页面中的任何数据。
2. Cache 中95%被替换的块将再次被读取,并引起一次失效;Cache 使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache 块。
3. 访问或失效在所有Cache 块中均匀分布;在CPU 和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。
试题二
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
1. Cache 2:1 经验规则 2. 计算机体系结构
3. 同构型多处理机 4. 通道处理机
5. 堆栈型机器
二、填空(每空1分,共20分)
1. 设计I/O系统的三个标准是( )、( )和( )。
2. 存储器层次结构设计技术的基本依据是程序的( )。
3. 相联度越高,( )失效就越少;( )失效不受Cache 容量的影响,但( )失效却随着容量的增加而减少。
4. 在虚拟存储器中,一般采用( )地址映象方法和( )更新策略。
5. 计算机系统中提高并行性的技术途径有( )、( )和( )三种。在高性能单处理机的发展中,起主导作用的是( )。
6. 在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现( )相关, 否则就有可能出现( )、( )和( )相关。
7. 对向量的处理有( )方式、( )方式、( )方式。
三、简答题(每题6分,共24分)
1. 任写出三种Cache 的优化技术,并简述其基本思想。
2. 在指令集结构设计中,应该考虑哪些主要问题?
3. 数据相关有哪几种类型?解决数据相关有哪些主要方法?
4. 试以系列机为例,说明计算机体系结构、计算机组成和计算机实现三者之间的关系。
四、计算题
1. 给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 的性能。由计算结果能得出什么结论?
(1) 理想Cache 情况下的CPI 为2.0,时钟周期为2 ns ,平均每条指令访存
1.4次。
(2) 两者Cache 容量均为128 KB,块大小都是32字节。
(3) 组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%。
(4) 这两种Cache 的失效开销都是80 ns。
(5) 命中时间为1个时钟周期。
(6) 128 KB直接映象Cache 的失效率为1.0%,128 KB两路组相联Cache 的失效率为0.7%。(15分)
2. 计算机系统字长64位,包含三个选择通道和一个多路通道,每个选择通道上连接了两台磁盘机和三台磁带机,多路通道上连接了了两台行式打印机,两台读卡机、10台终端,假定各设备的传输率如下:磁盘机:600 KBps,磁带机:200 KBps,行打机:6.6 KBps,读卡机:1.2 KBps,终 端:1 KBps。计算该计算机系统的最大I/O数据传输率。(6分)
3. 某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍,而系统运行一程序的整体性能提高到原来的10倍,试计算该程序中浮点操作所占的比例。(5分)
4. 动态多功能流水线由6个功能段组成,如下图所示:
其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,各个功能段时间为:s1、s3、s4、s6为△t ,s2、s5为2△t ,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∏(Ai +Bi )(其中i =1..4,∏为连乘符号)
(1)画出其处理过程的时空图。
(2)计算其实际的吞吐率和效率。(15分)
试题三
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
8. Victim Cache 11. 透明性
9. RAID 12. 向量处理机
10. 累加器型机器
二、填空(每空1分,共20分)
1. Cache 失效可以分为( )、( )和( )三种。
2. 说出三种对计算机发展非常关键的实现技术:( ) 、
( ) 和( ) 。
3. 2:1 Cache经验规则是指大小为N 的( )Cache 的失效率约等于大小为N /2的( )Cache 的失效率。
4. 单机和多机系统中并行性发展的技术途径有:( )、( )和( )。
5. 通道分为( )通道、( )通道和( )通道三种类型。
6. 在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现( )相关,否则就有可能出现( )、( )和( )相关。
7. 输入/输出系统包括( )和( )。
三、简答题(每题6分,共24分)
1. 任写出三种降低Cache 失效开销的方法,并简述其基本思想。
2. 指令集结构设计中表示寻址方式的主要方法有哪些?简述这些方法的优缺点。
3. 软件兼容有几种?其中哪一种是软件兼容的根本特征?
4. 造成流水线“断流”的主要原因是哪三种相关?简述三种相关的基本思想。
四、计算题
1. 在伪相联中,假设在按直接映象找到的位置处没有发现匹配,而在另一个位置才找到数据(伪命中)需要2个额外的周期;直接映象的命中时间为1个时钟周期,两路组相联的命中时间为1.2个时钟周期,直接映象情况下失效开销为80个时钟周期,当Cache 容量为64 KB 时,直接映象的失效率为1.4%,两路组相联的失效率为1%,问:直接映象、两路组相联和伪相联这三种组织结构中,哪一种速度最快? (15分)
2. 将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅为整个系统运行时间的30%,则采用此增强功能方法后,能使整个系统的性能提高多少?(5分)
3. 计算机A 和计算机B 具有相同的指令系统。执行同一个程序时,计算机A 的时钟周期为1 ns ,CPI 为2.0,计算机B 的时钟周期为2 ns ,CPI 为1.2。请问执行这个程序时,哪台计算机更快?(6分)
4. 动态多功能流水线由6个功能段组成,如下图:
其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,,各个功能段时间为:s1、s3、s4、s6为△t ,s2、s5为2△t ,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∑A i B i
i =14
(1) 画出时空图。
(2) 计算实际的吞吐率、加速比和效率。(15分)
试题四
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
13. 通用寄存器型机器 4.机群
14. 虚拟Cache 5.定向技术
15. 通道处理机
二、填空(每空1分,共20分)
1. 流水线中的相关有( )相关、( )相关和( )相关三种。
2. 设计I/O系统的三个标准是( )、( )和( )。
3. 对向量的处理有( )方式、( )方式、( )方式。
4. 同构型多处理机和异构型多处理机所采用的提高并行性的技术途径分别是( )和( )。
5. 地址映象方法有( )、( )和( )等三种,其中( )的冲突率最低。
6. 软件兼容有( )、( )、( )和( )四种。其中( )是软件兼容的根本特征。
三、简答题(每题6分,共24分)
1. 计算机体系结构设计和分析中最经常使用的三条基本原则是什么?并说出它们的含义。
2. 任写出三种降低失效率的方法,并简述其基本思想。
3. 指令集结构设计中,应该考虑哪些主要问题?
4. 通道分为哪三种类型?它们分别适合为哪种外围设备服务?
四、计算题
1. 假定Cache 的失效开销为50个时钟周期,当不考虑存储器停顿时,所有指令的执行时间都是2.0个时钟周期,访问Cache 失效率为2%,平均每条指令访存1.33次。求没有Cache 和有Cache 两种情况下的平均指令执行时间。(12分)
2. 在三级Cache 中,第一级Cache 、第二级Cache 和第三级Cache 的局部失效率分别为4%、30%和50%。它们的全局失效率各是多少?(8分)
3. 计算机A 和计算机B 具有相同的指令系统。执行同一个程序时,计算机A 的时钟周期为1.1 ns ,CPI 为2.0,计算机B 的时钟周期为2 ns ,CPI 为1.3。请问执行这个程序时,哪台计算机更快?(6分)
4. 静态多功能流水线由6个功能段组成,如下图所示:
其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,各个功能段时间均为△t ,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∏(Ai +Bi )(其中i =1..4,∏为连乘符号)
(3) 画出时空图;
(4) 计算实际的吞吐率、加速比和效率。(15分)
试题五
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
16. 系列机 2.定向技术
3.强制性失效 4.通道处理机
5. 失效率
二、填空(每空1分,共20分)
1. 数据相关有三种,分别是:( )、( )和( )。
2. 从处理数据的角度,并行性等级可以分为字串位串、( )( )、
和全并行。
3. 在存储层次中,映象规则有( )、( )和( )。
4. 计算机系统中提高并行性的技术途径有( )、( )和( )三种。在高性能单处理机的发展中,起主导作用的是( )。
5. 设有一个“Cache-主存”层次,Cache 为4块,主存为8块;试分别对于以下2种情况,计算访存块地址为5时的索引(index )。
(1)组相联,每组两块;索引为( )。
(2)直接映象;索引为( )。
6. 对向量的处理有( )方式、( )方式、( )方式。
7. 根据CPU 内部存储单元类型,可将指令集结构分为( )型指令集结构、( )型指令集结构和( )型指令集结构。
三、简答题(每题5分,共25分)
1. 调度分支延迟指令有哪三种常用方法?它们各有什么优缺点。
2. 表示寻址方式的主要方法有哪些?简述它们的优缺点。
3. 简述“Cache -主存”层次与“主存-辅存”层次的区别。
4. 试举例说明DLX 流水线中存在不能依靠定向技术解决的数据相关及其解决方法。
5. 试从3C 失效的关系分析增加块大小对Cache 性能的影响。
四、(20分)有一条静态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f =(A 1+B 1)*(A 2+B 2)*(A 3+B 3)*(A 4+B 4),
(1) 画出处理过程的时空图。
(2) 计算其吞吐率、加速比和效率。
(3) 该流水线的瓶颈段是哪一段?可用哪几种方法消除该瓶颈?画出改进后
的流水线。
五、(10分)
(1) 根据Amdahl 定律写出系统加速比的公式。
(2) 某计算机系统有两个部件可以改进,这两个部件的加速比为:
部件加速比1=30; 部件加速比2=20;
如果部件1和部件2的可改进比例分别为30%和40%,求整个系统的加速比。
六、(10分)给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 时间。
(1) 理想Cache (命中率为100%)情况下的CPI 为2.0,时钟周期为2 ns,
平均每条指令访存1.2次。
(2) 两种Cache 容量均为1 KB,块大小都是32字节。
(3) 组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%。
(4) 这两种Cache 的失效开销都是40个时钟周期。
(5) 命中时间为1个时钟周期。
(6) 1 KB直接映象Cache 的失效率为13.3%,1 KB两路组相联Cache 的失效
率为10.5%。
试题六
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
17. 透明性 2.数据相关
4.堆栈型机器 4.通道处理机
5. 失效开销
二、填空(每空1分,共20分)
1. 流水线相关有三种:( )、( )和( )。
2. 从执行程序的角度看,并行性等级可以分为:( ) 、( )、( )和作业或程序级并行。
3. 在存储层次中,常用的替换算法有( )、( )和( )。
4. 计算机系统中提高并行性的技术途径有( )、( )和( )三种。
5. 按照产生失效的原因不同,可把失效分为( )失效、( )失效和( )失效三类。
6. 通道可分为( )通道、( )通道和( )通道三种类型。
7. 设有一个“Cache-主存”层次,Cache 为4块,主存为8块;试分别对于以下2种情况,计算访存块地址为6时的索引(index )。
(1)组相联,每组两块;索引为( )。
(2)直接映象;索引为( )。
三、简答题(每题5分,共25分)
1. 写出三级Cache 的平均访问时间的公式。
2. 软件兼容有几种?其中哪一种是软件兼容的根本特征?
3. 试从目的、技术途径、组成等3个方面对同构型多处理机和异构型多处理机作一简单比较(列表)。
4. 有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?
5. 降低Cache 失效率有哪几种方法(至少写出5种)?
四、(20分)有一条静态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f =A 1*B 1 + A 2*B 2 + A 3*B 3 + A4*B 4,
(1)画出处理过程的时空图;
(2)计算其吞吐率、加速比和效率;
(3)该流水线的瓶颈段是哪一段?可用哪几种方法消除该瓶颈?画出改进后的流水线。
五、(5分)将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时
间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?
六、(15分)假设当按直接映象位置没有发现匹配,而在另一个位置才找到数据(伪命中)时,需要2个额外的周期,而且不交换两个Cache 中的数据。Cache 参数如下:
(1) 容量128KB 。
(2) 直接映象情况下命中时间为1个时钟周期,失效开销为50个时钟周 期。
(3) 时钟周期2路 =1.10×时钟周期1路。
(4) 直接映象失效率为0.010,两路组相联失效率为0.007。
问:当直接映象、两路组相联映象和伪相联映象这三种组织结构时,速度各是多少?
试题七
一、填空题(20分,每空2分)
1.在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现( )相关,否则就有可能出现( )、( )和( )相关。
2.设计I/O系统的三个标准是( )、( )和( )。
3.单机和多机并行性发展的技术途径有( )、( )和( )。
二、简答题(20分,每题10分)
1.在进行计算机系统设计时,一个设计者应该考虑哪些因素对设计的影响?
2.请简述I/O系统设计的步骤。
三、(共60分)现有如下C 语言源代码:
for (i=0;i
{ A[i]=B[i]+C;}
其中,A 和B 是两个32位整数的数组,C 和i 均是32位整数。假设所有数据的值及其地址均保存在存储器中,A 和B 的起始地址分别是0和5000,C 和i 的地址分别是1500和2000。
1. 现假设在程序运行过程中,只要有可能就将i 的值和数组变量的地址一直保存在寄存器中,请写出该C 语言源程序的MIPS 实现代码。MIPS 代码的大小是多少?
2. 假设上述MIPS 代码在MIPS 流水线上(有正常的定向路径、分支指令在译码段被解析出来,所有存储器访问全部Cache 命中)执行,请以最快执行方式调度该MIPS 指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。计算调度后的MIPS 代码序列执行所需的时钟周期数,以及对于上述标准MIPS 流水线执行的加速比。
3. 请写出该MIPS 代码的存储器数据访问地址流(十进制表示)。
4. 在前面“3”中的实现中,均是假设存储器访问全部Cache 命中,且Cache 命中访问时间为1个时钟周期。现假设MIPS 流水线没有Cache ,所有存储器访问均需50个时钟周期(失效损失),请问“3”中调度后的MIPS 指令序列在该MIPS (没有Cache )上执行需要多少个时钟周期数。
5. 现假设为MIPS 流水线设置一个大小为400 B的一级Cache ,Cache 块的大小为200 B,采用全相联映射策略和写回策略,Cache 的命中时间为1个时钟周期,失效损失为50个时钟周期,失效时每次预取一个块,预取一个块的时间为50个时钟周期,请计算该Cache 的失效率,以及现在“3”中调度后的MIPS 指令序列在MIPS 上执行需要多少个时钟周期数。
试题八
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
1.计算机体系结构
3.2:1Cache经验规则
5.通道 2.容量失效 4.数据相关
二、什么叫软件兼容?软件兼容有哪几种?其中哪一种是软件兼容的根本特征?(8分)
三、有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?(8分)
四、流水线数据相关有哪几种?简述定向技术的基本思想。(15分)
五、(20分)有一条静态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f =A 1*B 1+A 2*B 2+A 3*B 3*+A 4*B 4,
(1) 画出处理过程的时空图。
(2) 计算其吞吐率、加速比和效率。
六、(15分)给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 时间。
(1) 理想Cache (命中率为100%)情况下的CPI 为2.0,平均每条指令访存
1.2次。
(2) 两种Cache 容量均为1 KB,块大小都是32 B。
(3) 组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%。
(4) 这两种Cache 的失效开销都是40个时钟周期。
(5) 命中时间为1个时钟周期。
(6) 1 KB直接映象Cache 的失效率为13.3%,1 KB两路组相联Cache 的失效
率为10.5%。
七、在Tomasulo 算法中,进入“流出”段的条件是什么?对于浮点
操作来说,要进行哪些动作和记录工作?(9分)
八、目录协议中,Cache 块有哪三种状态?(10分)
试题九
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
1. 系列机
3.2:1Cache经验规则
5.RAID 2. 强制性失效 4. 指令级并行
二、试从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。(10分)
三、有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?(6分)
四、流水线数据相关分为三种:RAW, WAR和 WAW 。解释它们的含义,并用代码举例说明。(13分)
五、(20分)有一条动态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f =A 1*B 1+A 2*B 2+A 3*B 3+A 4*B 4,
(1)画出处理过程的时空图。
(2)计算其吞吐率、加速比和效率。
六、(15分)给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 时间。
(1)理想Cache (命中率为100%)情况下的CPI 为2.0,时钟周期为2ns ,平均每条指令访存1.2次。
(2)两种Cache 容量均为64KB ,块大小都是32字节。
(3)组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%。
(4)这两种Cache 的失效开销都是60 ns。
(5)命中时间为1个时钟周期。
(6)64 KB直接映象Cache 的失效率为1.4%,64 KB两路组相联Cache 的失效率为1.0%。
七、什么是多处理机的Cache 一致性?解决多Cache 一致性有哪几种方法?并简述这些方法。(15分)
八、论述Tomasulo 算法的基本思想。(6分)
计算机系统结构
姓名: 学号:
一、简答题(每小题10分,共20分)
1. 简述使用物理地址进行DMA 存在的问题,及其解决办法。
2. 从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。
二、(60分)现有如下表达式:
Y = a × X
其中:X 和Y 是两个有64个元素的32位的整数的向量,a 为32位的整数。假设在存储器中,X 和Y 的起始地址分别为1000和5000,a 的起始地址为6000。
1.请写出实现该表达式的MIPS 代码。
2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。
3.将上述MIPS 代码在MIPS 流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS 指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS 代码序列执行的流水线时空图,计算调度前和调度后的MIPS 代码序列执行所需的时钟周期数,以及调度前后的MIPS 流水线执行的加速比。
4.根据3的结果说明流水线相关对CPU 性能的影响。
三、(20分)请分析I/O对于性能的影响有多大?假设:
1. I/O操作按照页面方式进行,每页大小为16 KB,Cache 块大小为64 B;且对应新页的地址不在Cache 中;而CPU 不访问新调入页面中的任何数据。
2. Cache 中95%被替换的块将再次被读取,并引起一次失效;Cache 使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache 块。
3. 访问或失效在所有Cache 块中均匀分布;在CPU 和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。
试题二
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
1. Cache 2:1 经验规则 2. 计算机体系结构
3. 同构型多处理机 4. 通道处理机
5. 堆栈型机器
二、填空(每空1分,共20分)
1. 设计I/O系统的三个标准是( )、( )和( )。
2. 存储器层次结构设计技术的基本依据是程序的( )。
3. 相联度越高,( )失效就越少;( )失效不受Cache 容量的影响,但( )失效却随着容量的增加而减少。
4. 在虚拟存储器中,一般采用( )地址映象方法和( )更新策略。
5. 计算机系统中提高并行性的技术途径有( )、( )和( )三种。在高性能单处理机的发展中,起主导作用的是( )。
6. 在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现( )相关, 否则就有可能出现( )、( )和( )相关。
7. 对向量的处理有( )方式、( )方式、( )方式。
三、简答题(每题6分,共24分)
1. 任写出三种Cache 的优化技术,并简述其基本思想。
2. 在指令集结构设计中,应该考虑哪些主要问题?
3. 数据相关有哪几种类型?解决数据相关有哪些主要方法?
4. 试以系列机为例,说明计算机体系结构、计算机组成和计算机实现三者之间的关系。
四、计算题
1. 给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 的性能。由计算结果能得出什么结论?
(1) 理想Cache 情况下的CPI 为2.0,时钟周期为2 ns ,平均每条指令访存
1.4次。
(2) 两者Cache 容量均为128 KB,块大小都是32字节。
(3) 组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%。
(4) 这两种Cache 的失效开销都是80 ns。
(5) 命中时间为1个时钟周期。
(6) 128 KB直接映象Cache 的失效率为1.0%,128 KB两路组相联Cache 的失效率为0.7%。(15分)
2. 计算机系统字长64位,包含三个选择通道和一个多路通道,每个选择通道上连接了两台磁盘机和三台磁带机,多路通道上连接了了两台行式打印机,两台读卡机、10台终端,假定各设备的传输率如下:磁盘机:600 KBps,磁带机:200 KBps,行打机:6.6 KBps,读卡机:1.2 KBps,终 端:1 KBps。计算该计算机系统的最大I/O数据传输率。(6分)
3. 某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍,而系统运行一程序的整体性能提高到原来的10倍,试计算该程序中浮点操作所占的比例。(5分)
4. 动态多功能流水线由6个功能段组成,如下图所示:
其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,各个功能段时间为:s1、s3、s4、s6为△t ,s2、s5为2△t ,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∏(Ai +Bi )(其中i =1..4,∏为连乘符号)
(1)画出其处理过程的时空图。
(2)计算其实际的吞吐率和效率。(15分)
试题三
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
8. Victim Cache 11. 透明性
9. RAID 12. 向量处理机
10. 累加器型机器
二、填空(每空1分,共20分)
1. Cache 失效可以分为( )、( )和( )三种。
2. 说出三种对计算机发展非常关键的实现技术:( ) 、
( ) 和( ) 。
3. 2:1 Cache经验规则是指大小为N 的( )Cache 的失效率约等于大小为N /2的( )Cache 的失效率。
4. 单机和多机系统中并行性发展的技术途径有:( )、( )和( )。
5. 通道分为( )通道、( )通道和( )通道三种类型。
6. 在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现( )相关,否则就有可能出现( )、( )和( )相关。
7. 输入/输出系统包括( )和( )。
三、简答题(每题6分,共24分)
1. 任写出三种降低Cache 失效开销的方法,并简述其基本思想。
2. 指令集结构设计中表示寻址方式的主要方法有哪些?简述这些方法的优缺点。
3. 软件兼容有几种?其中哪一种是软件兼容的根本特征?
4. 造成流水线“断流”的主要原因是哪三种相关?简述三种相关的基本思想。
四、计算题
1. 在伪相联中,假设在按直接映象找到的位置处没有发现匹配,而在另一个位置才找到数据(伪命中)需要2个额外的周期;直接映象的命中时间为1个时钟周期,两路组相联的命中时间为1.2个时钟周期,直接映象情况下失效开销为80个时钟周期,当Cache 容量为64 KB 时,直接映象的失效率为1.4%,两路组相联的失效率为1%,问:直接映象、两路组相联和伪相联这三种组织结构中,哪一种速度最快? (15分)
2. 将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅为整个系统运行时间的30%,则采用此增强功能方法后,能使整个系统的性能提高多少?(5分)
3. 计算机A 和计算机B 具有相同的指令系统。执行同一个程序时,计算机A 的时钟周期为1 ns ,CPI 为2.0,计算机B 的时钟周期为2 ns ,CPI 为1.2。请问执行这个程序时,哪台计算机更快?(6分)
4. 动态多功能流水线由6个功能段组成,如下图:
其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,,各个功能段时间为:s1、s3、s4、s6为△t ,s2、s5为2△t ,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∑A i B i
i =14
(1) 画出时空图。
(2) 计算实际的吞吐率、加速比和效率。(15分)
试题四
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
13. 通用寄存器型机器 4.机群
14. 虚拟Cache 5.定向技术
15. 通道处理机
二、填空(每空1分,共20分)
1. 流水线中的相关有( )相关、( )相关和( )相关三种。
2. 设计I/O系统的三个标准是( )、( )和( )。
3. 对向量的处理有( )方式、( )方式、( )方式。
4. 同构型多处理机和异构型多处理机所采用的提高并行性的技术途径分别是( )和( )。
5. 地址映象方法有( )、( )和( )等三种,其中( )的冲突率最低。
6. 软件兼容有( )、( )、( )和( )四种。其中( )是软件兼容的根本特征。
三、简答题(每题6分,共24分)
1. 计算机体系结构设计和分析中最经常使用的三条基本原则是什么?并说出它们的含义。
2. 任写出三种降低失效率的方法,并简述其基本思想。
3. 指令集结构设计中,应该考虑哪些主要问题?
4. 通道分为哪三种类型?它们分别适合为哪种外围设备服务?
四、计算题
1. 假定Cache 的失效开销为50个时钟周期,当不考虑存储器停顿时,所有指令的执行时间都是2.0个时钟周期,访问Cache 失效率为2%,平均每条指令访存1.33次。求没有Cache 和有Cache 两种情况下的平均指令执行时间。(12分)
2. 在三级Cache 中,第一级Cache 、第二级Cache 和第三级Cache 的局部失效率分别为4%、30%和50%。它们的全局失效率各是多少?(8分)
3. 计算机A 和计算机B 具有相同的指令系统。执行同一个程序时,计算机A 的时钟周期为1.1 ns ,CPI 为2.0,计算机B 的时钟周期为2 ns ,CPI 为1.3。请问执行这个程序时,哪台计算机更快?(6分)
4. 静态多功能流水线由6个功能段组成,如下图所示:
其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,各个功能段时间均为△t ,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∏(Ai +Bi )(其中i =1..4,∏为连乘符号)
(3) 画出时空图;
(4) 计算实际的吞吐率、加速比和效率。(15分)
试题五
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
16. 系列机 2.定向技术
3.强制性失效 4.通道处理机
5. 失效率
二、填空(每空1分,共20分)
1. 数据相关有三种,分别是:( )、( )和( )。
2. 从处理数据的角度,并行性等级可以分为字串位串、( )( )、
和全并行。
3. 在存储层次中,映象规则有( )、( )和( )。
4. 计算机系统中提高并行性的技术途径有( )、( )和( )三种。在高性能单处理机的发展中,起主导作用的是( )。
5. 设有一个“Cache-主存”层次,Cache 为4块,主存为8块;试分别对于以下2种情况,计算访存块地址为5时的索引(index )。
(1)组相联,每组两块;索引为( )。
(2)直接映象;索引为( )。
6. 对向量的处理有( )方式、( )方式、( )方式。
7. 根据CPU 内部存储单元类型,可将指令集结构分为( )型指令集结构、( )型指令集结构和( )型指令集结构。
三、简答题(每题5分,共25分)
1. 调度分支延迟指令有哪三种常用方法?它们各有什么优缺点。
2. 表示寻址方式的主要方法有哪些?简述它们的优缺点。
3. 简述“Cache -主存”层次与“主存-辅存”层次的区别。
4. 试举例说明DLX 流水线中存在不能依靠定向技术解决的数据相关及其解决方法。
5. 试从3C 失效的关系分析增加块大小对Cache 性能的影响。
四、(20分)有一条静态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f =(A 1+B 1)*(A 2+B 2)*(A 3+B 3)*(A 4+B 4),
(1) 画出处理过程的时空图。
(2) 计算其吞吐率、加速比和效率。
(3) 该流水线的瓶颈段是哪一段?可用哪几种方法消除该瓶颈?画出改进后
的流水线。
五、(10分)
(1) 根据Amdahl 定律写出系统加速比的公式。
(2) 某计算机系统有两个部件可以改进,这两个部件的加速比为:
部件加速比1=30; 部件加速比2=20;
如果部件1和部件2的可改进比例分别为30%和40%,求整个系统的加速比。
六、(10分)给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 时间。
(1) 理想Cache (命中率为100%)情况下的CPI 为2.0,时钟周期为2 ns,
平均每条指令访存1.2次。
(2) 两种Cache 容量均为1 KB,块大小都是32字节。
(3) 组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%。
(4) 这两种Cache 的失效开销都是40个时钟周期。
(5) 命中时间为1个时钟周期。
(6) 1 KB直接映象Cache 的失效率为13.3%,1 KB两路组相联Cache 的失效
率为10.5%。
试题六
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
17. 透明性 2.数据相关
4.堆栈型机器 4.通道处理机
5. 失效开销
二、填空(每空1分,共20分)
1. 流水线相关有三种:( )、( )和( )。
2. 从执行程序的角度看,并行性等级可以分为:( ) 、( )、( )和作业或程序级并行。
3. 在存储层次中,常用的替换算法有( )、( )和( )。
4. 计算机系统中提高并行性的技术途径有( )、( )和( )三种。
5. 按照产生失效的原因不同,可把失效分为( )失效、( )失效和( )失效三类。
6. 通道可分为( )通道、( )通道和( )通道三种类型。
7. 设有一个“Cache-主存”层次,Cache 为4块,主存为8块;试分别对于以下2种情况,计算访存块地址为6时的索引(index )。
(1)组相联,每组两块;索引为( )。
(2)直接映象;索引为( )。
三、简答题(每题5分,共25分)
1. 写出三级Cache 的平均访问时间的公式。
2. 软件兼容有几种?其中哪一种是软件兼容的根本特征?
3. 试从目的、技术途径、组成等3个方面对同构型多处理机和异构型多处理机作一简单比较(列表)。
4. 有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?
5. 降低Cache 失效率有哪几种方法(至少写出5种)?
四、(20分)有一条静态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f =A 1*B 1 + A 2*B 2 + A 3*B 3 + A4*B 4,
(1)画出处理过程的时空图;
(2)计算其吞吐率、加速比和效率;
(3)该流水线的瓶颈段是哪一段?可用哪几种方法消除该瓶颈?画出改进后的流水线。
五、(5分)将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时
间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?
六、(15分)假设当按直接映象位置没有发现匹配,而在另一个位置才找到数据(伪命中)时,需要2个额外的周期,而且不交换两个Cache 中的数据。Cache 参数如下:
(1) 容量128KB 。
(2) 直接映象情况下命中时间为1个时钟周期,失效开销为50个时钟周 期。
(3) 时钟周期2路 =1.10×时钟周期1路。
(4) 直接映象失效率为0.010,两路组相联失效率为0.007。
问:当直接映象、两路组相联映象和伪相联映象这三种组织结构时,速度各是多少?
试题七
一、填空题(20分,每空2分)
1.在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现( )相关,否则就有可能出现( )、( )和( )相关。
2.设计I/O系统的三个标准是( )、( )和( )。
3.单机和多机并行性发展的技术途径有( )、( )和( )。
二、简答题(20分,每题10分)
1.在进行计算机系统设计时,一个设计者应该考虑哪些因素对设计的影响?
2.请简述I/O系统设计的步骤。
三、(共60分)现有如下C 语言源代码:
for (i=0;i
{ A[i]=B[i]+C;}
其中,A 和B 是两个32位整数的数组,C 和i 均是32位整数。假设所有数据的值及其地址均保存在存储器中,A 和B 的起始地址分别是0和5000,C 和i 的地址分别是1500和2000。
1. 现假设在程序运行过程中,只要有可能就将i 的值和数组变量的地址一直保存在寄存器中,请写出该C 语言源程序的MIPS 实现代码。MIPS 代码的大小是多少?
2. 假设上述MIPS 代码在MIPS 流水线上(有正常的定向路径、分支指令在译码段被解析出来,所有存储器访问全部Cache 命中)执行,请以最快执行方式调度该MIPS 指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。计算调度后的MIPS 代码序列执行所需的时钟周期数,以及对于上述标准MIPS 流水线执行的加速比。
3. 请写出该MIPS 代码的存储器数据访问地址流(十进制表示)。
4. 在前面“3”中的实现中,均是假设存储器访问全部Cache 命中,且Cache 命中访问时间为1个时钟周期。现假设MIPS 流水线没有Cache ,所有存储器访问均需50个时钟周期(失效损失),请问“3”中调度后的MIPS 指令序列在该MIPS (没有Cache )上执行需要多少个时钟周期数。
5. 现假设为MIPS 流水线设置一个大小为400 B的一级Cache ,Cache 块的大小为200 B,采用全相联映射策略和写回策略,Cache 的命中时间为1个时钟周期,失效损失为50个时钟周期,失效时每次预取一个块,预取一个块的时间为50个时钟周期,请计算该Cache 的失效率,以及现在“3”中调度后的MIPS 指令序列在MIPS 上执行需要多少个时钟周期数。
试题八
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
1.计算机体系结构
3.2:1Cache经验规则
5.通道 2.容量失效 4.数据相关
二、什么叫软件兼容?软件兼容有哪几种?其中哪一种是软件兼容的根本特征?(8分)
三、有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?(8分)
四、流水线数据相关有哪几种?简述定向技术的基本思想。(15分)
五、(20分)有一条静态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f =A 1*B 1+A 2*B 2+A 3*B 3*+A 4*B 4,
(1) 画出处理过程的时空图。
(2) 计算其吞吐率、加速比和效率。
六、(15分)给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 时间。
(1) 理想Cache (命中率为100%)情况下的CPI 为2.0,平均每条指令访存
1.2次。
(2) 两种Cache 容量均为1 KB,块大小都是32 B。
(3) 组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%。
(4) 这两种Cache 的失效开销都是40个时钟周期。
(5) 命中时间为1个时钟周期。
(6) 1 KB直接映象Cache 的失效率为13.3%,1 KB两路组相联Cache 的失效
率为10.5%。
七、在Tomasulo 算法中,进入“流出”段的条件是什么?对于浮点
操作来说,要进行哪些动作和记录工作?(9分)
八、目录协议中,Cache 块有哪三种状态?(10分)
试题九
计算机系统结构
姓名: 学号:
一、名词解释(每题3分,共15分)
1. 系列机
3.2:1Cache经验规则
5.RAID 2. 强制性失效 4. 指令级并行
二、试从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。(10分)
三、有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?(6分)
四、流水线数据相关分为三种:RAW, WAR和 WAW 。解释它们的含义,并用代码举例说明。(13分)
五、(20分)有一条动态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第3段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f =A 1*B 1+A 2*B 2+A 3*B 3+A 4*B 4,
(1)画出处理过程的时空图。
(2)计算其吞吐率、加速比和效率。
六、(15分)给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 时间。
(1)理想Cache (命中率为100%)情况下的CPI 为2.0,时钟周期为2ns ,平均每条指令访存1.2次。
(2)两种Cache 容量均为64KB ,块大小都是32字节。
(3)组相联Cache 中的多路选择器使CPU 的时钟周期增加了10%。
(4)这两种Cache 的失效开销都是60 ns。
(5)命中时间为1个时钟周期。
(6)64 KB直接映象Cache 的失效率为1.4%,64 KB两路组相联Cache 的失效率为1.0%。
七、什么是多处理机的Cache 一致性?解决多Cache 一致性有哪几种方法?并简述这些方法。(15分)
八、论述Tomasulo 算法的基本思想。(6分)