高性能计算的概念
高性能计算(HPC )是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算机能力来处理大型计算问题。
基本原理
高性能计算方法的基本原理就是将问题分为若干部分,而相连的每台计算机(称为节点)均可同时参与问题的解决,从而显著缩短了解决整个问题所需的计算时间。
高性能计算机历史回顾
最早的电子计算机就是为了能够进行大量繁琐的科学计算而产生的。从1960年开始,计算机技术逐渐成熟,在各种商业领域慢慢地开始采用电子领域,而且应用范围越来越广泛,逐渐出现了针对各种不同商业用途的计算机,被称为“通用计算机”,具有性能和功能上的优势的一类计算机被称为“高性能计算机”,在当时主要用于科学计算。
20世纪70年代出现的向量计算机可以看作是第一代的高性能计算机。 20世纪80年代初期,随着VLSI 技术和微处理技术的发展,向量机一统天下的格局逐渐被打破。通过多个廉价的微处理器构建的并行化超级计算机首先从成本上具有了无可比拟的优势。
20世纪90年代初期,大规模并行处理(MPP )系统成为了高性能计算机的发展主流。MPP 主要通由多个微处理器通过高速互联网络构成,每个处理器之间通过消息传递方式进行通讯和协调。
20世纪90年代中后期,CC-NUMA 结构问世,即分布式共享内存。每个处理器节点都可以访问到所有其他节点的内存,但访问远程内存需要的延迟相对较大。CC-NUMA 本身没有在提高性能上进行较大的创新,而对于科学计算任务,CC-NUMA 是否优于MPP 仍存在争议。
在发展CC-NUMA 的同时,集群系统(cluster )也迅速发展起来,类似MPP 结构,集群系统是由多个微处理器构成的计算机节点,通过高速网络互联而成,节点一般是可以单独运行的商品化计算机。由于规模经济成本低的原因,集群系统更具有性能/价格比优势
高性能计算机体系结构
对于服务器而言,单纯地提高单个处理器的运算能力和处理能力正在变得越来越难,即使制造商从材料、工艺和设计等方面进行了不懈的努力,但提高单个处理器速度和性能已是强弩之末.
研发多个CPU 的并行处理技术,才是真正提高现代服务器处理能力和运算速度的有效途径.
2.1并行处理技术
目前,SIMD 技术、Single Proc技术、Const 技术已经不再使用。
并行处理技术主要有SMP 技术、NUMA 技术、集群技术和网格技术等.
根据2006年对排行前500名的机器作TOP500
统计,TOP500中的Cluster 约占70.8%MPP(含
CC —NUMA) 约占22%,而SMP 约占7.2%.
2.1.1SMP 技术
对称多处理(symmetrical multiprocessing ,SMP) 技术是相对非对称多处理技术而言的、应用十分广泛的并行技术.在这种架构中,多个处理器运行操作系统的单一复本,并共享内存和一台计算机的其它资源.所有的处理器都可以平等地访问内存、I /0和外部中断.系统资源被系统中所有CPU 共享,工作负载能够均匀地分配到所有可用的处理器之上.
目前,大多数SMP 系统的CPU 是通过共享系统总线来存取数据,实现对称多处理的.在SMP 系统中增加更多处理器的两个主要问题是系统不得不消耗资源来支持处理器抢占内存,以及内存同步
2.1.2NUMA 技术
在非一致访问分布共享存储技术(non uniformmemory access,NUMA)体系结构中,每个处理器与本地存储器和高速缓存相连,多个处理器通过处理器、存储器互联网络相连.处理器还通过处理器、I /O 网络访问共享的I /O 和外围设备.至于处理器之间的通信则通过可选的处理器之间的通信网络来实现.
NMUA 技术在科学与工程计算领域具有不可替代的地位,在联机事务处理
(OLTP)、决策支持服务(DSS)和Intranet 以及Internet 中的地位也越来越重要.目前,NUMA 并行机的处理器数目可达到512个,且带宽可随处理器数目基本上呈线性扩展.这样大的处理器数,使单一系统映像的NUMA 机足以覆盖绝大多数的应用.
首先,由于它具有与SMP 相同的编程模式,因此在科学与工程计算领域具有不可替代的地位;
其次,由于它具有共享内存和良好的可扩展性优势,可以适应企业数据中心的多种应用.NUMA 系统能够运行世界上一些最大的UNIX 数据库应用,而且正被广泛接受为电子商务的主流技术,包括处理功能强大、I /O 的大规模可扩展性、高可用性、工作负荷和资源管理的广泛灵活性,而且无需改变SMP 编程模型_9 J 等优越技术.
2.1.3Cluster 技术
集群(Cluster)技术是近几年兴起的发展高性能计算机的一项技术.它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理.其出发点是提供高可靠性、可扩充性和抗灾难性.
一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信.当一台服务器发生故障时,它所运行的应用程序将由其它服务器自动接管.在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用.采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力
2.1.4网络技术
网格技术有可能成为实现Petaflops (千亿万次浮点运算)的另一条途径.网格是近年来计算机体系结构发展的一个重要方向,其基本思想是通过Internet 进行资源共享和协同工作.目前连接到Internet 的计算机已经达到1亿台以上,通过互联网可能达到的聚合计算潜力是不可估量的.
国际上已经有Globus 等组织为网格环境制定标准和参考实现.
但是用网格技术实现PetafloPs 仍需要关键技术上的突破:
一方面互联网连接的速度和带宽仍有待提高,近年来,网络通信技术以超摩尔定律的速度高速增长,已经为此提供了可能,达到实用阶段只是时间问题.
另一方面是有效的网格体系模型和计算模型还没有建立.网格的资源是分散和动态的,计算也是一种分散的、动态的过程。传统的并行共享内存或消息传递程序模式不能直接有效地利用 .如何科学计算高效使用网格的计算能力是当前一个主要的研究方向.
高性能计算机的发展方向
1、混合体系结构已成为HPC 发展的趋势
2、集群将成为超级计算系统的主流
3、基于刀片式服务器的集群架构兴起
4、集群标准化深入泛高性能计算时代
5、虚拟计算技术在集群应用中的深层次发展
6、. 集群可信计算环境构造技术浮出水面
结论
从高性能计算发展的体系结构分布来看,MPP 取代向量机和集群逐步代替MPP 这两个进程的背后都是摩尔定律在起作用,高性能计算机体系结构的穿心必须与半导体技术和产业发展相结合,否则很难变成主流技术,这也是SIMD 系统、阵列机、数据流等新型体系结构没有流行起来的主要原因。目前,单处理器和SIMD 方式来构建高性能计算系统的方式已不复存在;MPP 仍然是HPC 结构的主流,但是集群将在不久的将来取代MPP 结构的主流地位。
超级计算机正在完成一个从科研工具和试验产品到产业应用的转变,具有广阔的发展空间。但高性能计算机的发展一直面临着挑战,其巨大的计算潜力与性能适中没有被充分应用起来。
高性能计算的概念
高性能计算(HPC )是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算机能力来处理大型计算问题。
基本原理
高性能计算方法的基本原理就是将问题分为若干部分,而相连的每台计算机(称为节点)均可同时参与问题的解决,从而显著缩短了解决整个问题所需的计算时间。
高性能计算机历史回顾
最早的电子计算机就是为了能够进行大量繁琐的科学计算而产生的。从1960年开始,计算机技术逐渐成熟,在各种商业领域慢慢地开始采用电子领域,而且应用范围越来越广泛,逐渐出现了针对各种不同商业用途的计算机,被称为“通用计算机”,具有性能和功能上的优势的一类计算机被称为“高性能计算机”,在当时主要用于科学计算。
20世纪70年代出现的向量计算机可以看作是第一代的高性能计算机。 20世纪80年代初期,随着VLSI 技术和微处理技术的发展,向量机一统天下的格局逐渐被打破。通过多个廉价的微处理器构建的并行化超级计算机首先从成本上具有了无可比拟的优势。
20世纪90年代初期,大规模并行处理(MPP )系统成为了高性能计算机的发展主流。MPP 主要通由多个微处理器通过高速互联网络构成,每个处理器之间通过消息传递方式进行通讯和协调。
20世纪90年代中后期,CC-NUMA 结构问世,即分布式共享内存。每个处理器节点都可以访问到所有其他节点的内存,但访问远程内存需要的延迟相对较大。CC-NUMA 本身没有在提高性能上进行较大的创新,而对于科学计算任务,CC-NUMA 是否优于MPP 仍存在争议。
在发展CC-NUMA 的同时,集群系统(cluster )也迅速发展起来,类似MPP 结构,集群系统是由多个微处理器构成的计算机节点,通过高速网络互联而成,节点一般是可以单独运行的商品化计算机。由于规模经济成本低的原因,集群系统更具有性能/价格比优势
高性能计算机体系结构
对于服务器而言,单纯地提高单个处理器的运算能力和处理能力正在变得越来越难,即使制造商从材料、工艺和设计等方面进行了不懈的努力,但提高单个处理器速度和性能已是强弩之末.
研发多个CPU 的并行处理技术,才是真正提高现代服务器处理能力和运算速度的有效途径.
2.1并行处理技术
目前,SIMD 技术、Single Proc技术、Const 技术已经不再使用。
并行处理技术主要有SMP 技术、NUMA 技术、集群技术和网格技术等.
根据2006年对排行前500名的机器作TOP500
统计,TOP500中的Cluster 约占70.8%MPP(含
CC —NUMA) 约占22%,而SMP 约占7.2%.
2.1.1SMP 技术
对称多处理(symmetrical multiprocessing ,SMP) 技术是相对非对称多处理技术而言的、应用十分广泛的并行技术.在这种架构中,多个处理器运行操作系统的单一复本,并共享内存和一台计算机的其它资源.所有的处理器都可以平等地访问内存、I /0和外部中断.系统资源被系统中所有CPU 共享,工作负载能够均匀地分配到所有可用的处理器之上.
目前,大多数SMP 系统的CPU 是通过共享系统总线来存取数据,实现对称多处理的.在SMP 系统中增加更多处理器的两个主要问题是系统不得不消耗资源来支持处理器抢占内存,以及内存同步
2.1.2NUMA 技术
在非一致访问分布共享存储技术(non uniformmemory access,NUMA)体系结构中,每个处理器与本地存储器和高速缓存相连,多个处理器通过处理器、存储器互联网络相连.处理器还通过处理器、I /O 网络访问共享的I /O 和外围设备.至于处理器之间的通信则通过可选的处理器之间的通信网络来实现.
NMUA 技术在科学与工程计算领域具有不可替代的地位,在联机事务处理
(OLTP)、决策支持服务(DSS)和Intranet 以及Internet 中的地位也越来越重要.目前,NUMA 并行机的处理器数目可达到512个,且带宽可随处理器数目基本上呈线性扩展.这样大的处理器数,使单一系统映像的NUMA 机足以覆盖绝大多数的应用.
首先,由于它具有与SMP 相同的编程模式,因此在科学与工程计算领域具有不可替代的地位;
其次,由于它具有共享内存和良好的可扩展性优势,可以适应企业数据中心的多种应用.NUMA 系统能够运行世界上一些最大的UNIX 数据库应用,而且正被广泛接受为电子商务的主流技术,包括处理功能强大、I /O 的大规模可扩展性、高可用性、工作负荷和资源管理的广泛灵活性,而且无需改变SMP 编程模型_9 J 等优越技术.
2.1.3Cluster 技术
集群(Cluster)技术是近几年兴起的发展高性能计算机的一项技术.它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理.其出发点是提供高可靠性、可扩充性和抗灾难性.
一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信.当一台服务器发生故障时,它所运行的应用程序将由其它服务器自动接管.在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用.采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力
2.1.4网络技术
网格技术有可能成为实现Petaflops (千亿万次浮点运算)的另一条途径.网格是近年来计算机体系结构发展的一个重要方向,其基本思想是通过Internet 进行资源共享和协同工作.目前连接到Internet 的计算机已经达到1亿台以上,通过互联网可能达到的聚合计算潜力是不可估量的.
国际上已经有Globus 等组织为网格环境制定标准和参考实现.
但是用网格技术实现PetafloPs 仍需要关键技术上的突破:
一方面互联网连接的速度和带宽仍有待提高,近年来,网络通信技术以超摩尔定律的速度高速增长,已经为此提供了可能,达到实用阶段只是时间问题.
另一方面是有效的网格体系模型和计算模型还没有建立.网格的资源是分散和动态的,计算也是一种分散的、动态的过程。传统的并行共享内存或消息传递程序模式不能直接有效地利用 .如何科学计算高效使用网格的计算能力是当前一个主要的研究方向.
高性能计算机的发展方向
1、混合体系结构已成为HPC 发展的趋势
2、集群将成为超级计算系统的主流
3、基于刀片式服务器的集群架构兴起
4、集群标准化深入泛高性能计算时代
5、虚拟计算技术在集群应用中的深层次发展
6、. 集群可信计算环境构造技术浮出水面
结论
从高性能计算发展的体系结构分布来看,MPP 取代向量机和集群逐步代替MPP 这两个进程的背后都是摩尔定律在起作用,高性能计算机体系结构的穿心必须与半导体技术和产业发展相结合,否则很难变成主流技术,这也是SIMD 系统、阵列机、数据流等新型体系结构没有流行起来的主要原因。目前,单处理器和SIMD 方式来构建高性能计算系统的方式已不复存在;MPP 仍然是HPC 结构的主流,但是集群将在不久的将来取代MPP 结构的主流地位。
超级计算机正在完成一个从科研工具和试验产品到产业应用的转变,具有广阔的发展空间。但高性能计算机的发展一直面临着挑战,其巨大的计算潜力与性能适中没有被充分应用起来。