Summarized by NIRVANA 新浪微博:Win都是XP
EMC 版 信息存储与管理
第一部分 存储系统
Chapter 1 信息存储与管理的介绍 信息存储
数据增长因素
数据处理能力的上升 • 数字存储成本的低成本 • 可负担的和更快的通讯技术
•
有价值的数据:地震、生产数据、客户数据、医疗数据
数据类型
结构化数据:按行和列这种严格的格式组织。数据库存储系统存储 • 非结构化数据:不是按行列存储。如便签、商业名片、数字格式名片
•
信息:从数据中提取出来的知识
存储:目的是在进一步处理时可以进行访问
存储技术特点和架构发展
存储技术突出点:
冗余磁盘阵列(redundant array of independent disk,RAID)在DAS、SAN等存储架构中都有使用
• 直连存储(Direct-attached Storage,DAS)存储设备直接连接到服务器(组)。
• 存储区域网(Storage Area Network,SAN)专用的、高性能的光纤通道网络,用来完成服务器和存储设备之间块级别的通信。存储设备被分区并指定给不同服务器,从而被分别访问。主要为文件服务类应用提供存储服务
•
网络互联存储(Network-attached Storage,NAS)专用于文件服务类应用的存储设备。通过现有的通信网络(LAN)连接,并未不同客户提供文件访问
• IP存储区域网(IPSAN)是SAN和NAS的继承。提供了在局域网和广域网上的块级别传输
•
数据中心基础设施(包括:计算机、存储系统、网络设备、专用备用电源、环境控制设备)
核心部件:
• • • • •
应用 数据库
服务器和操作系统 网络 存储阵列
数据中心部件的关键需求
• • • • • • •
可用性 安全性 可扩展性 性能
数据完整性 容量 可管理性
管理存储基础设施 监控 • 报告 • 供应
•
信息管理中的挑战
数字世界的爆炸 • 书信息依赖的上升 • 信息价值的改变
•
信息生命周期:随着时间变化而发生的“信息价值的改变”
信息生命周期管理(Information Lifecycle Management,ILM):一种主动的策略,允许一个IT组织根据预先定义的商业策略来高效地管理数据的整个生命周期,并通过优化存储基础设施来实现最大的投资回报。 其特征:
• • • • •
以业务为中心 集中式管理 基于策略的 异构的:一个ILM策略应该把所有类型的存储平台和操作系统都考虑进来 优化的
其实现: 分类 • 实现 • 管理 • 组织
•
其优点:
• • • • •
更高的资源利用率 简化的管理 更广泛的选择 维护约定
更低的总拥有成本(TCO)
Chapter 2 存储系统环境
存储环境的组成(主机、连接、存储设备)
主机(物理部件、逻辑部件)
物理部件: CPU
• 存储设备 • I/O设备
•
连接(主机与外围设备的互连。物理部件、逻辑部件)
连接的物理部件(总线(分为系统总线和I/O总线)、端口、电缆)
串行:比特位在单个通道中按顺序进行传输 并行:比特位同时在多个通路中进行传输 连接的逻辑部件(协议)
PCI:规定了PCI扩展卡与CPU如何交换信息 • IDE/ATA:磁盘最常用的借口协议
• SCSI :最初用于并行借口,现在功能更多。
•
磁盘驱动部件
核心部件:盘片、主轴、读写头、驱动臂、控制器
磁盘驱动器的性能(寻道时间、旋转延迟、数据传输速率)
•
寻道时间:读写头在盘面上移动进行定位的时间。(全程时间、平均时间、相邻磁道时间)
旋转延迟:盘片旋转以定位读写头下方的数据所用的时间
• 数据传输速率:每个单位时间磁盘能够传输到HBA(主机总线配置器)的平均数据量
•
影响磁盘性能的基本准则 将磁盘看成两部分:
队列:用于存放等待I/O控制器处理的I/O请求 • 磁盘I/O控制器:依次处理队列中的I/O请求
•
两定律:
Little定律:N=a×R • 利用率定律:
U=a×Ns
•
主机的逻辑部件:
• • • • •
操作系统(OS)
设备驱动(Device Driver)
卷管理器(LVM):运行在物理机器上管理逻辑与物理存储设备的软件。可划分和合成磁盘空间。基本部件:物理卷、卷组、逻辑卷
文件系统(File System):通过使用目录把大量文件的分层组织结构。常见文件系统:FAT32、NTFS、UFS
应用:提供计算机操作逻辑的计算机程序。数据访问:块级别访问、文件级别访问
应用程序的需求和磁盘的性能 入手点:
分析最高负载时产生的I/O数量 • 记录下应用程序I/O大小或是块大小
•
Chapter 3 数据保护:RAID
RAID是一种将多块磁盘形成一个有机整体,使之能够在硬盘故障时提供数据保护的技术。
RAID的实现
软件实现:性能上占用CPU开销,功能上不支持所有RAID级别,需考虑兼容性
• 硬件实现:硬件RAID(专用硬件控制器实现)、控制卡RAID(控制卡和PCI总线交互)、外部RAID控制器(基于阵列,通过协议)
•
RAID阵列的组成:物理阵列、逻辑阵列、RAID控制器、RAID集
RAID级别
分条(Striping)
条带(Stripe):磁盘上一块由若干地址连续的磁盘块构成的、大小固定的区域
• 条带尺寸:构成条带的磁盘块数目
• 分条尺寸:条带尺寸与RAID集中硬盘数量的乘积。
•
数据镜像(将同一数据存储在两块不同的硬盘上,从而产生两个副本,用于保护数据)
奇偶校验(既能为分条RAID提供数据保护,又能避免镜像所需开销的方法):往分条中增加一个硬盘来储存校验值。通过
数学方法构造的校验值能够重建丢失的数据。计算采用位异或操作
RAID 0 数据是分带存储在RAID集的各个硬盘上的,因此利用了全部的存储空间
RAID 1(通过数据镜像来提升容错性)
嵌套RAID(许多数据中心对RAID阵列的数据冗余和性能都有需求)
RAID 3(通过存储分带提供高性能,并利用奇偶校验提升容错性)RAID 4(与RAID 3 类似,支持独立访问)
RAID 5(磁盘上的存储带是可以单独存取的,校验值分布存储在所有磁盘上)
RAID 6(与RAID 5 类似)
RAID对磁盘性能的影响
写代价:对于急于镜像和校验的RAID系统,每个写操作都会对磁盘产生额外的I/O开销。
热备用(RAID阵列中用于临时替代RAID集中故障硬盘的备用硬盘)
数据恢复方法
如采用校验RAID,则按照RAID集中的校验值和幸存硬盘上的数据重建数据。
• 如采用镜像RAID,则从存活镜像上复制数据 • 新硬盘代替旧硬盘
•
Chapter 4 智能存储系统
智能存储系统组成部分:前端、缓存、后端和物理磁盘
前端
前端提供了存储系统与主机之间的接口,它由两部分组成:前端端口和前端控制器。前端端口使得主机能够连接到智能存在系统。每一个前端端口都拥有 相应传输协议的处理逻辑,包括SCSI,iSCSI
前端命令队列:对收到的命令的执行顺序进行决策,以减少不必要的驱动器磁头移动,改善磁盘性能 常见算法
先进先出算法(默认) • 寻道时间优化 • 访问时间优化
•
高速缓存(半导体存储器,为了减少完成主机I/O请求所需时间,数据被暂存在缓存中)
缓存的最小分配单位是页或槽,缓存页的大小是由I/O的大小决定的。缓存由数据存储(保存数据)和标签RAM(记录数据的磁盘中位置)两部分组成。
带有缓存的读操作:每当主机发出一个读请求,前端控制器会通过标签RAM来查询请求的数据有没有保存在缓存中。如果在缓存中找到请求的数据,称为一次读命中。
读性能可以用命中率来衡量。
带有缓存的写操作:一个I/O被写入缓存并得到响应比直接写入磁盘所用的时间要少得多,还可以合并优化。
回写缓存:数据被存入缓存,主机立即响应。
• 直接写操作:数据被存入缓存并立即写到磁盘中,然后响应主机。
•
缓存实现(专用缓存,全局缓存)
缓存管理(为了能够在系统中总是保留一部分页面以及可以在需要时被释放的页面)
最近最少访问算法(Least Recently Used,LRU):连续地监视数据访问,识别出长时间没有被访问的页面。
• 最近访问算法(Most Recently Used,MRU):最近被使用的页面将被释放或标记为可重用。
•
缓存写入数据时,存储系统必须将脏页面刷清以保证或标记为可重用。刷清模式如下
闲置刷清 • 高水位刷清 • 强制刷清
•
缓存数据保护
缓存是易失性存储器,保护方法:
缓存镜像:每次写入缓存的数据都被保存在互相独立的内存条的不同位置上。
• 缓存跳跃:缓存随时面对着因为电源故障而丢失数据的风险。
•
后端(提供了缓存和物理磁盘之间的接口,控制缓存与物理磁盘之间的数据传输。两部分组成:后端端口和后端控制器)
物理磁盘(永久的保存数据),智能存储允许SCSI或光纤通道驱动器和IDE/ATA驱动器混合使用
逻辑设备编号(LUN):物理驱动器或一组RAID保护的驱动器可以被分成若干个逻辑卷,逻辑卷用LUN统一寻址
LUN屏蔽:一种数据访问控制,决定一个主机可以访问哪些LUN。
智能存储阵列(高端存储阵列,中档存储阵列)
高端存储系统:用活动-活动式阵列实现,意味着主机可以利用任何可用的路径去访问他的LUN。为大型企业集中管理数据设计,配备了大量的控制器和缓存内存。
• 中档存储系统:活动-被动式阵列实现,主机要访问一个LUN,只能通过到该LUn的控制器的路径进行访问。(低成本下的最优解决方案)
•
概念实践:EMC CLARiiON(活动-活动式) 和 Symmetrix(活动-被动式)
CLARiiON存储阵列(用模块化的组件构造,不存在单点故障,第一个支持闪存驱动的中档存储系统,闪存驱动器具有30倍的IOPS能力)
CLARiiON CX4 体系结构:关键模块-存储处理器模块(SPE)、磁盘阵列模块(DAE)
该体系结构支持全冗余和热交换组件。 CLARiiON 的组成部分包括:
• • • • •
智能存储处理器(SP) CLARiiON消息接口(CMI) 备用电源(SPS) 链路控制卡(LCC) RLARE操作环境
管理CLARiiON:命令行界面(Naviseccli)、图形用户界面(Navisphere)
Navisphere套件:
•
Navisphere Manager:配置CLARiiOn,基于Web的界面
Navisphere Analyzer:性能分析工具
• Navisphere Agent:主机端工具,建立到系统管理的连接以进行CLI访问
•
Symmetrix 存储阵列(最受信任的平台,Direct Matrix架构,容错设计)
Direct Matrix 架构,其组成:
• • • • •
前端:主机通过通道主控器上的前端端口连接Symmetrix。
后端:后端磁盘主控器负责管理到磁盘驱动器的接口,并负责磁盘驱动器与全局内存之间的数据传输。
全局内存:系统中最重要的部分。所有读写操作都要通过全局内存进行 XCM:XCM是服务处理器和系统中其他处理节点进行通信的代理 Symmetrix Enginuity:EMC Symmetrix的操作环境
第二部分 存储网络技术和虚拟化
Chapter 5 直连存储和SCSI
直连存储(DAS)是一种存储器直接连接到服务器的架构。应用程序使用块级的存取协议从DAS访问数据。SCSI-DAS中使用最典型的协议
DAS类型:
内置DAS:存储设备通过串行或并行总线连接主机 • 外置DAS:服务器直接连接到外部存储设备
•
DAS优缺点:
{1}DAS相对于存储网络需要较低的前期投资。配置简单并且部署容易,需要设置和操作的硬件和软件也更少
{2}DAS不易扩展。有限的端口,有限的带宽。无法优化资源使用。
磁盘驱动器接口
IDE/ATA:集成电路设备/高级技术。IDE部分定义了连接到主板上的控制器的规范,ATA部分规定了连接存储设备到主板的接口
• SATA(Serial ATA):是一个磁盘接口技术,取代并行ATA。采用功效性的7针连接器和线缆来进行连接,可热插拔。
• 并行SCSI:早期最流行的SCSIO的主机存储接口模式。是一套用于连接多种类型的设备,例如扫描仪和打印机。
•
并行SCSI接口
NCR公司开发,与IDE/ATA相比,提供提供更好的性能、可扩展性和兼容性,与设备无关。版本(SCSI-1,2,3)
SCSI-3架构最主要部分:
SCSI-3指令协议 • 传输层协议 • 物理层互连
•
SCSI-3客户-服务器模型 SCSI发起方设备 • SCSI目标放设备
•
SCSI端口
SCSI端口是SCSI的物理连接器,可连接SCSI线缆,用于与SCSI设备通信。一个SCSI设备可以包含目标端口、发起端口和目标/发起端口,或者带多端口的目标端口。
基于端口的不同组合,一个SCSI设备可以分为发起方模型、目标方模型、复合模型或者带多端口的目标方模型。
SCSI通信模型的三个层:
SCSI应用层:包含客户端和服务器端的应用程序,通过SCSI应用程序协议发起和处理SCSI的I/O操作
• SCSI传输协议层:这一层包含发起方和目标方进行通信的服务和协议 • 互连层:实现了发起方和目标方之间的数据传输功能
•
SCSI指令模型
CDB结构:CDB结构发送指令到目标方。定了了与发起方请求相关的,会被设备服务器执行的操作
操作码(operation code)
控制字段(Control)
状态:在指令执行之后,逻辑单元发送状态和标记给客户应用程序
Chapter 6 信息存储与管理介绍
一个高效的信息管理解决方案必须提供如下功能: 即时提供信息给商业用户 • 信息基础设施与业务流程集成 • 灵活易变的存储体系结构
•
光纤通道(Fibre Channel):概览
FC结构式SAN的基本组成元素。光纤通道是一种高速网络技术,运行在高速的光纤线缆和串行铜缆。FC技术主要用于满足
日益增长的数据传输需求,包括主机、服务器、和大规模存储子系统之间的数据传输。
SAN及其演化
存储区域网:通过光纤通道交换机连接服务器和存储器并传输数据。SAN实现了存储整合,允许多个服务器共享存储设备。
它允许用户连接分散在不同地方的服务器和存储器。
SAN组建
SAN由三个组件组成:服务器、网络基础设施和存储设备。这些部件可细分为:节点端口、线缆、互连设备、存储阵列和SAN管理软件
• • • • •
节点端口:每个节点需要一个或多个端口来提供物理接口,用于与其他节点进行通信。每个端口都是双工传输模式,拥有发送和接送链路
布线:SAN的实现使用光纤进行布线。通栏可以用于短距离的后端连接。光纤线缆用光信号来携带数据。分两种:多模和单模 互连设备:集线器、交换机和控制器 存储阵列 SAN管理软件
FC连接
点对点:两个设备直接相连 • 光纤通道仲裁环:设备连接到一个共享的环。在环上的设备必须被仲裁才能获得环的控制权。
• 光纤通道交换fabric:提供互连设备、专用带宽以及可扩展性。在一个交换网里增加或移除设备极少引起网络中断,无影响其他节点
•
光纤通道端口
交换机上的端口分为:
• • • • • •
N端口:一种fabric上的末端端口
NL端口:一种支持仲裁环拓扑的节点端口
E端口:一种FC端口,可以用于两个FC交换机之间的连接 F端口:一种交换机上的端口,用于连接N端口 FL端口:一种fabric端口,用于FC-AL。
G端口:一个通用端口,可作为E端口或者F端口
光纤通道结构(Fc结构是带标准互连设备的通道/网络集成方案) 光纤通道协议(FCP)是串行SCSI-3在FC网络上的一个实现。 FCP关键优势:
在较长距离上保持较高传输带宽 • 支持网络上大量的可寻址设备。 • 显现出通道传输的特性。
•
FCP定义了光纤通道映射层,依照SCSI结构模型定义了光纤通道信息单元
光纤通道协议栈
FC-4高层协议 定义应用程序接口和高层协议
• FC-2传输层 包含有效载荷、源地址和目的地址、链路控制信息
• FC-1传输协议 包括串行编码和解码规则
• FC-0物理接口 定义了物理接口、媒介和原始比特的传输规则
•
光纤通道编址
当一个端口接入到fabric上时,FC地址是动态分配的。Fc地址根据fabric上的不同类型的节点端口,采用不同格式。
FC帧 由5部分组成:帧起始、帧头、数据段、循环冗余校验、帧结尾 帧头定义的字段包括:路由控制、特定类别控制、类型、数据段控制、帧控制
FC数据的结构和组织
交换操作 • 序列 • 帧
•
流量控制:定义了数据传输过程中的数据帧流量的速度。两种机制:缓冲区到缓冲区信用数(BB_Credit)和端到端信任(EE_Credit) 服务类
分区(分区是一种FC交换机的功能,它使得节点在一个fabric里可以被逻辑上分为不同的组,并且在组建进行互相通信) 分区类型: 端口分区 • WWN分区 • 混合分区
•
光纤通道登陆类型 Fabric登陆 • 端口登陆 • 程序注册
•
FC拓扑
Fabric设计是根据标准的拓扑来连接设备的。 核心-边缘Fabric
边缘层包括交换机,核心层包括企业控制器 核心-边缘Fabric的优点 和局限性
提更了更简单的ISL负载计算和流量模式,很容易定位哪些资源更接近他们的处理能力,使其更容易建立一套规则用于增减或分配资源 但,会导致性能相关的问题,核心数增加难以承受
Mesh 拓扑(每个交换机通过ISL直接连接到其他交换机上,是SAN的连接能力变得更强)
实践中的概念:EMC Connectrix Connectrix 交换机 • Connectrix 导向器 • Connectrix 管理工具
•
Chapter 7 网络连接存储
网络连接存储(Networi-attached storage,NAS)是一种连接到局域网的基于IP的文件共享设备。其使用网络协议(TCP/IP,CIFS,NFS等),实现文件归档和存储功能。
通用服务器与NAS设备
NAS设备是专为文件服务功能进行优化的设备,例如存储、检索以及为应用程序和客户端提供文件存取功能等。
NAS的优势
• • • • • • •
支持全面信息存取:共享更高效,支持NAS设备和客户端的多对一和一对多的配置方案
提高效率:消除了通用文件服务器在文件存储过程中的性能瓶颈
增强灵活性:使用工业标准协议,NAS同时兼容UNIX和Windows平台的客户端
集中式存储:集中式数据存储将客户工作站上的数据冗余降低到最小,简化了数据管理,确保了更强的数据保护能力
可扩展性:NAS的高性能和低延迟设计,使它能够针对不同的使用特征和商业应用类型进行部署
高可用性:提供高效的备份和恢复选项,使数据具有更高的可用性 安全性:在工业标准安全模式下,确保安全性、用户鉴权和文件锁等。
NAS文件I/O
NAS的所有I/O操作都使用文件及的访问模式,文件I/O请求里面没有包含磁盘卷或磁盘扇区等信息。
文件系统和远程文件共享:文件系统是一个结构化的数据文件存储和组织形式。许多文件系统都会维护一个文件访问表,用于简化查找和存取文件等操作。
文件系统访问
一个文件系统必须被挂载后才能使用。在大多数情况下,操作系统在启动过程中就会挂载本地文件系统。挂载的过程会创建一个文件系统和操作系统之间的链接。当挂载一个文件系统时,操作系统将文件和目录组成一个树状结构,并且授予用户访问权限。
文件共享
文件传输协议、分布式文件系统和使用文件共享协议的客户/服务器模型 • FTP是一个通过网络来传输数据数据的客户/服务器协议。一个FTP服务器和一个FTP客户端使用TCP作为传输协议来进行互相的通信
• 分布式文件系统是一个分布于不同主机上的文件系统。DFS提供 了主机直接访问整个文件系统的能力,同时保证了管理的高效性和数据的安全性 • 由文件共享协议实现的传统的客户/服务器模型,是另一种远程文件共享机制。
•
NAS组件(集成式、网关式)
集成式NAS:设备在一个单独的容器或机柜中集中了所有NAS组件,包括NAS头和存储器等 • 网关式NAS:网关式NAS设备由独立的NAS头和一个或多个存储阵列组成。 • 集成式NAS连接:集成式解决方案是自包含的,并且可以连接到标准的IP网络上。
• 网关式NAS连接:网关式解决
•
NAS文件共享协议
NFS是UNIX系统中使用最广泛的一种用于文件共享的客户/服务器协议。NFS最初是基于无线连接用户数据包协议(User Datagram Protocol,UDP)的。它使用一种与机器无关的模型来描述用户数据,使用远程过程调用(Remote Procedure Call,RPC)作为两台计算机的进程间通信方法。支持以下几种操作:
查找文件和目录
• 打开、读取、写入和关闭文件 • 修改文件属性
• 修改文件链接和目录
•
CIFS是一种客户/服务器应用协议,支持客户程序通过TCP/IP对处于远程计算机上的文件和服务发起请求。CIFS提供以下特性来确保数据的完整性: 使用文件锁和记录锁 • 运行在TCP上
• 支持容错,并且可以自动恢复简介,重新打开中断之前已经打开的文件
•
NAS的I/O操作
过程如下:
1. 请求者将一个I/O请求封装成TCP/IP报文,通过网络协议栈进行转发。NAS设备从网络上接收请求。
2. NAS设备将I/O请求转换为一种对应的物理存储请求,即块级I/O请求,然后对物理存储池执行相应的操作
3. 当数据从物理存储池返回时,NAS设备对其进行处理并封装为相应的文件
协议响应
4. NAS设备将这个响应封装成TCP/IP报文,通过网络转发给用户
影响NAS性能和可用性的因素
NAS环境里,网络拥塞是最明显的延迟来源。其他影响因素包括:
• • • • • • •
跳转次数:大量的网络包跳转会增加延迟,因为每一次跳转都需要进行IP处理,这就会增加路由器的延迟。
目录服务的认证:例如LDAP、活动目录或NIS:认证服务是必须的,必须拥有充足带宽和资源来支持认证过程产生的负载。
重传:链路错误、缓冲区溢出和流量控制机制都会导致重传 过载的路由器和交换机:过载的设备所需要的响应时间总是比优化状态下使用的或低负载使用的设备所需要的响应时间要长
文件/目录查找和元数据请求:NAS客户访问NAS设备上的文件时,在找到响应的文件或目录之间所需的查找过程也会产生延迟 过载的NAS设备:客户访问多个文件可能造成NAS设备上的使用强度较高,这可通过查看利用率统计数据来确定
过载的客户端:客户端访问CIFS或NFS也会产生过载。
性能改进:
配置VLAN、设置合适的最大传输单元(MTU)和TCP窗口大小可以改进NAS的性能
虚拟局域网(VLAN)是一个从逻辑上进行划分的交换网络。其可以控制总的广播流量,也可用于提供安全防火墙功能
• MTU的设定决定了可以不分段传输的最大报文尺寸。”路径最大传输单元探测“用于发现在网络中传输而不需分段的最大报文尺寸
• TCP窗口大小是指在任何时候网络上一个连接能承受的最大数据量。 • 链路聚合(link aggregation)将两或多个网络接口合并为一个逻辑网络接口来消除冗余,提高可用性
•
NAS实例:EMC Celerra(NAS解决方案)
Celerra同时包括网关式和集成式配置方案。EMC提供了一个支持文件及I/O访问的专用高性能、高速率的基础设施。支持网络数据管理协议(NDMP),用于备份、CIFS、NFS、FTP和iSCSI等。支持以太网信道。
体系结构:有控制站和NSA头(数据移动设备)组成。数据移动设备是一个集网络和存储接口于一体的设备,控制站是一个管理接口设备。 数据移动设备(一个独立的、自治的文件服务器,用于传送请求的文件给客户端)
控制站(主要用于完成控制、管理和配置NAS解决方案,linux下) 存储连接(集成式和网关式
)
Celerra管理软件(命令行或Celerra Manager GUI)
CLI管理:在Control Station上通过SSH接口工具或PUTTY进行访问 • GUI管理——Celerra Manager:通过Celerra Manager 实现的GUI管理。
•
Chapter 8 IP SAN
SAN以块I/O的形式在光纤通道上进行传输,NAS环境中数据以文件I/O的形式在IP网络上传输。希望融合NAS解决方案的高易用性和更低的总拥有成本。支持在IP网络之上的块I/O操作的IP技术符合这种需求。
iSCSI和FCIP(Fibre Chanel over IP)是现行的两种主要的基于IP网络的传输协议。
iSCSI协议是对主机发送或接受的SCSI数据进行封装,使其成为IP数据包然后由以太网卡或iSCSI HBA设备进行传输。
iSCSI
iSCSI是一种基于IP的协议,它通过IP来建立和管理存储设备、主机和桥接设备之间的连接。
iSCSI组件:发起方、目标方、基于IP的网络
iSCSI物理连接设备:标准NIC、TOE NIC、iSCSI HBA iSCSI的连接拓扑:
iSCSI本机模式:该阵列有一个或多个以太网网卡连接到一个标准的以太网交换机,并配置了一个IP地址和侦听端口(无FC -SAN组件)
• iSCSI桥接模式:用外部设备实现从IP网络到光纤通道SAN之间的协议转换和通信。
• iSCSI与FCP的融合模式:FCP和iSCSI组合使用
•
iSCSI协议栈
iSCSI发现实现方式:发送目标发现、网络存储名称服务
iSCSI名称(全球唯一的SCSI标识符,用来命名iSCSI网络内发起方和目标方) iSCSI认证名称(IQN) • 扩展的唯一标识符
•
iSCSI会话可为下列中的一项而建立:
发现发起方的可用目标和指定目标方在网络的位置 • iSCSI正常运行
•
iSCSI PDU
iSCSI发起方和目标方使用iSCSI协议数据单元(PDU)进行通信。所有的iSCSI PDU都包含一个或多个报头部分。
报文的排序和标号
发起方/主机和目标方之间的iSCSI通信是基于请求-应答的命令序列来进行的,可能产生多个PDU,需用命令序列号(CmdSN)对PDU进行编号,状态序列号(StatSN)用于对状态应答进行顺序编号
iSCSI错误处理安全
错误检测和回补可分为3级别: Level 0:会话恢复
• Level 1:消息摘要故障恢复 • Level 2:连接恢复
•
FCIP
FCIP是一种隧道协议,使分散的FC SAN孤岛通过现有的IP网络可以透明地在局域网、城域网和广域网之间互联。使用TCP/IP作为底层协议。
FCIP 拓扑
Chapter 9 内容寻址存储(CAS)
内容寻址存储:已经对象的存储系统,专用于存储被频繁访问的数据即固定内容。旨在提供一种固定内容的安全在心啊存储于检索解决方案。将用户数据和相关属性作为独立对象来存储。存储对象被分配了一个全局唯一的地址,支持单实例存储,避免了多个副本。
固定内容与归档(具有商业价值)
归档的类型:在线归档、近线归档、离线归档
存储的功能和优势
•
•
•
•
•
•
•
• 内容的真实性:CAS保证为存储对象创建一个全局唯一的内容地址并不管检查内容地址 数据完整性:使用哈希算法,并提供审计跟踪保持固定内容的原始状态 位置无关性:使用全局唯一的标识符来检索数据 单实例存储:全局唯一的签名保证了一个对象只保存一个实例 强制保留期:保护和保留数据对象是一个归档系统的核心任务,CAS创建两个不变的组成部分:数据对象和元对象 记录级保护和处置:所有的固定内容在CAS中只存储一次,但会采用某种数据保护方案 技术开放性:CAS系统接口不受技术变化的影响,只要应用服务器能够映射原始内容地址,那么数据就可以被访问 记录快速检索:保证所有内容的“首字节响应时间”为亚秒级
CAS体系结构
客户端借助运行CAS API(应用程序编程接口)的服务器,通过局域网访问基于CAS的存储系统
CAS体系架构是一个独立节点冗余阵列(RAIN)。它是由内部专用局域网连接的一系列存储节点和访问节点组成的集群
CAS核心功能:
• 完整性校验:它确保文件的内容与数字签名相匹配
•
•
•
•
•
•
• 数据保护和节点恢复:确保了存放在CAS系统里的内容在磁盘或节点出现故障时的高可用性 负载均衡:将数据对象分配到多个不同节点,以提供最大的吞吐量、可用性和存储空间使用率 可扩展性:添加节点到集群时不会中断数据的访问,并使得管理成本最小 自我诊断和恢复:自动检测和恢复损坏的对象并警告系统管理员任何潜在的问题。 报告和事件通知:提供要求的报告和事件通知。 容错性:通过使用冗余组件和数据保护方案 审计跟踪:能够对管理活动以及数据的存取和处理进行记录
CAS中的对象存取
术语包括:
•
•
•
•
• 应用程序编程接口(API):定义了用户如何发出服务请求 访问预配置文件(Access Profile):它可以用于应用服务程序到CAS集群的身份严重或CAS集群间的相互验证以进行数据复制 虚拟池(Virtual Pool):使一个单一的逻辑集群能够分成多个数据逻辑分组 二进制大对象(BLOB):内容的实际裸数据,不包括任何描述性信息。 内容地址(Content Address):对象的地址,是根据对象的二进制表示
执行哈希算法的结果。
数据对象的存储过程:
1. 终端用户通过应用程序将要归档的数据发送给CAS API。
2. CAS API将实际数据(BLOB)和元数据区分开来,并根据对象的二进制表
示计算出CA
3. 内容地址和对象的元数据被整合入相应C-Clip描述文件。
4. CAS系统重新计算对象的CA进行验证后,再存储对象,以确保对象的内
容未被修改过
5. 当CDF(描述符文件)的一个镜像副本和BLOB的一个受保护副本成功存
储后,CAS API会收到一个确认信息
6. 通过C-Clip ID,应用程序能够从CAS系统中回读数据
从CAS里检索数据的过程如下:
1. 终端用户或者应用程序请求某个存储对象
2. 应用程序查询存储在本地的C-Clip ID列表,并找到所请求的对象的
C-Clip ID
3. 检索请求和相应的C-Clip ID一起通过API发送到CAS系统
4. CAS系统将所请求的信息发送给应用程序,然后由它转发给最终用户 CAS实例
1.医疗保健行业解决方案:病历存储
2.金融行业解决方案:财务数据存储
实现方法:EMC Centera
EMC Centera是一种简单、经济且安全的信息在线归档解决方案。EMC Centera是首个专为存储和检索固定内容而设计并优化的存储平台。与传统的归档方法相比,EMC Centera提供更快的检索速度、支持但是离存储、保证内容的真实性、具备自我修复功能并支持众多行业监督标准。
EMC Centera模式
EMC Centera Basic:提供所有Centera的功能,但不能配置数据的保留期
• EMC Centera Governance Edition:除了Basic模式功能外
•
• CE+:提供更为严格的法规遵守能力。满足商业环境中 对电子存储介质的
最严格规范
EMC Centera架构
EMC Centera是基于冗余磁盘阵列的体系结构,具有高度可扩展性和PB级存储能力。每个EMC Centera机柜可容纳32个节点,入门级配置只有4个节点和2个内部网络交换机,节点以4个为一组进行扩展。节点运行Linux操作系统和CentraStar软件来实现CAS的所有功能。
内容保护方式:
内容奇偶保护:数据被划分成段,同时添加奇偶校验段
• 内容镜像保护:每一个数据对象都被镜像,每个镜像被放在不同的节点上。 • Centera工具:
EMC Centera浏览器:加载到客户端的图形用户界面工具,通过网络访问Centera
• EMC Centera监控器:用来坚持测EMC Centera中的单个Cube,可显示系
统属性
• EMC Centera控制台:基于Web的管理工具,操作员可看到各种详细信息 • EMC Centera健康报告:每个一段时间,EMC Centera集群自动滴想EMC
客户支持中心或指定人员发送邮件。 •
Chapter 10 存储虚拟化
虚拟化技术通过映射或抽象的方式屏蔽物理资源的复杂性。
虚拟化的形式:
内存虚拟化:虚拟内存使得应用程序好像拥有自己的、独立于现有物理内存资源的连续逻辑内存。(例如VMM)
• 网络虚拟化:建立虚拟的网络,从而使每个应用程序将其自身的 逻辑网络独立于物理网络。(例如VLAN)。(存储区域网虚拟化:是对传统SAN网络的一种最新的演化,一组主机或存储端口使用在屋里SAN上定义的虚拟拓扑来互相通信。)
• 服务器虚拟化:可以让多个操作系统和应用程序同时运行在不同的虚拟机上,这些虚拟机创建在同意物理服务器。
• 存储虚拟化:为主机创建物理存储资源的逻辑视图的过程。一些存储虚拟化的实例是基于主机的卷管理、LUN的创建。。。 •
SNIA(存储网络工业协会)的存储虚拟化分类
第一个层次的存储虚拟化分类定义”创建什么“,它指定虚拟化的类型:块级虚拟化、文件虚拟化、磁盘虚拟化、磁带虚拟化或其他。。。
第二个层次描述虚拟化定义”在哪里“进行。刻画虚拟化:服务器、村粗网络、存储
地单个层指定袋内或带外网络及的虚拟化方法。
存储虚拟化配置
带外存储网络虚拟化中,实行虚拟化的设备是配置在数据通道之外的。 袋内存储网络虚拟化中,虚拟化设备会部署在原来数据通道上。
存储虚拟化的挑战
可扩展性:存储阵列不再被视为是独立的个体,因此必须分析整个存储环境。
• 功能性:包括本地复制、远程复制以及多卷和跨阵列环境中的应用一致性能力。
• 可管理性:可提供一个端到端的视图来整合存储环境中所有的资源。 • 技术支持:虚拟化需融合于现有的存储环境中 •
存储虚拟化的类型
块级存储虚拟化:为SAN的主机和存储阵列之间提供了一个转换层。主机是直接使用虚拟化LUN,而不是直接连到存储阵列的LUN。
• 文件级虚拟化:文件级虚拟化致力于消除NAS环境中的文件访问和文件级存储位置之间的依存关系,这为优化存储利用率、整合服务器和执行不间断文件歉意提供了实现的可能性 •
实现方法
1.EMC Invista
是一个带外的SAN块级存储虚拟化解决方案。它采用定制硬件和智能SAN交换机将物理存储用虚拟化逻辑来表现。这些交换机有能力用网络速度来处理业务数据。他们用专用的软件来检查端口、逻辑卷和发送出来的I/O偏移量,同时可以控制存储设备的I/O目标路径
Invista的主要硬件组件包括控制路径集群(CPC)、数据通道控制器(DPC)和以太网交换机
Invista的运作:当一个I/O请求从主机到达DPC时,她处理这个I/O请求并映射到适当的虚拟目标。如果该命令是SCSI询问有关设备的请求或是一个DPC没有映射信息的I/O请求,CPC会处理这个请求。
Invista的优势:提供了在异构存储环境中块级存储的虚拟化。它还支持不同存储层之间应用不间断地动态卷扩展和数据迁移。
2.Rainfinity
Rainfinity是一个专门的文件级虚拟化的硬件/软件解决方案。Rainfinity的全局文件虚拟化设备向用户提供了一个透明度基于文件的存储虚拟化机制,即使用户在读/写一个文件的数据,这个文件也可以从一个文件服务器迁移到另一个
Rainfinity的组建:64位处理器、16GB告诉内存缓存。两个被配置RAID1的热插拔SCSI硬盘作为高速缓冲。软件包括Rainfinity code、Windows Proxy Service
Rainfinity的运作:在NAS环境中,文件服务器和Rainfinity设备通过网络妇联。Rainfinity需要一个单独网络VLAN,这样就不会对缘由的数据通道和用户连接产生影响。当为了存储成本优化或性能优化进行数据迁移时,数据在
Rainfinity和在VLAN中与文件服务器连接的端口之间移动。Rainfinity将数据迁移作为一个事物处理而且有能力进行事物回滚。Rainfinity利用了袋内和带外方法的最佳特性。
全局命名空间管理(GNA):允许存储管理员为用户网络存储环境中的共享文件资源提供一个唯一的逻辑名字,并建立一个统一的名字空间。
Part 3 业务连续性
Chapter 13 业务连续性概述
业务连续性(BC)是一个企业级集成的过程,该过程包括了一个企业为了缓解已知和未知停机时间带来的影响所做的全部内容和外部的活动。BC需要对由于系统中断带来的各种对业务操作的影响进行准备、响应和恢复。BC设计一些主动性的措施以及一些在故障发生时采取的补救措施。
信息可用性(在业务操作特定时间内根据业务期望能提供的从基础架构到业务功能的能力,它确保人们在任何需要的时候都能获取信息)
信息可用性可以借助可靠性、可获性以及合时性
可靠性:指在特定的条件下以及一定的时间内部件无故障运行的能力 • 可获性:一种状态。在这种状态下所需的信息所需的信息能够在正确的位置提供给正确的用户。
• 合时性:定义信息可用的确切时刻或者时间窗 •
信息不可用的因素:计划的和未计划的
•
信息可用性度量
MTBF指对一个系统或者部件在两次故障间运行其正常功能的平均时间 • MTTR指修复一个故障不见的平均时间。当计算MTTR时,需假设引起故障的原因能准确定位,并且用户修复的时间和人力也是可获得的 •
BC术语
灾难恢复:当灾难发生时为了支持重要的业务操作而进行的对系统、数据和基础架构的恢复等一系列过程。
• 灾难重启动:指利用基于镜像的、一致的数据和应用的备份重新启动业务操作的过程。
• 恢复点目标(RPO):指中断之后系统和数据必须恢复到的时间点。RPO定义了业务能够承受的数据损失量。大的RPO意味着系统对信息损失有着较高的容忍度。组织可计划制定备份和复制最小频率
•
BC计划生命周期
整个BC过程可定义为一个活动生命周期:
1. 确定目标
2. 分析
3. 设计开发
4. 实现
5. 训练、测试、评估和维护
故障分析
单点故障:指那些能够终止真个系统或者IT服务可用性的单个部件的故障
• 容错:为了缓解单点故障,系统设计时采用冗余方式。这样只有在所有冗余组部件都失效时系统才会失效,这样做确保了单点故障不会影响数据的可用性
• 多路径软件:配置多个路径方式通过路径的容错转移增加了数据可用性。 • 业务影响分析(BIA):识别并评估对重要业务过程中断带来的财务、操作和服务的影响。为了支持信息可用性,对有选择的几个功能区域进行评估以确定基础架构的弹性。BIA过程以报告西瓜是详细说明了各种事件及对业务功能的影响。这种影响有可能以时间和金钱的形式说明。BIA包括下列的任务。
•
•
•
•
• 说明对操作至关重要的关键业务过程 以应用、数据库以及软硬件需求的方式确定业务过程的属性 对每个业务过程评估故障成本 对每个业务过程计算最大可容忍的中断并定义RTO和RPO 确立用于业务过程的最小资源要求
BC技术方案
备份和恢复
• 基于存储阵列的复制(本地)
• 基于存储阵列的复制(远程)
• 基于主机的复制 •
实例:EMC PowerPath
PowerPath特征
在线路径配置和管理
• 多路径动态负载平衡
• 自动路径失败切换
• 主动路径测试 •
机群支持
• 互操作性 •
PowerPath负载平衡,原则:
循环策略:I/O请求以循环的方式分配给每一个可用路径
• 最少I/O政策:I/O请求被路由到具有最少I/O请求队列的路径上,而不管总的I/O块数目
• 最少块策略:I/O请求被路由到具有最少I/O队列的路径上
• 基于优先级策略:基于读写、用户指定设备或者应用优先级 •
Chapter 12 备份和恢复
备份的目的:灾难恢复、可操作备份、归档
备份考虑:
数据丢失的多少以及用RTO和RPO衡量的业务能容忍的停机时间是选择实现特定备份策略的主要考虑因素
• 文件的位置、大小及其数目引起影响备份的过程
• 备份的性能也依赖与备份所用的介质 •
备份粒度
备份粒度依赖于业务需求和RTO/RPO时间。根据不同粒度,备份可分为全备份、累积备份和增量备份。
Summarized by NIRVANA 新浪微博:Win都是XP
EMC 版 信息存储与管理
第一部分 存储系统
Chapter 1 信息存储与管理的介绍 信息存储
数据增长因素
数据处理能力的上升 • 数字存储成本的低成本 • 可负担的和更快的通讯技术
•
有价值的数据:地震、生产数据、客户数据、医疗数据
数据类型
结构化数据:按行和列这种严格的格式组织。数据库存储系统存储 • 非结构化数据:不是按行列存储。如便签、商业名片、数字格式名片
•
信息:从数据中提取出来的知识
存储:目的是在进一步处理时可以进行访问
存储技术特点和架构发展
存储技术突出点:
冗余磁盘阵列(redundant array of independent disk,RAID)在DAS、SAN等存储架构中都有使用
• 直连存储(Direct-attached Storage,DAS)存储设备直接连接到服务器(组)。
• 存储区域网(Storage Area Network,SAN)专用的、高性能的光纤通道网络,用来完成服务器和存储设备之间块级别的通信。存储设备被分区并指定给不同服务器,从而被分别访问。主要为文件服务类应用提供存储服务
•
网络互联存储(Network-attached Storage,NAS)专用于文件服务类应用的存储设备。通过现有的通信网络(LAN)连接,并未不同客户提供文件访问
• IP存储区域网(IPSAN)是SAN和NAS的继承。提供了在局域网和广域网上的块级别传输
•
数据中心基础设施(包括:计算机、存储系统、网络设备、专用备用电源、环境控制设备)
核心部件:
• • • • •
应用 数据库
服务器和操作系统 网络 存储阵列
数据中心部件的关键需求
• • • • • • •
可用性 安全性 可扩展性 性能
数据完整性 容量 可管理性
管理存储基础设施 监控 • 报告 • 供应
•
信息管理中的挑战
数字世界的爆炸 • 书信息依赖的上升 • 信息价值的改变
•
信息生命周期:随着时间变化而发生的“信息价值的改变”
信息生命周期管理(Information Lifecycle Management,ILM):一种主动的策略,允许一个IT组织根据预先定义的商业策略来高效地管理数据的整个生命周期,并通过优化存储基础设施来实现最大的投资回报。 其特征:
• • • • •
以业务为中心 集中式管理 基于策略的 异构的:一个ILM策略应该把所有类型的存储平台和操作系统都考虑进来 优化的
其实现: 分类 • 实现 • 管理 • 组织
•
其优点:
• • • • •
更高的资源利用率 简化的管理 更广泛的选择 维护约定
更低的总拥有成本(TCO)
Chapter 2 存储系统环境
存储环境的组成(主机、连接、存储设备)
主机(物理部件、逻辑部件)
物理部件: CPU
• 存储设备 • I/O设备
•
连接(主机与外围设备的互连。物理部件、逻辑部件)
连接的物理部件(总线(分为系统总线和I/O总线)、端口、电缆)
串行:比特位在单个通道中按顺序进行传输 并行:比特位同时在多个通路中进行传输 连接的逻辑部件(协议)
PCI:规定了PCI扩展卡与CPU如何交换信息 • IDE/ATA:磁盘最常用的借口协议
• SCSI :最初用于并行借口,现在功能更多。
•
磁盘驱动部件
核心部件:盘片、主轴、读写头、驱动臂、控制器
磁盘驱动器的性能(寻道时间、旋转延迟、数据传输速率)
•
寻道时间:读写头在盘面上移动进行定位的时间。(全程时间、平均时间、相邻磁道时间)
旋转延迟:盘片旋转以定位读写头下方的数据所用的时间
• 数据传输速率:每个单位时间磁盘能够传输到HBA(主机总线配置器)的平均数据量
•
影响磁盘性能的基本准则 将磁盘看成两部分:
队列:用于存放等待I/O控制器处理的I/O请求 • 磁盘I/O控制器:依次处理队列中的I/O请求
•
两定律:
Little定律:N=a×R • 利用率定律:
U=a×Ns
•
主机的逻辑部件:
• • • • •
操作系统(OS)
设备驱动(Device Driver)
卷管理器(LVM):运行在物理机器上管理逻辑与物理存储设备的软件。可划分和合成磁盘空间。基本部件:物理卷、卷组、逻辑卷
文件系统(File System):通过使用目录把大量文件的分层组织结构。常见文件系统:FAT32、NTFS、UFS
应用:提供计算机操作逻辑的计算机程序。数据访问:块级别访问、文件级别访问
应用程序的需求和磁盘的性能 入手点:
分析最高负载时产生的I/O数量 • 记录下应用程序I/O大小或是块大小
•
Chapter 3 数据保护:RAID
RAID是一种将多块磁盘形成一个有机整体,使之能够在硬盘故障时提供数据保护的技术。
RAID的实现
软件实现:性能上占用CPU开销,功能上不支持所有RAID级别,需考虑兼容性
• 硬件实现:硬件RAID(专用硬件控制器实现)、控制卡RAID(控制卡和PCI总线交互)、外部RAID控制器(基于阵列,通过协议)
•
RAID阵列的组成:物理阵列、逻辑阵列、RAID控制器、RAID集
RAID级别
分条(Striping)
条带(Stripe):磁盘上一块由若干地址连续的磁盘块构成的、大小固定的区域
• 条带尺寸:构成条带的磁盘块数目
• 分条尺寸:条带尺寸与RAID集中硬盘数量的乘积。
•
数据镜像(将同一数据存储在两块不同的硬盘上,从而产生两个副本,用于保护数据)
奇偶校验(既能为分条RAID提供数据保护,又能避免镜像所需开销的方法):往分条中增加一个硬盘来储存校验值。通过
数学方法构造的校验值能够重建丢失的数据。计算采用位异或操作
RAID 0 数据是分带存储在RAID集的各个硬盘上的,因此利用了全部的存储空间
RAID 1(通过数据镜像来提升容错性)
嵌套RAID(许多数据中心对RAID阵列的数据冗余和性能都有需求)
RAID 3(通过存储分带提供高性能,并利用奇偶校验提升容错性)RAID 4(与RAID 3 类似,支持独立访问)
RAID 5(磁盘上的存储带是可以单独存取的,校验值分布存储在所有磁盘上)
RAID 6(与RAID 5 类似)
RAID对磁盘性能的影响
写代价:对于急于镜像和校验的RAID系统,每个写操作都会对磁盘产生额外的I/O开销。
热备用(RAID阵列中用于临时替代RAID集中故障硬盘的备用硬盘)
数据恢复方法
如采用校验RAID,则按照RAID集中的校验值和幸存硬盘上的数据重建数据。
• 如采用镜像RAID,则从存活镜像上复制数据 • 新硬盘代替旧硬盘
•
Chapter 4 智能存储系统
智能存储系统组成部分:前端、缓存、后端和物理磁盘
前端
前端提供了存储系统与主机之间的接口,它由两部分组成:前端端口和前端控制器。前端端口使得主机能够连接到智能存在系统。每一个前端端口都拥有 相应传输协议的处理逻辑,包括SCSI,iSCSI
前端命令队列:对收到的命令的执行顺序进行决策,以减少不必要的驱动器磁头移动,改善磁盘性能 常见算法
先进先出算法(默认) • 寻道时间优化 • 访问时间优化
•
高速缓存(半导体存储器,为了减少完成主机I/O请求所需时间,数据被暂存在缓存中)
缓存的最小分配单位是页或槽,缓存页的大小是由I/O的大小决定的。缓存由数据存储(保存数据)和标签RAM(记录数据的磁盘中位置)两部分组成。
带有缓存的读操作:每当主机发出一个读请求,前端控制器会通过标签RAM来查询请求的数据有没有保存在缓存中。如果在缓存中找到请求的数据,称为一次读命中。
读性能可以用命中率来衡量。
带有缓存的写操作:一个I/O被写入缓存并得到响应比直接写入磁盘所用的时间要少得多,还可以合并优化。
回写缓存:数据被存入缓存,主机立即响应。
• 直接写操作:数据被存入缓存并立即写到磁盘中,然后响应主机。
•
缓存实现(专用缓存,全局缓存)
缓存管理(为了能够在系统中总是保留一部分页面以及可以在需要时被释放的页面)
最近最少访问算法(Least Recently Used,LRU):连续地监视数据访问,识别出长时间没有被访问的页面。
• 最近访问算法(Most Recently Used,MRU):最近被使用的页面将被释放或标记为可重用。
•
缓存写入数据时,存储系统必须将脏页面刷清以保证或标记为可重用。刷清模式如下
闲置刷清 • 高水位刷清 • 强制刷清
•
缓存数据保护
缓存是易失性存储器,保护方法:
缓存镜像:每次写入缓存的数据都被保存在互相独立的内存条的不同位置上。
• 缓存跳跃:缓存随时面对着因为电源故障而丢失数据的风险。
•
后端(提供了缓存和物理磁盘之间的接口,控制缓存与物理磁盘之间的数据传输。两部分组成:后端端口和后端控制器)
物理磁盘(永久的保存数据),智能存储允许SCSI或光纤通道驱动器和IDE/ATA驱动器混合使用
逻辑设备编号(LUN):物理驱动器或一组RAID保护的驱动器可以被分成若干个逻辑卷,逻辑卷用LUN统一寻址
LUN屏蔽:一种数据访问控制,决定一个主机可以访问哪些LUN。
智能存储阵列(高端存储阵列,中档存储阵列)
高端存储系统:用活动-活动式阵列实现,意味着主机可以利用任何可用的路径去访问他的LUN。为大型企业集中管理数据设计,配备了大量的控制器和缓存内存。
• 中档存储系统:活动-被动式阵列实现,主机要访问一个LUN,只能通过到该LUn的控制器的路径进行访问。(低成本下的最优解决方案)
•
概念实践:EMC CLARiiON(活动-活动式) 和 Symmetrix(活动-被动式)
CLARiiON存储阵列(用模块化的组件构造,不存在单点故障,第一个支持闪存驱动的中档存储系统,闪存驱动器具有30倍的IOPS能力)
CLARiiON CX4 体系结构:关键模块-存储处理器模块(SPE)、磁盘阵列模块(DAE)
该体系结构支持全冗余和热交换组件。 CLARiiON 的组成部分包括:
• • • • •
智能存储处理器(SP) CLARiiON消息接口(CMI) 备用电源(SPS) 链路控制卡(LCC) RLARE操作环境
管理CLARiiON:命令行界面(Naviseccli)、图形用户界面(Navisphere)
Navisphere套件:
•
Navisphere Manager:配置CLARiiOn,基于Web的界面
Navisphere Analyzer:性能分析工具
• Navisphere Agent:主机端工具,建立到系统管理的连接以进行CLI访问
•
Symmetrix 存储阵列(最受信任的平台,Direct Matrix架构,容错设计)
Direct Matrix 架构,其组成:
• • • • •
前端:主机通过通道主控器上的前端端口连接Symmetrix。
后端:后端磁盘主控器负责管理到磁盘驱动器的接口,并负责磁盘驱动器与全局内存之间的数据传输。
全局内存:系统中最重要的部分。所有读写操作都要通过全局内存进行 XCM:XCM是服务处理器和系统中其他处理节点进行通信的代理 Symmetrix Enginuity:EMC Symmetrix的操作环境
第二部分 存储网络技术和虚拟化
Chapter 5 直连存储和SCSI
直连存储(DAS)是一种存储器直接连接到服务器的架构。应用程序使用块级的存取协议从DAS访问数据。SCSI-DAS中使用最典型的协议
DAS类型:
内置DAS:存储设备通过串行或并行总线连接主机 • 外置DAS:服务器直接连接到外部存储设备
•
DAS优缺点:
{1}DAS相对于存储网络需要较低的前期投资。配置简单并且部署容易,需要设置和操作的硬件和软件也更少
{2}DAS不易扩展。有限的端口,有限的带宽。无法优化资源使用。
磁盘驱动器接口
IDE/ATA:集成电路设备/高级技术。IDE部分定义了连接到主板上的控制器的规范,ATA部分规定了连接存储设备到主板的接口
• SATA(Serial ATA):是一个磁盘接口技术,取代并行ATA。采用功效性的7针连接器和线缆来进行连接,可热插拔。
• 并行SCSI:早期最流行的SCSIO的主机存储接口模式。是一套用于连接多种类型的设备,例如扫描仪和打印机。
•
并行SCSI接口
NCR公司开发,与IDE/ATA相比,提供提供更好的性能、可扩展性和兼容性,与设备无关。版本(SCSI-1,2,3)
SCSI-3架构最主要部分:
SCSI-3指令协议 • 传输层协议 • 物理层互连
•
SCSI-3客户-服务器模型 SCSI发起方设备 • SCSI目标放设备
•
SCSI端口
SCSI端口是SCSI的物理连接器,可连接SCSI线缆,用于与SCSI设备通信。一个SCSI设备可以包含目标端口、发起端口和目标/发起端口,或者带多端口的目标端口。
基于端口的不同组合,一个SCSI设备可以分为发起方模型、目标方模型、复合模型或者带多端口的目标方模型。
SCSI通信模型的三个层:
SCSI应用层:包含客户端和服务器端的应用程序,通过SCSI应用程序协议发起和处理SCSI的I/O操作
• SCSI传输协议层:这一层包含发起方和目标方进行通信的服务和协议 • 互连层:实现了发起方和目标方之间的数据传输功能
•
SCSI指令模型
CDB结构:CDB结构发送指令到目标方。定了了与发起方请求相关的,会被设备服务器执行的操作
操作码(operation code)
控制字段(Control)
状态:在指令执行之后,逻辑单元发送状态和标记给客户应用程序
Chapter 6 信息存储与管理介绍
一个高效的信息管理解决方案必须提供如下功能: 即时提供信息给商业用户 • 信息基础设施与业务流程集成 • 灵活易变的存储体系结构
•
光纤通道(Fibre Channel):概览
FC结构式SAN的基本组成元素。光纤通道是一种高速网络技术,运行在高速的光纤线缆和串行铜缆。FC技术主要用于满足
日益增长的数据传输需求,包括主机、服务器、和大规模存储子系统之间的数据传输。
SAN及其演化
存储区域网:通过光纤通道交换机连接服务器和存储器并传输数据。SAN实现了存储整合,允许多个服务器共享存储设备。
它允许用户连接分散在不同地方的服务器和存储器。
SAN组建
SAN由三个组件组成:服务器、网络基础设施和存储设备。这些部件可细分为:节点端口、线缆、互连设备、存储阵列和SAN管理软件
• • • • •
节点端口:每个节点需要一个或多个端口来提供物理接口,用于与其他节点进行通信。每个端口都是双工传输模式,拥有发送和接送链路
布线:SAN的实现使用光纤进行布线。通栏可以用于短距离的后端连接。光纤线缆用光信号来携带数据。分两种:多模和单模 互连设备:集线器、交换机和控制器 存储阵列 SAN管理软件
FC连接
点对点:两个设备直接相连 • 光纤通道仲裁环:设备连接到一个共享的环。在环上的设备必须被仲裁才能获得环的控制权。
• 光纤通道交换fabric:提供互连设备、专用带宽以及可扩展性。在一个交换网里增加或移除设备极少引起网络中断,无影响其他节点
•
光纤通道端口
交换机上的端口分为:
• • • • • •
N端口:一种fabric上的末端端口
NL端口:一种支持仲裁环拓扑的节点端口
E端口:一种FC端口,可以用于两个FC交换机之间的连接 F端口:一种交换机上的端口,用于连接N端口 FL端口:一种fabric端口,用于FC-AL。
G端口:一个通用端口,可作为E端口或者F端口
光纤通道结构(Fc结构是带标准互连设备的通道/网络集成方案) 光纤通道协议(FCP)是串行SCSI-3在FC网络上的一个实现。 FCP关键优势:
在较长距离上保持较高传输带宽 • 支持网络上大量的可寻址设备。 • 显现出通道传输的特性。
•
FCP定义了光纤通道映射层,依照SCSI结构模型定义了光纤通道信息单元
光纤通道协议栈
FC-4高层协议 定义应用程序接口和高层协议
• FC-2传输层 包含有效载荷、源地址和目的地址、链路控制信息
• FC-1传输协议 包括串行编码和解码规则
• FC-0物理接口 定义了物理接口、媒介和原始比特的传输规则
•
光纤通道编址
当一个端口接入到fabric上时,FC地址是动态分配的。Fc地址根据fabric上的不同类型的节点端口,采用不同格式。
FC帧 由5部分组成:帧起始、帧头、数据段、循环冗余校验、帧结尾 帧头定义的字段包括:路由控制、特定类别控制、类型、数据段控制、帧控制
FC数据的结构和组织
交换操作 • 序列 • 帧
•
流量控制:定义了数据传输过程中的数据帧流量的速度。两种机制:缓冲区到缓冲区信用数(BB_Credit)和端到端信任(EE_Credit) 服务类
分区(分区是一种FC交换机的功能,它使得节点在一个fabric里可以被逻辑上分为不同的组,并且在组建进行互相通信) 分区类型: 端口分区 • WWN分区 • 混合分区
•
光纤通道登陆类型 Fabric登陆 • 端口登陆 • 程序注册
•
FC拓扑
Fabric设计是根据标准的拓扑来连接设备的。 核心-边缘Fabric
边缘层包括交换机,核心层包括企业控制器 核心-边缘Fabric的优点 和局限性
提更了更简单的ISL负载计算和流量模式,很容易定位哪些资源更接近他们的处理能力,使其更容易建立一套规则用于增减或分配资源 但,会导致性能相关的问题,核心数增加难以承受
Mesh 拓扑(每个交换机通过ISL直接连接到其他交换机上,是SAN的连接能力变得更强)
实践中的概念:EMC Connectrix Connectrix 交换机 • Connectrix 导向器 • Connectrix 管理工具
•
Chapter 7 网络连接存储
网络连接存储(Networi-attached storage,NAS)是一种连接到局域网的基于IP的文件共享设备。其使用网络协议(TCP/IP,CIFS,NFS等),实现文件归档和存储功能。
通用服务器与NAS设备
NAS设备是专为文件服务功能进行优化的设备,例如存储、检索以及为应用程序和客户端提供文件存取功能等。
NAS的优势
• • • • • • •
支持全面信息存取:共享更高效,支持NAS设备和客户端的多对一和一对多的配置方案
提高效率:消除了通用文件服务器在文件存储过程中的性能瓶颈
增强灵活性:使用工业标准协议,NAS同时兼容UNIX和Windows平台的客户端
集中式存储:集中式数据存储将客户工作站上的数据冗余降低到最小,简化了数据管理,确保了更强的数据保护能力
可扩展性:NAS的高性能和低延迟设计,使它能够针对不同的使用特征和商业应用类型进行部署
高可用性:提供高效的备份和恢复选项,使数据具有更高的可用性 安全性:在工业标准安全模式下,确保安全性、用户鉴权和文件锁等。
NAS文件I/O
NAS的所有I/O操作都使用文件及的访问模式,文件I/O请求里面没有包含磁盘卷或磁盘扇区等信息。
文件系统和远程文件共享:文件系统是一个结构化的数据文件存储和组织形式。许多文件系统都会维护一个文件访问表,用于简化查找和存取文件等操作。
文件系统访问
一个文件系统必须被挂载后才能使用。在大多数情况下,操作系统在启动过程中就会挂载本地文件系统。挂载的过程会创建一个文件系统和操作系统之间的链接。当挂载一个文件系统时,操作系统将文件和目录组成一个树状结构,并且授予用户访问权限。
文件共享
文件传输协议、分布式文件系统和使用文件共享协议的客户/服务器模型 • FTP是一个通过网络来传输数据数据的客户/服务器协议。一个FTP服务器和一个FTP客户端使用TCP作为传输协议来进行互相的通信
• 分布式文件系统是一个分布于不同主机上的文件系统。DFS提供 了主机直接访问整个文件系统的能力,同时保证了管理的高效性和数据的安全性 • 由文件共享协议实现的传统的客户/服务器模型,是另一种远程文件共享机制。
•
NAS组件(集成式、网关式)
集成式NAS:设备在一个单独的容器或机柜中集中了所有NAS组件,包括NAS头和存储器等 • 网关式NAS:网关式NAS设备由独立的NAS头和一个或多个存储阵列组成。 • 集成式NAS连接:集成式解决方案是自包含的,并且可以连接到标准的IP网络上。
• 网关式NAS连接:网关式解决
•
NAS文件共享协议
NFS是UNIX系统中使用最广泛的一种用于文件共享的客户/服务器协议。NFS最初是基于无线连接用户数据包协议(User Datagram Protocol,UDP)的。它使用一种与机器无关的模型来描述用户数据,使用远程过程调用(Remote Procedure Call,RPC)作为两台计算机的进程间通信方法。支持以下几种操作:
查找文件和目录
• 打开、读取、写入和关闭文件 • 修改文件属性
• 修改文件链接和目录
•
CIFS是一种客户/服务器应用协议,支持客户程序通过TCP/IP对处于远程计算机上的文件和服务发起请求。CIFS提供以下特性来确保数据的完整性: 使用文件锁和记录锁 • 运行在TCP上
• 支持容错,并且可以自动恢复简介,重新打开中断之前已经打开的文件
•
NAS的I/O操作
过程如下:
1. 请求者将一个I/O请求封装成TCP/IP报文,通过网络协议栈进行转发。NAS设备从网络上接收请求。
2. NAS设备将I/O请求转换为一种对应的物理存储请求,即块级I/O请求,然后对物理存储池执行相应的操作
3. 当数据从物理存储池返回时,NAS设备对其进行处理并封装为相应的文件
协议响应
4. NAS设备将这个响应封装成TCP/IP报文,通过网络转发给用户
影响NAS性能和可用性的因素
NAS环境里,网络拥塞是最明显的延迟来源。其他影响因素包括:
• • • • • • •
跳转次数:大量的网络包跳转会增加延迟,因为每一次跳转都需要进行IP处理,这就会增加路由器的延迟。
目录服务的认证:例如LDAP、活动目录或NIS:认证服务是必须的,必须拥有充足带宽和资源来支持认证过程产生的负载。
重传:链路错误、缓冲区溢出和流量控制机制都会导致重传 过载的路由器和交换机:过载的设备所需要的响应时间总是比优化状态下使用的或低负载使用的设备所需要的响应时间要长
文件/目录查找和元数据请求:NAS客户访问NAS设备上的文件时,在找到响应的文件或目录之间所需的查找过程也会产生延迟 过载的NAS设备:客户访问多个文件可能造成NAS设备上的使用强度较高,这可通过查看利用率统计数据来确定
过载的客户端:客户端访问CIFS或NFS也会产生过载。
性能改进:
配置VLAN、设置合适的最大传输单元(MTU)和TCP窗口大小可以改进NAS的性能
虚拟局域网(VLAN)是一个从逻辑上进行划分的交换网络。其可以控制总的广播流量,也可用于提供安全防火墙功能
• MTU的设定决定了可以不分段传输的最大报文尺寸。”路径最大传输单元探测“用于发现在网络中传输而不需分段的最大报文尺寸
• TCP窗口大小是指在任何时候网络上一个连接能承受的最大数据量。 • 链路聚合(link aggregation)将两或多个网络接口合并为一个逻辑网络接口来消除冗余,提高可用性
•
NAS实例:EMC Celerra(NAS解决方案)
Celerra同时包括网关式和集成式配置方案。EMC提供了一个支持文件及I/O访问的专用高性能、高速率的基础设施。支持网络数据管理协议(NDMP),用于备份、CIFS、NFS、FTP和iSCSI等。支持以太网信道。
体系结构:有控制站和NSA头(数据移动设备)组成。数据移动设备是一个集网络和存储接口于一体的设备,控制站是一个管理接口设备。 数据移动设备(一个独立的、自治的文件服务器,用于传送请求的文件给客户端)
控制站(主要用于完成控制、管理和配置NAS解决方案,linux下) 存储连接(集成式和网关式
)
Celerra管理软件(命令行或Celerra Manager GUI)
CLI管理:在Control Station上通过SSH接口工具或PUTTY进行访问 • GUI管理——Celerra Manager:通过Celerra Manager 实现的GUI管理。
•
Chapter 8 IP SAN
SAN以块I/O的形式在光纤通道上进行传输,NAS环境中数据以文件I/O的形式在IP网络上传输。希望融合NAS解决方案的高易用性和更低的总拥有成本。支持在IP网络之上的块I/O操作的IP技术符合这种需求。
iSCSI和FCIP(Fibre Chanel over IP)是现行的两种主要的基于IP网络的传输协议。
iSCSI协议是对主机发送或接受的SCSI数据进行封装,使其成为IP数据包然后由以太网卡或iSCSI HBA设备进行传输。
iSCSI
iSCSI是一种基于IP的协议,它通过IP来建立和管理存储设备、主机和桥接设备之间的连接。
iSCSI组件:发起方、目标方、基于IP的网络
iSCSI物理连接设备:标准NIC、TOE NIC、iSCSI HBA iSCSI的连接拓扑:
iSCSI本机模式:该阵列有一个或多个以太网网卡连接到一个标准的以太网交换机,并配置了一个IP地址和侦听端口(无FC -SAN组件)
• iSCSI桥接模式:用外部设备实现从IP网络到光纤通道SAN之间的协议转换和通信。
• iSCSI与FCP的融合模式:FCP和iSCSI组合使用
•
iSCSI协议栈
iSCSI发现实现方式:发送目标发现、网络存储名称服务
iSCSI名称(全球唯一的SCSI标识符,用来命名iSCSI网络内发起方和目标方) iSCSI认证名称(IQN) • 扩展的唯一标识符
•
iSCSI会话可为下列中的一项而建立:
发现发起方的可用目标和指定目标方在网络的位置 • iSCSI正常运行
•
iSCSI PDU
iSCSI发起方和目标方使用iSCSI协议数据单元(PDU)进行通信。所有的iSCSI PDU都包含一个或多个报头部分。
报文的排序和标号
发起方/主机和目标方之间的iSCSI通信是基于请求-应答的命令序列来进行的,可能产生多个PDU,需用命令序列号(CmdSN)对PDU进行编号,状态序列号(StatSN)用于对状态应答进行顺序编号
iSCSI错误处理安全
错误检测和回补可分为3级别: Level 0:会话恢复
• Level 1:消息摘要故障恢复 • Level 2:连接恢复
•
FCIP
FCIP是一种隧道协议,使分散的FC SAN孤岛通过现有的IP网络可以透明地在局域网、城域网和广域网之间互联。使用TCP/IP作为底层协议。
FCIP 拓扑
Chapter 9 内容寻址存储(CAS)
内容寻址存储:已经对象的存储系统,专用于存储被频繁访问的数据即固定内容。旨在提供一种固定内容的安全在心啊存储于检索解决方案。将用户数据和相关属性作为独立对象来存储。存储对象被分配了一个全局唯一的地址,支持单实例存储,避免了多个副本。
固定内容与归档(具有商业价值)
归档的类型:在线归档、近线归档、离线归档
存储的功能和优势
•
•
•
•
•
•
•
• 内容的真实性:CAS保证为存储对象创建一个全局唯一的内容地址并不管检查内容地址 数据完整性:使用哈希算法,并提供审计跟踪保持固定内容的原始状态 位置无关性:使用全局唯一的标识符来检索数据 单实例存储:全局唯一的签名保证了一个对象只保存一个实例 强制保留期:保护和保留数据对象是一个归档系统的核心任务,CAS创建两个不变的组成部分:数据对象和元对象 记录级保护和处置:所有的固定内容在CAS中只存储一次,但会采用某种数据保护方案 技术开放性:CAS系统接口不受技术变化的影响,只要应用服务器能够映射原始内容地址,那么数据就可以被访问 记录快速检索:保证所有内容的“首字节响应时间”为亚秒级
CAS体系结构
客户端借助运行CAS API(应用程序编程接口)的服务器,通过局域网访问基于CAS的存储系统
CAS体系架构是一个独立节点冗余阵列(RAIN)。它是由内部专用局域网连接的一系列存储节点和访问节点组成的集群
CAS核心功能:
• 完整性校验:它确保文件的内容与数字签名相匹配
•
•
•
•
•
•
• 数据保护和节点恢复:确保了存放在CAS系统里的内容在磁盘或节点出现故障时的高可用性 负载均衡:将数据对象分配到多个不同节点,以提供最大的吞吐量、可用性和存储空间使用率 可扩展性:添加节点到集群时不会中断数据的访问,并使得管理成本最小 自我诊断和恢复:自动检测和恢复损坏的对象并警告系统管理员任何潜在的问题。 报告和事件通知:提供要求的报告和事件通知。 容错性:通过使用冗余组件和数据保护方案 审计跟踪:能够对管理活动以及数据的存取和处理进行记录
CAS中的对象存取
术语包括:
•
•
•
•
• 应用程序编程接口(API):定义了用户如何发出服务请求 访问预配置文件(Access Profile):它可以用于应用服务程序到CAS集群的身份严重或CAS集群间的相互验证以进行数据复制 虚拟池(Virtual Pool):使一个单一的逻辑集群能够分成多个数据逻辑分组 二进制大对象(BLOB):内容的实际裸数据,不包括任何描述性信息。 内容地址(Content Address):对象的地址,是根据对象的二进制表示
执行哈希算法的结果。
数据对象的存储过程:
1. 终端用户通过应用程序将要归档的数据发送给CAS API。
2. CAS API将实际数据(BLOB)和元数据区分开来,并根据对象的二进制表
示计算出CA
3. 内容地址和对象的元数据被整合入相应C-Clip描述文件。
4. CAS系统重新计算对象的CA进行验证后,再存储对象,以确保对象的内
容未被修改过
5. 当CDF(描述符文件)的一个镜像副本和BLOB的一个受保护副本成功存
储后,CAS API会收到一个确认信息
6. 通过C-Clip ID,应用程序能够从CAS系统中回读数据
从CAS里检索数据的过程如下:
1. 终端用户或者应用程序请求某个存储对象
2. 应用程序查询存储在本地的C-Clip ID列表,并找到所请求的对象的
C-Clip ID
3. 检索请求和相应的C-Clip ID一起通过API发送到CAS系统
4. CAS系统将所请求的信息发送给应用程序,然后由它转发给最终用户 CAS实例
1.医疗保健行业解决方案:病历存储
2.金融行业解决方案:财务数据存储
实现方法:EMC Centera
EMC Centera是一种简单、经济且安全的信息在线归档解决方案。EMC Centera是首个专为存储和检索固定内容而设计并优化的存储平台。与传统的归档方法相比,EMC Centera提供更快的检索速度、支持但是离存储、保证内容的真实性、具备自我修复功能并支持众多行业监督标准。
EMC Centera模式
EMC Centera Basic:提供所有Centera的功能,但不能配置数据的保留期
• EMC Centera Governance Edition:除了Basic模式功能外
•
• CE+:提供更为严格的法规遵守能力。满足商业环境中 对电子存储介质的
最严格规范
EMC Centera架构
EMC Centera是基于冗余磁盘阵列的体系结构,具有高度可扩展性和PB级存储能力。每个EMC Centera机柜可容纳32个节点,入门级配置只有4个节点和2个内部网络交换机,节点以4个为一组进行扩展。节点运行Linux操作系统和CentraStar软件来实现CAS的所有功能。
内容保护方式:
内容奇偶保护:数据被划分成段,同时添加奇偶校验段
• 内容镜像保护:每一个数据对象都被镜像,每个镜像被放在不同的节点上。 • Centera工具:
EMC Centera浏览器:加载到客户端的图形用户界面工具,通过网络访问Centera
• EMC Centera监控器:用来坚持测EMC Centera中的单个Cube,可显示系
统属性
• EMC Centera控制台:基于Web的管理工具,操作员可看到各种详细信息 • EMC Centera健康报告:每个一段时间,EMC Centera集群自动滴想EMC
客户支持中心或指定人员发送邮件。 •
Chapter 10 存储虚拟化
虚拟化技术通过映射或抽象的方式屏蔽物理资源的复杂性。
虚拟化的形式:
内存虚拟化:虚拟内存使得应用程序好像拥有自己的、独立于现有物理内存资源的连续逻辑内存。(例如VMM)
• 网络虚拟化:建立虚拟的网络,从而使每个应用程序将其自身的 逻辑网络独立于物理网络。(例如VLAN)。(存储区域网虚拟化:是对传统SAN网络的一种最新的演化,一组主机或存储端口使用在屋里SAN上定义的虚拟拓扑来互相通信。)
• 服务器虚拟化:可以让多个操作系统和应用程序同时运行在不同的虚拟机上,这些虚拟机创建在同意物理服务器。
• 存储虚拟化:为主机创建物理存储资源的逻辑视图的过程。一些存储虚拟化的实例是基于主机的卷管理、LUN的创建。。。 •
SNIA(存储网络工业协会)的存储虚拟化分类
第一个层次的存储虚拟化分类定义”创建什么“,它指定虚拟化的类型:块级虚拟化、文件虚拟化、磁盘虚拟化、磁带虚拟化或其他。。。
第二个层次描述虚拟化定义”在哪里“进行。刻画虚拟化:服务器、村粗网络、存储
地单个层指定袋内或带外网络及的虚拟化方法。
存储虚拟化配置
带外存储网络虚拟化中,实行虚拟化的设备是配置在数据通道之外的。 袋内存储网络虚拟化中,虚拟化设备会部署在原来数据通道上。
存储虚拟化的挑战
可扩展性:存储阵列不再被视为是独立的个体,因此必须分析整个存储环境。
• 功能性:包括本地复制、远程复制以及多卷和跨阵列环境中的应用一致性能力。
• 可管理性:可提供一个端到端的视图来整合存储环境中所有的资源。 • 技术支持:虚拟化需融合于现有的存储环境中 •
存储虚拟化的类型
块级存储虚拟化:为SAN的主机和存储阵列之间提供了一个转换层。主机是直接使用虚拟化LUN,而不是直接连到存储阵列的LUN。
• 文件级虚拟化:文件级虚拟化致力于消除NAS环境中的文件访问和文件级存储位置之间的依存关系,这为优化存储利用率、整合服务器和执行不间断文件歉意提供了实现的可能性 •
实现方法
1.EMC Invista
是一个带外的SAN块级存储虚拟化解决方案。它采用定制硬件和智能SAN交换机将物理存储用虚拟化逻辑来表现。这些交换机有能力用网络速度来处理业务数据。他们用专用的软件来检查端口、逻辑卷和发送出来的I/O偏移量,同时可以控制存储设备的I/O目标路径
Invista的主要硬件组件包括控制路径集群(CPC)、数据通道控制器(DPC)和以太网交换机
Invista的运作:当一个I/O请求从主机到达DPC时,她处理这个I/O请求并映射到适当的虚拟目标。如果该命令是SCSI询问有关设备的请求或是一个DPC没有映射信息的I/O请求,CPC会处理这个请求。
Invista的优势:提供了在异构存储环境中块级存储的虚拟化。它还支持不同存储层之间应用不间断地动态卷扩展和数据迁移。
2.Rainfinity
Rainfinity是一个专门的文件级虚拟化的硬件/软件解决方案。Rainfinity的全局文件虚拟化设备向用户提供了一个透明度基于文件的存储虚拟化机制,即使用户在读/写一个文件的数据,这个文件也可以从一个文件服务器迁移到另一个
Rainfinity的组建:64位处理器、16GB告诉内存缓存。两个被配置RAID1的热插拔SCSI硬盘作为高速缓冲。软件包括Rainfinity code、Windows Proxy Service
Rainfinity的运作:在NAS环境中,文件服务器和Rainfinity设备通过网络妇联。Rainfinity需要一个单独网络VLAN,这样就不会对缘由的数据通道和用户连接产生影响。当为了存储成本优化或性能优化进行数据迁移时,数据在
Rainfinity和在VLAN中与文件服务器连接的端口之间移动。Rainfinity将数据迁移作为一个事物处理而且有能力进行事物回滚。Rainfinity利用了袋内和带外方法的最佳特性。
全局命名空间管理(GNA):允许存储管理员为用户网络存储环境中的共享文件资源提供一个唯一的逻辑名字,并建立一个统一的名字空间。
Part 3 业务连续性
Chapter 13 业务连续性概述
业务连续性(BC)是一个企业级集成的过程,该过程包括了一个企业为了缓解已知和未知停机时间带来的影响所做的全部内容和外部的活动。BC需要对由于系统中断带来的各种对业务操作的影响进行准备、响应和恢复。BC设计一些主动性的措施以及一些在故障发生时采取的补救措施。
信息可用性(在业务操作特定时间内根据业务期望能提供的从基础架构到业务功能的能力,它确保人们在任何需要的时候都能获取信息)
信息可用性可以借助可靠性、可获性以及合时性
可靠性:指在特定的条件下以及一定的时间内部件无故障运行的能力 • 可获性:一种状态。在这种状态下所需的信息所需的信息能够在正确的位置提供给正确的用户。
• 合时性:定义信息可用的确切时刻或者时间窗 •
信息不可用的因素:计划的和未计划的
•
信息可用性度量
MTBF指对一个系统或者部件在两次故障间运行其正常功能的平均时间 • MTTR指修复一个故障不见的平均时间。当计算MTTR时,需假设引起故障的原因能准确定位,并且用户修复的时间和人力也是可获得的 •
BC术语
灾难恢复:当灾难发生时为了支持重要的业务操作而进行的对系统、数据和基础架构的恢复等一系列过程。
• 灾难重启动:指利用基于镜像的、一致的数据和应用的备份重新启动业务操作的过程。
• 恢复点目标(RPO):指中断之后系统和数据必须恢复到的时间点。RPO定义了业务能够承受的数据损失量。大的RPO意味着系统对信息损失有着较高的容忍度。组织可计划制定备份和复制最小频率
•
BC计划生命周期
整个BC过程可定义为一个活动生命周期:
1. 确定目标
2. 分析
3. 设计开发
4. 实现
5. 训练、测试、评估和维护
故障分析
单点故障:指那些能够终止真个系统或者IT服务可用性的单个部件的故障
• 容错:为了缓解单点故障,系统设计时采用冗余方式。这样只有在所有冗余组部件都失效时系统才会失效,这样做确保了单点故障不会影响数据的可用性
• 多路径软件:配置多个路径方式通过路径的容错转移增加了数据可用性。 • 业务影响分析(BIA):识别并评估对重要业务过程中断带来的财务、操作和服务的影响。为了支持信息可用性,对有选择的几个功能区域进行评估以确定基础架构的弹性。BIA过程以报告西瓜是详细说明了各种事件及对业务功能的影响。这种影响有可能以时间和金钱的形式说明。BIA包括下列的任务。
•
•
•
•
• 说明对操作至关重要的关键业务过程 以应用、数据库以及软硬件需求的方式确定业务过程的属性 对每个业务过程评估故障成本 对每个业务过程计算最大可容忍的中断并定义RTO和RPO 确立用于业务过程的最小资源要求
BC技术方案
备份和恢复
• 基于存储阵列的复制(本地)
• 基于存储阵列的复制(远程)
• 基于主机的复制 •
实例:EMC PowerPath
PowerPath特征
在线路径配置和管理
• 多路径动态负载平衡
• 自动路径失败切换
• 主动路径测试 •
机群支持
• 互操作性 •
PowerPath负载平衡,原则:
循环策略:I/O请求以循环的方式分配给每一个可用路径
• 最少I/O政策:I/O请求被路由到具有最少I/O请求队列的路径上,而不管总的I/O块数目
• 最少块策略:I/O请求被路由到具有最少I/O队列的路径上
• 基于优先级策略:基于读写、用户指定设备或者应用优先级 •
Chapter 12 备份和恢复
备份的目的:灾难恢复、可操作备份、归档
备份考虑:
数据丢失的多少以及用RTO和RPO衡量的业务能容忍的停机时间是选择实现特定备份策略的主要考虑因素
• 文件的位置、大小及其数目引起影响备份的过程
• 备份的性能也依赖与备份所用的介质 •
备份粒度
备份粒度依赖于业务需求和RTO/RPO时间。根据不同粒度,备份可分为全备份、累积备份和增量备份。