什么是RAID?
怎样提升硬盘的读写效率,怎样避免数据因硬盘损坏而遗失,怎样充分运用硬盘容量,这些始终是计算机专家和普通人的难题,而大容量硬盘的成本相当高,给使用者带来很大压力raid是什么意思,不过磁盘阵列技术的出现彻底攻克了这些挑战。
近十多年来,中央处理器的工作速率提升了五十余倍,随机存储器的访问速率也显著加快,但数据存储设备——主要是硬盘——的读取速率仅增长了三到四倍,造成计算机系统运行受阻,降低了整体效能,倘若无法有效提高硬盘的访问速率,中央处理器与随机存储器的进步将付诸东流。
磁盘阵列依据不同用途采用不同技术,这种分类叫做RAID级别。RAID是磁盘组串连的简称,每种级别对应一种特定技术。当前业界普遍采用的级别从RAID 0到RAID 5。这个级别并非衡量技术水平高低的标准,RAID 5并不比RAID 3更先进。选择何种RAID级别的产品,完全取决于用户的具体工作场景和实际用途,等级高低并非决定性因素。
RAID级别的划分?
当前业内普遍采用的RAID级别涵盖RAID 0至RAID 5。接下来,会分别介绍部分常见的RAID类型,并说明其中一些实际应用中的疑问。
RAID 0( Disk Array Fault )
RAID 0将所有硬盘组合成一个大型存储单元。这个单元的总容量等于该组内所有硬盘容量之和。数据读写操作采用同时进行的分割方法处理。因为所有数据都会平均分配到整个硬盘组中,所以读取和写入的效率极高。随着构成RAID 0的硬盘数量增加,其处理速度会进一步提升。在存储容量利用率方面,它是最优的,利用率能够达到百分之百。RAID 0存在一个不可忽视的弊端,它和常规硬盘一样,完全不提供数据备份功能。只要其中一块存储设备发生故障,所有信息都会彻底丢失,而且无法恢复。通常情况下,这种配置仅适用于那些拥有原始数据备份的多媒体文件处理场景。例如视频点播服务中的数据共享环节。组建RAID 0阵列至少需要两块硬盘,具体构造方式如图所示。
RAID 1()
RAID 1是一种磁盘数据同步技术。它利用两块硬盘来实现。一块是核心存储盘,另一块是同步盘。核心盘中的信息会持续复制到同步盘。因为所有核心盘的信息都实时同步到另一块盘,所以RAID 1具备极强的数据保护功能。其冗余度可以达到100%。然而这种镜像方式并非依靠算法实现,因此它的存储空间利用率相当低下,仅达一半水平,RAID 1仅能配合两块存储设备使用,可用的容量十分有限,所以通常仅在系统层面部署,具体配置情形参考下图所示。
RAID 0+1( and )
RAID 0+1通过结合两组RAID 0阵列来实现RAID 1的镜像备份功能。这种配置既拥有RAID 1的故障容错特性,也具备RAID 0的存储性能优势。不过,RAID 0+1的存储利用率与RAID 1相同,仅为50%,因此同样难以得到广泛应用。具体结构展示在图片中。
RAID 3( with )
RAID 3依靠奇偶校验码来检测并纠正错误,它仅需要一块额外的校验盘即可实现这一功能。奇偶校验码的生成过程是将所有数据盘对应位置进行异或运算,运算结果会记录在专门的校验盘上。只要数据有任何变动,就必须重新进行奇偶校验计算。当某个磁盘发生损坏,替换为新的磁盘之后,整个磁盘系统(包含校验磁盘在内)必须进行一次重新计算,将损坏磁盘中的数据恢复并记录到新磁盘上,如果校验磁盘出现故障,则需要重新计算校验码,这样才能满足容错的需求。请参考下图。
RAID 5( with )
RAID 5是一种能够承受故障的RAID模式,它和RAID 3的不同之处在于,其故障应对机制不依赖特定的备用硬盘,而是将容错数据均衡地散布在所有存储单元中。一旦系统中某个存储单元发生失效,该阵列便能够利用其他存储单元的相关信息,推算出失效单元原本所存储的内容。为了确保缺失的数据能够从其他硬盘恢复,我们必须在基础存储容量上额外增加一个硬盘,以便其他成员硬盘可以完整地重建丢失的数据部分,整体容量总计为(N-1)乘以单个最小容量硬盘的存储大小。就存储空间利用率而言,RAID 5系统会占用一个硬盘的容量,一旦某个硬盘出现故障,其数据能够借助其他硬盘的冗余信息进行恢复,然而倘若两块硬盘同时损坏,所有数据便会彻底丢失,具体示意图请参考下图。
RAID级别的对比
NAS的概念
网络存储服务器NAS,是专门设计来提供高性能、低成本和高可靠性的数据存储和传输设备。它旨在提供一套安全稳定的文件和数据保存方案,并且操作简便易于管理。这种设备被定义为一种独立的专用数据存储服务器,内置了系统软件,能够支持NFS、SMB/CIFS文件共享功能。NAS利用IP协议实现文件级数据存储,兼容多种网络技术,例如以太网、FDDI等。该设备以数据为核心,彻底将存储设备与服务器分开,集中管理数据资源,有助于充分释放网络带宽,显著增强网络整体表现,同时也能有效减少总体拥有费用,保障用户的设备投资。将文件保存在同一台服务器上,可以实现不同电脑用户间的资源共享,并整合网络中各种类型的计算机,这正是NAS网络存储的核心作用。由于NAS网络存储系统采用开放的工业标准协议,因此即使不同操作系统的电脑用户也能访问同一份文件。这样一来,系统便不再区分用户类型,无论是用户还是UNIX用户。他们同样可以安全地和可靠地使用NAS网络存储系统中的数据。
NAS的特点
NAS以其流畅的机构设计,具有突出的性能:
·移除服务器 I/O 瓶颈:
NAS系统专为文件存储应用打造,它彻底切断了存储设备与服务器之间的直接关联,以此完全根除了服务器端的数据读写瓶颈。服务器无需再负责向用户传输数据,可以将更多资源投入到网络中的其他任务,同时也显著提升了网络的运行效能。
·简便实现 NT与UNIX下的文件共享:
NAS设备采用通用的网络文件交流方式,能够实现各类平台间的文件整合存放。不论使用何种操作系统,使用者都能把资料保存在同一台NAS装置里,借此显著降低存储开销,有效避免资源上的虚耗。
·简便的设备安装、管理与维护:
NAS装置实现了极为方便快速的部署,稍加设置即可顺畅使用。通常配备可视化操作面板的管理系统,能够轻松实现设备操控。此外网络维护人员无需单独处理每台设备,通过统一化的数据保管与调控,显著降低了人力与资源的消耗。
·按需增容,方便容量规划:
NAS装置能够实现即时容量扩充,显著简化了网络维护人员的存储规划工作。即便面对未来可能出现的存储需求激增,也能轻松应对。此外,在增加数据存储空间时,无需中断整个网络运行,这将极大降低因停机而产生的资源损耗。
·高可靠性:
移除服务器端I/O障碍后,数据可用性获得显著增强,NAS设备还运用多种手段提升数据稳定性和持久性,例如运用RAID技术,配备备用电源与风扇等冗余单元,并构建容错机制,当然,针对不同设备,或许会采用更先进高效的技术方案。
·降低总拥有成本:
NAS有一个最吸引用户的地方,就是具有极低的总拥有成本.
SAN的概念
SAN即存储区域网,是一种共享的高速专用网络,用于存储数据。存储设备通常布置在服务器后方,这使得SAN本质上是一个专用的高速光纤系统。要构建一个标准的SAN,必须配备专门的光纤交换设备以及集线器。存储区域网络在网络结构中属于较新的理念,其作用在于建立服务器与独立工作网络之外的存储设备之间的连接。网络还在持续演进之中,不过至关重要的 SAN 技术看来是光纤通道的升级版,其目的是为了适配 SCSI 总线连接。
SAN的优势
SAN的优势可以表现在一下几个方面:
·高数据传输速度:
基于光纤连接的存储网络SAN构建了一个具备优异扩展能力和卓越性能的网络存储系统,光纤交换设备与光纤存储系统均展现出高效率并赋予服务器更宽广的扩展余地,这是SCSI架构系统所不具备的特点,此外也为企业未来的发展奠定了极为灵活的扩展基础。
·加强存储管理:
SAN存储网络各部分的数据不再通过以太网传输,因此大幅提升了以太网的运行效率。由于存储设备和服务器的完全解耦,用户能够获得独立于服务器之外的存储管理思路。数据的复制、备份以及恢复等操作趋向于在统一的安全管理模式下进行,并且可以通过集中的控制手段加以管理。通过将不同的存储单元以网络形式相互连通,组织能够以任意期望的途径获取其信息资料,并且可以确保信息资料更加完整。
·加强备份/还原能力的可用性:
SAN的稳定运行依靠其灾备机制,以及备份的实时性,同时具备冗余存储设备和信息的快速切换功能。
·同种服务器的整合:
在SAN架构里,所有服务器都接入同一个数据网路。要全面接入企业共享的存储阵列,能通过整合的磁盘资源实现高效率和经济性。
凭借SAN的诸多长处,它常被用于高效的数据备份和复原作业,也常被用于统一管理各类数据,还常被用于远距离的数据防护工作。
SAN与NAS的比较
SAN和NAS是当下备受关注的数据存储方案,关于这两种存储模式的讨论从未停止,即便后来出现新的数据存储技术,也大多与这两种模式有着千丝万缕的联系。NAS和SAN有一个共同之处,那就是都实现了数据的集中化存放和集中化管控,不过若以存储池作为参照物,SAN和NAS之间仍然存在显著的不同。NAS作为独立的文件服务器,其存储系统不依附于通用服务器,因而能够达成同一存储资源内数据的单独使用与联合使用,SAN里的数据则通过块状进行传输,文件系统依然位于对应的服务器,故而针对组合的存储资源,数据会各自独立存在,或者可理解为服务器在专属存储资源里占用的一部分区域。这两种存储方案的主要差异体现在它们的操作模式上。SAN存储系统采用块式处理,而NAS存储系统则使用文件式管理。因此,NAS系统在处理文件级服务时更为高效迅速。相比之下,涉及数据库应用的数据块以及大数据块进行的I/O操作,则更适合采用SAN架构。SAN与NAS之间存在显著差异,导致许多人将两者视为截然不同的事物,然而,从当前发展趋势来看,这种绝对化的区分方式难以被市场所认可,事实上,越来越多的数据存储方案倾向于整合NAS与SAN的功能,主要原因在于:
·一些分散式的应用和用户要求访问相同的数据
对提升性能表现,增强可靠性程度,并减少资产投入的专用系统展现出强劲的发展势头
以既定的网络规范为根基,涵盖TCP/IP, NFS和CIFS等协议,构建运行环境
·一个获得以应用为基础而更具商业竞争力的解决方案欲望
·一个全面降低管理成本和复杂性的需求
·一个不需要增加任何人员的高扩展存储系统
一种能够借助改造来发挥作用的体系,可以保存当下设备与工作人员的实际效用
整合所有存储系统于单一站点,用户能显著提升管理效能,增强资源利用率,并提高系统稳定性,从中获益匪浅。SAN作为存储集中化方案广受欢迎,主要得益于光纤通道能支持大量设备接入,且易于连接,并可实现存储设备同服务器间的远距离传输。类似地,NAS系统同样具备这些优势。该方案融合了SAN与NAS技术,充分支持光纤通道功能,使用户能够享受更佳的扩展潜力,实现远程数据存储,并具备卓越的性能表现。此外,这种存储系统在块级和文件级I/O操作方面均提供高效均衡的处理能力,显著提升了数据的可靠性和可访问性。采用光纤通道技术的SAN和NAS,该存储体系为服务器带来多样化存取路径,具备卓越运行效能,实现高性价比,确保系统稳定运行raid是什么意思,且易于管理,所有功能均依托同一网络架构完成。
-----------------
RAID全称为英文Array of Disks,中文则称作廉价磁盘冗余阵列。它是一种由多块硬盘组合而成的数据存储方式。这种技术通过将多个磁盘组合起来,形成冗余的存储系统。
尽管RAID由多个磁盘单元构成,但在系统层面呈现为单一的整体性存储单元。采用RAID方案对存储架构而言,其优势可以归纳为三个层面:
将多个存储设备整合为一个整体,用以实现数据分布存储,这种技术称作磁盘阵列配置
将数据分割为多个数据单元,然后同时向多个磁盘进行写入或读取操作,以此加快磁盘的访问效率
3. 通过镜像或校验操作提供容错能力
开发RAID的初衷是为了节省开销,因为那会儿几块小容量硬盘的总价比单块大容量硬盘还便宜。如今看来,RAID在降低成本方面的效果已经不明显了,不过它能充分运用多块硬盘的效能,获得远超任何一块独立硬盘的速度和数据处理能力。RAID除了能增强工作效率之外,还具备出色的数据保护功能,即便其中某个存储单元发生故障,整个系统依然能够正常运行,不会受到故障部件的干扰。
RAID技术有多种不同类别,各类能带来不同的传输速率,数据保护程度和经济性。依照具体需求挑选合适的RAID模式,能够满足用户对存储系统可靠性、处理效率和存储空间的需求。常见的RAID模式包含NRAID,JbOD,RAID0,RAID1,RAID0+1,RAID3,RAID5等。目前经常使用的是RAID5和RAID(0+1)。