随着现在IT技术的飞速发展,信息与数据的快速膨胀,导致信息管理任务越来越重。存储阵列,在现在的企业数据管理中,发挥着举足轻重的作用,而且其技术也在飞速的发展之中,如更大更快的硬盘,更快速的光纤通道,重要的cache技术与算法,方便的IP存储技术,快速的备份与同步方式,更可靠的体系结构,方便的管理功能等等。
不过,它们最主要的一个目的就是,就是消灭信息孤岛,完成信息存储与共享,为了实现这个目的,现在最主要的做法就是信息集中管理与存储,用大型的存储或者设备,或者建立大型的数据中心。其实,除了这些技术以外,还有一个重要的技术,可以解决这个问题,那就是虚拟化,虚拟化也可以分为如下几个方面:
HP EVA
三类存储虚拟化技术
1、虚拟网格存储技术,不再关心存储放在哪里。如光纤技术无疑是现在存储中最成熟,最稳定的技术,但是缺点就是远距离分布比较困难。IP存储解决了随时随地可以存储的问题,但是可靠性与速度还值得进步。如果这两个技术能完美统一,那么存储网格就指日可待了。
2、虚拟扩展技术,不要关心使用什么存储。如现在很多高端存储都推出了这样的产品,典型的就是HDS的USP,可以在主存储后面外挂很多其它的存储,而用户只需要访问主存储即可,根本不用关心其它的存储需要有什么样的访问规则。除了存储之外,该虚拟化也可以在其它地方完成,如光纤交换机上也有类似的解决方案。
3、存储内部虚拟化,不要关心数据保护与分布的细节。如果你知道Oracle的ASM,那么,你就很能明白这种虚拟化是指什么了。通过存储内部的虚拟化,用户可以不用关心RAID怎么做,不用关心数据分布,不用关心数据保护。你的任务就是把磁盘交给它,它帮你搞定一切。
技术1还需要等待,技术2已经存在,但是,大规模的使用还没有看见。技术3,就是我们马上要介绍的HP的eva存储阵列,一款很有个性的中端存储阵列。它在存储端实现了磁盘管理虚拟化,其内部原理跟Oracle ASM简直是一模一样。其宗旨可以这么简单的描述:把磁盘给我,把规则给我,我帮你搞定其它的东西。
EVA阵列的虚拟化特性
1、没有RAID的概念,只需要把磁盘放入一个池(pool)中,磁盘即实现了统一管理。系统自动将所有的数据分布在不同的磁盘上,首先实现类似RAID 0的数据分布。如果想做数据保护,如类似RAID1,RAID5,没有关系,告诉它哪些数据实现怎么样的保护级别,存储自动把镜相数据或者是校验数据分布在不同的磁盘上。
注意,这个raid是逻辑上的,也就是一个磁盘可能有一些数据块是raid1的保护模式,另外一些数据块则是raid5的保护模式。
2、自动增加硬盘,并重新完成数据分布。如果需要增加硬盘,传统的存储需要增加新的raid组,但是,这个新的RAID组想要跟以前的磁盘实现重新分布是比较困难的事情了。EVA类似ASM,新增加的硬盘会自动进行负载均衡,数据会自动分布到新的硬盘上来,不需要人为关注。
netapp通过改良的raid4实现了可以动态的扩充硬盘,并不影响任何性能,其原理可以参考以前的我文章。但是,EVA的做法与netapp的做法还是大不一样的,而与ASM算法一致,它需要一个自动重新分布的过程。不过,EVA这个虚拟化与ASM到底谁早谁晚,我没有去考察,反正天下都是一大抄,只要对用户好就成。
3、没有特定的hot spare。这个不是表示没有hot spare,而是没有特定的hot spare。什么意思呢,就是说,如果现在有60块盘,你指定了4块盘为hot spare,但是系统还是使用60块盘,不过整个空间中,会预留4块盘的空间下来(每个磁盘一部分空间)。如果发生了磁盘损坏,需要接管的时候,只需要把这个磁盘上的数据重新分布到其它盘上即可(也就是只要有足够的空间即可)。这样的好处是很明显的,充分利用每一块磁盘,大大提高了rebuild的速度。另外,只要剩余空间足够,理论上可以坏更多的硬盘也没有关系(大于指定的hot spare的个数)。
看起来的确是一个非常好的东西,极大的减少了管理成本与维护成本。但是,任何东西有优点,也还是有缺点的,对于这个虚拟化技术,我相信更多人担心的是其稳定性与成熟度。另外,就是自动负载均衡的时候,到底对系统有多大的性能冲击?
EVA除了以上存储虚拟化的特点以后,还有一个特点也是做的非常好的,那就是交换式光纤构架。在传统的存储阵列中,基本上都是环路结构,这个环路结构导致一个环上面可能接很多的磁盘,一定程度上可能形成瓶颈,如高IOPS的环境中,一个环路就不适合接太多的硬盘。EVA中改变了这个情况,这里通过交换构架,可以让每个后端卡直接访问到每一块硬盘。这个也算是一个非常大的进步,因为需要修改2个比较大的地方,一个是后端卡到盘阵的交换,另外一个是盘阵到磁盘的交换。 |