看似“高高在上”的网络存储,其实有很多与PC的理念相通。
PC:网络存储的身边缩影?
最近若干年间,网络存储的热度一直在升温,成为一个最具成长力的业务领域。厂商们也使出了浑身解数来宣传自己的产品理念与特点,从而让我们也听到了越来越多的新名词与相关概念。
如今,为了让存储给厂商自己创造更多的价值,厂商们更多地开始向中小企业市场(SMB)发力,而与那些企业级高端网络存储相关的理念也将被带入这一新的消费群体。但不少人将网络存储奉为上宾,认为其高高在上。然而,如果细心地对比一下,大家就不难发现,在我们的身边就有网络存储的缩影——PC。
说到这儿,可能不少人都会嗤之以鼻,认为低档的PC怎么能和高级的网络存储相提并论?然而,在IT界不同领域里出现相似的设计与相似的理念,都是很常见的。比如串行传输,SAS/SATA硬盘与Rambus DRAM的设计理念是不是就很相像呢?再比如NVIDIA显卡的交叉交错式显存管理架构是不是最终成为其nForce芯片组的一大法宝呢?而如果再将其与一些高端的光纤阵列存储系统相比较(如EMC的DMX系列,NEC的iStorage系列等等),你也会发现惊人地相似。
ILM?PC早已有之
时下,网络存储领域里最热门的一个话题无疑就是信息生命周期管理(ILM),虽然不同厂商在这两个方面有着不同的技术与理念,但原则不可能有出入。ILM实现了数据信息按其价值(即访问频繁程度)来决定其存放设备的动态管理。
那么在PC机中呢?如果你稍加观察,就会发现ILM早已实现,虽然初级和简陋,但本质的东西均有体现。
PC机中的存储设备中包括内存、硬盘与光驱,这是目前PC机中最基本的配置。那么从PC机日常的工作中,我们就不难看出它们之前的数据流动关系。
新的数据首先由CPU生成,暂存于内存之中。内存里保存着最常用的数据,而内存的高带宽(在PC的独立存储设备中,它是最快的了)保证了CPU处理应用时的效率,如果需要新的数据,可内存中没有,则从硬盘中读取,此时,速度更慢的硬盘将数据输送至内存,从而完成了从低一级存储设备向高一级存储设备的数据复制。反过来呢?当内存的容量快要占满,而又需要新的数据调用时,系统会将内存中不常用的数据保存至硬盘(即建立交换文件),以腾出宝贵的内存空间,从而实现了从高一级存储设备向低一级存储设备的数据转移。
图1 PC机存储架构与信息生命周期管理流程
当硬盘上的数据太多,空间将不够用时,用户可以直接将不再使用的过时数据删除,也可以将不常用的数据通过光盘刻录机转移至DVD或CD光盘,然后分门别类保存起来,以备以后使用。平时,也可以通过刻录机来进行关键数据的备份。而CD-R、DVD-R/+R则很好地诠释了当今另一大热闹技术—WORM(Write Once Read More,一次写入多次读取)。当光盘多得放不下时,用户就会挑出已经不会再使用的光盘扔掉,以腾出空间保存新的光盘。
这样分析下来,我们就会发现PC真的就像是网络存储架构的一种缩影,内存就相当于在线存储、硬盘相当于近线存储、而刻录机就相当于离线存储,芯片组就相当于网络存储架构中的连接设备—导引器/交换机/路由器,负责不同协议总线之间的连接与互通。 现在我们再来看看网络存储中的ILM架构,一般都以SAN的形式来出现。数据由服务器产生,通过交换机/导引器/路由器来进行中转传输。目前,基本的方案是以光纤通道(FC)硬盘阵列负责在线存储,也即主存储,它存储着最常用的数据,而不常用的但需要随时能快速访问到的数据则保存在性能较低的、采用ATA接口硬盘的阵列上,目前SATA阵列已经占据了这一市场的主流,它的成本比FC阵列低得多(硬盘也比内存便宜得多),与所保存数据的价值也相符。到最后,基本不会用到,可说不准以后什么时候就需要的数据则会转移到磁带上做归档保存。
在这个架构中,我们也不难与PC中的各个部件相对应起来,服务器相当于CPU(不同应用的服务器就相当于CPU中所处理的一个线程)、交换机相当于芯片组、主存储相当于内存、次级存储相当于硬盘、归档存储则就是刻录机了。
怎么样?是不是PC早已实现了ILM,其与网络存储的ILM最大不同之处在于,PC中的数据迁移除了CPU至内存、内存至硬盘之外,都是人工来负责的,用户通过自己的判断,来将数据的常用性分类,然后选择是仍然保存在硬盘还是保存在光盘上。而网络存储的ILM则致力于按照事先的规则全自动进行数据的迁移与管理。但谁也不能否认它们之间并没有质的不同。
虚拟存储?PC也能做!
如果说ILM是在信息管理层面上的一种理念的话,那么虚拟存储(VS,Virtualization Storage)就是在存储资源管理方面一种重要的技术,VS可以充分利用不同物理存储设备中的存储空间,将其逻辑整合,实现存储空间的共享,以保护投资,提高设备的利用效率。
图2 一个基本的实现ILM理论的SAN方案
VS对PC用户来说并不陌生,就PC用户所熟悉的Windows操作系统来说,从Windows 2000开始提供的动态卷功能就是典型的一例。卷(Volume)这个术语对于很多普遍用户来讲是比较敬畏的,但动态卷的原理并不难理解,它其实就是一个在传统分区之上更高级的逻辑分区功能,在一个卷的背后可以存在多个硬盘,而在系统中它只以一个盘符来表示。
在日常应用中,如果用户有多块硬盘,可能会出现面对一个大容量的文件,哪个分区的剩余容量都不够用,但如果将各个硬盘的剩余空间整合起来就没问题了。但传统的分区软件并不能将多个硬盘中的不同分区进行整合,而动态卷技术就解决了这一难题,这种技术从本质上说无疑就是一种虚拟化。
现在很多厂商都宣布,可以虚拟化其他厂商的存储,如果我们将各个存储看似是个硬盘,就不难理解这个虚拟化的含义。在实际存储资源整合与共享方面,PC已经具备了这个能力,只是过于简单和粗糙。 再说说虚拟带库这类的虚拟化,PC也早有这方面的应用。比如鼎鼎大名的DEAMON Tools,这款虚拟光驱软件支持多种格式的光盘镜像,用户无需使用物理光驱即可通过镜像文件来获得性能好得多的光盘读取功能。
DEAMON Tools所支持的光盘类型就好比那些虚拟带库所能虚拟的带库型号,两者最终都是以磁盘而不是光盘或磁带为存储介质。所不同的是,DEAMON Tools只能读,而不能向虚拟光盘中写入数据,这个任务则由镜像制作软件来完成。
借助光盘镜像工具与DEAMON Tools这类的虚拟光驱软件,用户即可以在硬盘上生成一个“光盘”,当需要时即可以通过镜像刻成光盘,就像虚拟带库最终将数据保存到真实的带库上进行归档保存一样。
因此,如果对存储虚拟化的本质还不了解的话,回过头来看看身边的PC,也许会得到一些启发,而这些启发也有助于我们理解网络存储的架构与未来发展。
PC架构是企业IT架构的集中体现
至此,我们是不是已经从PC的身上发现了很多网络存储的特征了呢?其实,这应该是反过来说的。PC是一个数据处理流程的典型,从数据生成到数据传输,再到最后的数据存储与归档,它代表了一种固定的规律。网络存储作为后来的新生事物,在这一点上仍不能超越这一规律与流程,因此从这种角度上讲,企业的IT运行架构就相当于一台庞大的PC机,只不过将各个功能组件进一步独立化,设备间连接的距离进一步扩大化,在数据的处理流程上则仍然与PC相同——由服务器(CPU)负责数据的处理——由网络设备(芯片组)负责数据的中转——由存储设备(硬盘、内存、刻录机)负责数据的保存,而各种各样的管理软件就像PC机操作系统的管理工具。因为企业IT是个太复杂的PC,更因为标准化还远远不够,不同厂商的产品(交换机、存储等等)都有自己的管理软件,这就好比是PC中各配件的驱动程序。但是,现在每个PC操作系统都有一套自己的完整的驱动程序API,标准化的好处就是让用户可以透明地使用相关的硬件,比如我们不用关心硬盘是希捷还是日立的,因为接口是标准化的,硬盘命令是标准化的,可企业IT并不是这样。
图3 通过Windows XP中的磁盘管理功能,可以将不同的分区合并成一个逻辑动态卷, 以共享容量,提高硬盘的利用率
因此,不要说PC太低级,正是由于PC的简单,反倒可以率先实现某种先进的理念。比如标准化,这就是当今网络存储乃至企业IT架构所远远不及的地方,尽管企业IT可以相对定制化,封闭化,但在用户的简单使用的理念下,各厂商也不得不面对各项技术标准化这一实际问题。
虽然有些技术是先在企业级上使用,但可能是因为在成本和性能上PC机并不需要,而PC机上的一些技术虽然在企业级方面看似小儿科,可是其背后的理念可能在不久也会出现在企业级领域。所以,当我们对某些问题产生困惑时,想想PC上的相关设计或应用,也许会得到意想不到的效果。
|