当前计算机硬盘信号处理技术发展趋势
自从IBM发明计算机硬盘,迄今已有50多年历史。为适应各种应用需求的发展,硬盘容量不断增加,性能也不断提高。硬盘作为一种数字信息的存储设备,其最重要的性能指标之一就是其所存储的信息的可靠性,其衡量指标就是数据读出时的出错率或称误码率(Bit Error Rate - BER)。
计算机硬盘是一个机械与电磁及电子过程操作的混合体,数字信息的存取涉及磁介质的磁化、电磁及磁电转换、弱信号放大、滤波、模数转换、数字信号处理等电磁或电子过程,以及与马达伺服相关的存储盘片的高速旋转、读写磁头的快速定位移动等机电过程。这些过程中的众多不确定、不稳定或不利因素,如磁头的非线性、电路中的电子噪声、热噪声、量化噪声、马达机械运动的非精确性、存取过程中存在的码间干扰 以及使用环境中的不利因素,如震动、环境温度等,均会对数据信息的存储和恢复过程产生不同程度的影响,并最终反映在所读出的数据的可靠性上,在使用环境较为随机的消费类电子产品中尤其如此。
从信号处理的角度讲,从硬盘读出数据的过程也就是一个在噪声环境中提取和检测信号并纠正其错误的过程。作为比较,一般光通信系统的误码率为10-12,一般个人计算机硬盘系统在重复读取后的硬误码率为10-15~10-18,而银行或金融系统的硬盘存储系统的误码率为10-20。随着人们对各种媒体及存储容量需求的日益不断扩大,硬盘的容量也日益迅速的扩大,同时随着微硬盘在各种便携式消费类电子产品中的广泛应用,使用环境对产品性能的影响也越来越大,这些情况都使得实际出错的机会越来越大。例如,一个存储容量为100GB的PC硬盘,实际出错的可能性已达到10-3~10-6。
硬盘信息出错所导致的结果有可能是灾难性的。这实际上对硬盘系统的设计以及硬盘内部信号处理的技术提出了更高的要求。由于纠错技术是以增加冗余信息也就是消耗磁盘容量为代价的,所以,在尽可能减少所增加的冗余信息量的情况下,尽可能降低误码率一直是硬盘纠错技术的发展目标。
著名的PRML 技术在硬盘的发展中起到了非常重要的作用,其性能又随着噪声预测技术(Noise Prediction)和数据相关(Data Dependent)后处理技术的引入得到进一步增强, 但更进一步的基于标准PRML技术的性能提高已变得非常困难。
正是在这种情况下,Turbo码和低密度校验码(Low Density Parity Code -- LDPC)以及相应的迭代译码技术等因其卓越的性能成为目前硬盘存储系统中数据纠错技术的关注焦点。
Shannon(仙农)信息论之信道容量与纠错编码
纠错编码的基本思想是根据一定的数学原则在用户数据中加入冗余信息,以后再根据相应的数学运算将所出现的错误纠正过来。Claude Shannon在信息论中关于信道容量的描述包括两点,其一是在给定信道带宽W和信号信噪比S/N的情况下,信道可传输的最高数据速率由下述式子决定:
其中W以赫兹(Hz)为单位,C以每秒比特数为单位;其二是,无论多么复杂,总存在一种有限长度冗余纠错码,该纠错方法可以以随意低的误码率以尽可能接近C的速率传输数据。仙农指出了纠错码的存在条件及寻找方向,但没有给出设计纠错码的具体方法, 或简易译码器的具体实现方法。
为达到Shannon极限,编码分组的长度越大越好,但高性能超长纠错码的设计极其困难,在实践中是不现实的。所以,研究者们转向将现有的不同编码方法级联起来以取得更好的整体性能,由此产生了Turbo编码技术。迭代译码技术作为Turbo编码的译码技术而产生并得到广泛研究。
LDPC码由R. G. Gallager于1962年提出,具有接近Shannon极限的近乎无错误传输的性能,但译码方法不易于硬件实现。近年来因研究Turbo码而发展起来的迭代译码技术使得LDPC码重获新生。据有关研究与仿真试验结果表明,在中度信噪比的情况下,Turbo码拥有非常好的性能,但在同样码长的情况下,使用迭代译码技术的LDPC码具有更好的性能,迭代译码技术与LDPC编码技术的结合显示出了前所未有的纠错能力。相对于原始的LDPC译码方法,以及目前半导体制造技术而言,迭代译码技术已使得LDPC码的译码运算变得简易高效可行。表一显示了在所示条件下的编码技术性能发展情况,图一中显示了一些在磁记录领域中采用迭代译码技术的研究结果。
迭代译码技术
传统的前向纠错编码技术是根据既定的数学规则检测从信道中接收到的数据或从硬盘中读出的数据中的错误并纠正之,这种纠错是单向一次性操作,即便有多级纠错方法,每一级也都是单独进行纠错的,纠错后的数据将被作为用户数据作其他相应的处理。在目前硬盘系统中,常用的是单级的RS纠错码技术。
迭代译码技术的基本思想是利用代表决策正误的概率信息(称为软信息)在两个译码器之间进行反复式迭代译码。也可以说,迭代译码技术采用的是逐次逼近的方法。通常,使用迭代译码技术的编码器是由两个常规编码器级联而成,一般称为外编码器(Outer Encoder)和内编码器(Inner Encoder)。相应地,会有两个译码器,分别称为外译码器(Outer Decoder)和内译码器(Inner Decoder)。与传统译码技术不同的是,除产生译码结果外,这里的每个译码器还要产生代表其所作判决正确性的概率信息(即软信息),内译码器产生的软信息送给外译码器,而外译码器产生的软信息又反馈给内译码器进行再一次的译码,整个译码过程就这样反复进行,直至达到一定的结果或达到指定的重复次数,再将最终的译码结果作为用户数据作其他相应的处理。图1所示是采用Turbo编码的迭代译码基本结构,图2所示是采用LDPC码的迭代译码基本结构。为突出Turbo码编译码结构,图1中省却了可能的RS编译码步骤。图2中的调制编码器可看作是数字信息到磁记录物理信息的转换步骤,RS编译码及调制编码器放在图中以更好地衬托出LDPC编译码及迭代译码在实际应用中的大致位置。在这些译码结构中,每个译码器输出的软信息都作为先验概率提供给另一个译码器使用,正是这种先验概率的反复产生与反复使用,使得最终的译码性能得以不断提高。
目前LDPC码在硬盘系统中显示出了较好的应用前景,相应的迭代译码算法通常为MPA算法(Message Passing Algorithm)。传统的PRML检测器是将检测出的数据信息输出,并由后面的纠错电路进行纠错处理,从而恢复用户数据。为使用迭代译码技术,PRML检测器还将输出标志数据可靠性的软信息,我们称这个产生软输出信息的Viterbi算法为软输出Viterbi算法(SOVA)。MPA算法将使用由SOVA产生的软信息实现对TPC码或LDPC码的译码。而MPA算法所产生的代表译码结果正确性的软信息又作为先验概率反馈到SOVA译码器进行下一轮的译码。与图1相比较,我们可以将图2中的LDPC编码器看作外层编码器,而硬盘的读通道则等价于一个内层编码器。相应地,把SOVA看作内层译码器,而把MPA看作外层译码器,译码过程在这两个译码器之间来回反复进行,每迭代一次,译码出错的概率都得到进一步的降低。
基于迭代译码技术的Turbo码和LDPC码在进一步提高硬盘性能方面显示出了极其优异的前景。据有关文献仿真结果表明,对于传统的水平记录以及垂直记录技术,在高密度记录的情况下,使用迭代译码技术的512字节长度的LDPC码的信噪比性能可以比RS码分别改善0.75dB和1.5dB (Cideciyan etc. IEEE Transaction on Magnetics, Vol 38, No 4, July 2002)。
实现时需要考虑和解决的问题
迭代译码技术在很宽广的码率及码长范围内显示出了比传统的RS码技术更好的性能,同时,对于不同应用可以灵活地在性能和实现复杂性之间进行折衷。
根据有关文献,对于一个长度为106位的分组,在1000次迭代后LDPC码的性能与Shannon极限的距离可缩小到0.0245dB。尽管这是较理想条件下的结果,却仍是个令人振奋的结果,但与此相对应的迭代译码技术在实现时的复杂性比常规的基于PRML技术的Viterbi译码器要高一个数量级以上。这种复杂性直接关系到与成本相关的芯片尺寸、与使用性能相关的功耗、与系统性能相关的时延以及系统的数据传送带宽等。因此,在系统性能和实现复杂性之间寻找合适的折衷成为将这项技术实用化的关键,对于消费类电子产品等对芯片体积和功耗及成本极其敏感的领域尤其如此。
在迭代译码过程中,迭代的次数越多,最终输出的误码率越低,但由此产生的译码延时也越长,系统的存取时间有可能受到影响。在具体实现迭代时,考虑到译码过程的实时性,可以将迭代过程作展开处理,即以芯片面积为代价将迭代过程转化为流水处理过程。但展开的级数也不宜过多,否则,实现时的成本及功耗将过高,对在消费类电子产品中的应用带来障碍。仿真结果表明,在对编码方法和译码器具体结构进行仔细的优化后,即便将迭代次数缩减为有限的二~四次后产生的性能损失考虑进去,相对于使用常规PRML技术可能带来的性能提高而言,使用有限次迭代技术所带来的整体性能提高仍然是非常显著的。
为了使迭代译码技术的实际实现成为可能,需要将随之产生的成本提高和功耗降低到可以接受的程度。使用最为先进的CMOS半导体制造技术,如90nm或65nm技术,并在并行信号处理技术、流水线技术、定时技术、系统微结构、Viterbi译码器蝶式结构的展开技术、低功耗设计技术、电路结构优化技术、电源功耗管理技术等方面作尽可能的优化已成为目前硬盘信号处理技术发展的前沿。
从误码率或信噪比的角度来讲,误码率的降低意味着在同样信噪比的环境中用硬盘存取数据更加可靠,这也意味着同样的产品将可以用于更高端(如企业级)或更苛刻(如消费类)的使用环境。对高端应用而言,这意味着成本的降低。从另一个角度出发,性能的提高意味着在同样误码率的情况下,所需要的信号的信噪比更低,或允许信号中的码间干扰更强一些,这就意味着可以将数据在磁盘上的存储密度进一步提高,也就是说,可以将硬盘的存储容量进一步提高。
|