不论是制作端、播放端或设备端,数字多媒体的应用已愈来愈多样和广泛,在技术上的努力都致力于达到随时(Anytime)、随地(Anywhere)、任何设备(Any device)和各种网络(Any network)都能制作、播放数字多媒体的环境。这些设备包括电视、计算机和汽车影音播放器,以及各式各样的手持式设备,其中又以手机为众所关注的大宗市场。这些固定或随身型的设备不仅要能录、能放,而且开始要求能提供高画质(HD)的影音内容。
为实现这些应用需求,多媒体芯片目前面临极大的挑战,例如必须有能力支持广泛且持续更新的多媒体格式、提供高质量的编解碼能力、适合多样化的可携式造型设计、延长电池的续航力,并能加速上市的时程。也就是说,今日的多媒体芯片必须在效能、弹性及功耗上获得突破,因而需要采用新一代的技术架构。本文将剖析数字多媒体的技术挑战,并说明异质多核心平台的优势所在。
数字多媒体设计议题
今日市场上已开发许多的视讯编码标准,不同的设备会因应用性的不同而选择需要的视讯编译码技术。不过,随着这些消费性电子设备朝向互连性、开放性发展,因此愈来愈被要求能够兼容广泛的解碼能力。要做到这一点并不容易,因为市场上已出现太多的影音标准,而这些标准中往往又存在不同的版本(versions)和规格(profiles);不仅如此,在传送上,视讯编码比特流会被包裹为各种不同的档案格式,视讯系统要能够阅读与译码。
在视讯标准的制定上,目前的工作以延伸现有的标准为主,而非开发全新的视讯编译码方法。在版本更新的制定目标上,是希望做到更有效率的频宽使用。其它的努力包括让H.264具备3D视讯的多重观看编解碼能力,以及提高标准的延展性。延展性的目的在于让一种编码格式能够以不同的分辨率和讯框速率来译码,这有助于解决标准纷歧不兼容的问题。
其它要考虑的议题还包括影像分辨率、讯框速率(frame-rate)、位速率(bit rate)等基本的影像条件,不同的条件提供不同的影像质量,例如标准画质电视讯号为每线720像素,可携式多媒体播放器(PMP)的屏幕通常为每线320像素。在设计上还需注意延迟性、前/后处理能力、错误回复、稳固性、同步性以及运算功率等技术议题。以前/后处理为例,在视讯编译码的前后,透过影像过滤、缩放和讯框速率转换等先进的算法,能够大幅改善呈现在屏幕上的影像质量。
另一个重大的设计挑战来自于手持式设备对高画质(HD)视讯的需求。HD对内容质量的要求比SD高出许多,不论是音讯或视讯内容,都需要更高的取样速率及位速率,也需要更多的内存容量及处理器资源。以视讯内容为例,HD的数据内容庞大,其讯框数据比SD多出6至8倍,数据传输率需要90–120 MB/s,HD的位速率更可高达100 Mbps以上。
异质多核心平台架构
在为设备选择一个视讯处理系统时,最理想的作法是选择能处理许多视讯编译码标准和处理技术的系统,而且具备软件可程序性和韧体可升级性,这样才能提供最大的设计弹性来满足上述的设计议题。此外,对于运算资源有限的手持式设备来说,高画质视讯是相当不易达成的任务,因此必须采用突破性的视讯处理架构。
目前市场上存在多种视讯处理作法,基本上是以硬件加速器的方式来提高视讯运算的效能,或是采用DSP方案来满足设计上的弹性需求。这两类作法各有优缺点,ARC则以可配置处理器(Configurable Processor)为核心,提出兼容性的VRaptor异质多核心平台的解决途径。

图一:ARC VRaptor异质多核心平台架构图。
这套可平行运算的架构中包括三种不同类别的处理器核心:第一类是ARC的可配置32位RISC核心和以128位数据向量来运作SIMD(Single Instruction Multiple Data)引擎。ARC可配置处理器具有7个管线级数(pipeline stage),允许更高的频率速率,它能执行主处理(host-processing)功能,如执行操作系统、作为应用功能的控制器和进行音讯译码。
SIMD的一个指令能操作16个平行的数据动作,它的一般指令集架构能支持广泛的应用,特殊指令则被用来加速H.264和VC-1所需要的去除方块效应算法。这些指令能够有效的利用核心的运算资源,例如能针对解块低通滤波器(low-pass deblocking filters)和图素转换等提供最佳化功能,而且能与ARC 700主核心平行地自行运作。
第二类为硬件加速器,例如熵编译码器(Entropy encode/decode)以及运动估算(Motion Estimation)等,在执行多媒体处理工作上,比一般用途可编程核心的效率更高,以硬件联机(hardwired)的Entropy译码加速度器来说,它支援霍夫曼式MPEG-1/2/4和VC-1视讯编译码标准,以及H.264 BP所需要多种译码方式。第三类包括高速DMA控制器,能解决CPU在处理多媒体编译码所涉及的复杂数据移动,它负责独立地从系统内存处移动数据数据。
透过这种异质核心架构,用户能够根据其需求做弹性的可配置设计,更重要的是,高效能的平行运算能够以有限运算资源来实现高画质的需求,而且保有低功耗的特性。举例来说,ARC采用65nm制程的AV417V视讯子系统,以2.35mm2的芯片面积即可以200MHz的速度执行D1/30fps的H.264 BP编码,而且能进行动态编码,也就是可依处理器的频率及应用的复杂度来调整编码方式。

图二:以65nm制程制造的ARC AV417V视讯子系统(含3个处理器核心和3个加速器)。
结论
市场上对高画质的数字多媒体已有愈来愈高的需求,对于手持式设备来说,由于运算资源有限,设计上的挑战更为严苛,因此有必须采用更有效率的先进技术架构才行。异质多核心平台的处理架构兼容硬件加速度器的效能和DSP的弹性优势,能够实现高质量的影音处理,同时能延伸多媒体标准的升级,并为系统做到最佳化调整,充分展现其在多媒体芯片设计上的优势所在。
|