尽管手机和PMP等便携设备的显示屏不足以支持高清,但对MPEG-4、H.264和VC-1等高清格式的支持已经成为未来的发展趋势。为此,Tensilica公司最近发布了四款用于SoC设计的标准视频处理器内核,它可以支持所有流行的VGA和SD(D1)视频编解码算法,包括H.264/VC-1/MPEG-2 Main Profile和MPEG-4 ASP等。与传统的CPU+硬件加速器方法相比,它通过软件方式来实现所有视频关键处理的功能,功耗更低,更为灵活,并大幅减少了系统CPU的负担。
在过去几年中,对H.264/VC-1等高清格式的支持主要是DVD、机顶盒和高清电视等固定消费电子设备。随着互联网上各种高清视频内容丰富以及移动电视的流行,对高清编解码格式的支持也扩展到了手机和PMP等便携设备。Sigma Designs中国区市场负责人薛念庆对《国际电子高情》记者表示:“07年高清浪潮甚至会席卷PMP,尽管它的显示屏达不到高清,但由于PMP是存储设备,同时也是播放设备(输出到高清电视),它一定要能够支持所有的标清、高清解码,而不需要转码,例如MPEG1~4、H.264和VC-1。用户不能够容忍PMP不能够支持一些格式。”
正是在这种背景下,在便携设备音频处理内核领域大获成功的Tensilica公司最近发布了预先定制的四款用于SoC设计的Diamond Standard VDO(ViDeO)处理器引擎,可以支持多标准多分辨率视频模块。面向移动手机和PMPs应用,这些视频子系统的设计是完全可编程,可以支持所有流行的VGA和SD(也称D1)视频编解码算法。包括H.264 Main Profile、VC-1 Main Profile, MPEG-4 Advanced Simple Profile (ASP)和MPEG-2 Main Profile。其算法的分辨率支持720x480(NTSC)和720x576(PAL),同时也支持较低分辨率,如QCIF、QVGA、CIF和VGA。
Tensilica总裁兼CEO Chris Rowen表示,“Tensilica已准备好向那些将开发高品质视频产品的半导体制造商和系统OEM公司提供全部经过测试的新产品解决方案。希望创造出象HiFi音频引擎一样的成功方案。HiFi音频引擎已被广泛应用于数十款流行的手机设备中,其中包括摩托罗拉公司最新KRZR和RIZR手机。”
业界首次以纯软件方式实现所有视频关键处理
为开发新的Diamond Standard VDO系列,Tensilica采用了Xtensa可配置且可扩展处理器技术,创造了一个双处理器的子系统模块。Diamond VDO双核架构包括基于Xtensa架构配置得到的一个流处理器和一个像素处理器(类似媒体DSP的功能)。流处理器指令集对视频数据(熵解码、运动向量的预测等等)的串行式处理进行了优化。Tensilica在Diamond VDO系列中定义了400多条视频专用指令,与通用DSP或通用32位微处理器相比,性能显著提升。这些指令是针对视频处理中性能要求苛刻的部分优化得到的,这些算法部分包括:CABAC、CAVLC、Deblocking、Transforms,以及运动补偿和运动估计等。
Diamond Standard VDO引擎在处理器上通过软件方式来实现所有视频关键处理的功能,包括网络抽象层(network abstraction layer)、图像层、条代层(slice layer)、比特流解析、以及熵解编码,包括在H.264 Main Profile解码器中进行CABAC(Context-Adaptive Binary Arithmetic Coding)解码。
Diamond Standard VDO系列四款产品满足不同的市场需求
Tensilica公司移动多媒体方案市场总监Larry Przywara介绍说,无论是CPU+硬件加速器还是CPU+媒体DSP+硬件加速器,传统的解决方案都都忽略了CABAC功能,或采用独立的复杂且不可编程的硬件模块,或利用700MHz普通CPU来实现该功能(这种方法明显增加功耗),当新的视频标准出现后,面临重新设计芯片的风险。
他强调说:“Tensilica是第一家在处理器数据路径中用纯软件方案实现CABAC的视频解决方案。通过在指令集扩展中实现对CABAC的支持,Tensilica创造出一款低频低功耗,面积少于典型CABAC硬件一半的CABAC模块。”
与传统方案相比,功耗、体积和对系统CPU需求大幅降低
Przywara还详细比较了Diamond VDO引擎和传统的CPU+硬件加速器、CPU+媒体DSP+硬件加速器方法的优势,包括灵活性更强、功耗和面积更小,以及对系统CPU的需求大幅降低。
首先,Diamond VDO IP核减少了系统主控CPU的全部视频解码任务——包括全部比特流解析,因此只需要很低频率的主控CPU。传统的硬件加速器仅可减少如运动估计那样的像素处理工作,而将大部分计算负担(经常需要100MHz的持续的主控CPU开销)交由系统控制器来完成。
第二,传统解决方案包括了一个CPU和一个硬件加速器,当数据通过系统总线在CPU和加速器间进行传输时会产生大量的功耗——通常出于方便,其他方案不计算这部分功耗,这样使得他们宣称的硬件加速器模块本身的消耗很低。Diamond VDO可完成绝大部分任务,不需要频繁的总线传输,可降低功耗。
Diamond Standard VDO系列针对移动应用而优化
第三,当Diamond VDO引擎没有被用于进行视频处理时,可随时以一种相当于有500多Dhrystone MIPS处理能力的通用CPU来执行其他系统任务——相反一个特定的视频硬件模块是不能被重用的。
第四,Diamond VDO引擎是可编程的,因此可支持今后出现的视频标准。传统方案中,如果是硬线连接的实现,必须添加新的硬件模块,必须设计新的芯片,原终端产品也必须作废;如果基于媒体DSP处理器,而困难部分的算法仍然通过处理器外面的RTL的来实现,新算法可能仅需要修改软件,但是也可能会影响硬件RTL模块,会导致重新流片的风险。
最后,Diamond VDO引擎面积小,其面积在130nm工艺下仅有8mm2(包括处理器逻辑和内部存储器)。
Diamond Standard VDO系列针对移动应用而优化,比其他竞争产品具有更小面积、更低的功耗。在节省面积方面,例如,Diamond 383VDO,其面积包括存储器仅占10mm2;全功能Diamond 388VDO可在D1分辨率下,提供完全的H.264 Main profile解码和MPEG-4 ASP编码的支持,而其包括存储器的面积仅有 12mm2,且在TSMC 0.13G工艺技术下运行速度为200MHz。
Diamond VDO系列提供Baseline Profile和Main Profile两种解决方案——Main Profile提供更佳的数据压缩率和视频质量,是面向高级手机和PMP应用的D1或者更高分辨率的更好的编解码机制。大多数其他的SoC视频解决方案只实现Baseline Profile的视频效果。
Tensilica针对新Diamond VDO引擎开发了编码器和解码器,客户能直接从Tensilica购买到软硬件完整的解决方案,SoC设计工程师不用依赖第三方应用提供商,Tensilica同时提供全套与之适配的软件开发工具链。 |