中国·芯片交易在线
首页 | 供应信息 | 求购信息 | 库存查询 | 新闻中心 | 展会资讯 | IC厂商 | 技术资料 | 自由区域
   新闻首页 |  行业动态 | 新品发布 | 政策法规 | 科技成果 | 模拟技术 | 嵌入系统 | 传感控制 | 存储设计  
当前位置:IC72首页>> IC新闻中心>> 科技成果 >>电子行业新闻正文

32位DSP设计中的流水线数据相关问题及解决办法

时间:2007/6/1 13:32:00  作者:  来源:ic72  浏览人数:1465
 
 

      引言
 
      在航空微电子中心的某预研项目中,需要开发设计某32位浮点通用数字信号处理器(DSP)。本系统控制通路部分的设计采用超级哈佛及五级流水线结构。本文分析了该流水线的设计过程,并对遇到的数据相关问题提出了一种新的解决方法。

      1 流水线结构

      流水线处理器一般把一条指令的执行分成几个步骤,或称为级(stages)。每一级在一个时钟周期内完成,也就是说在每个时钟周期,处理器启动并执行一条指令。如果处理器的流水线有m级,则同时可重叠执行的指令总条数为m。由于每条指令处在不同的执行阶段,因此,如果分级分得好,每一级都没有时间上的浪费,这就是最理想的情况。流水线处理器在理想情况下与非流水线处理器的性能加速比为:

ic72新闻中心

      式中,I为一个程序被执行的总的指令条数,它在流水线处理器和非流水线处理器中是相等的。CPInp是每条指令总体平均所需的时钟周期数。因为流水线处理器把一条指令的执行时间理想地分成了m级,故有m条指令在同时(重叠)执行。T是每个时钟周期的时间长度,本例可假设它在两种处理器中也是相同的,那么,最后总的加速比为m(即等于流水线的级数)。并不是说把流水线级数分得越多,处理器的性能就越好。流水线处理器性能提高的关键在于每个时钟周期处理器都应当能启动一条指令的执行。

      2 数据相关问题

      下面来讨论数据相关(data dependence)问题及解决方法,先来看看下面的程序例子:

ic72新闻中心

      在上述程序段中,I1指令把寄存器r2和r3的内容相加,并将结果存人寄存器r1,这样,它下面的4条指令均与I1相关,其使用I1的结果如图1给出的数据相关关系图。从图中可见,当每个周期结束时,在时钟上升沿应把数据打入寄存器。在数据没被打入之前,任何从该寄存器读出的数据都是过时的。图1中的I2到I4的3条指令就属于这种情况。它们从r1寄存器读出的数据都是过时的,是不能使用的。I5则没关系,当它读r1寄存器时,I1已将结果写入。

ic72新闻中心

      I1下面有3条指令不能从寄存器r1读出正确的数据。为了减少数据相关指令的条数,设计时可以让写寄存器堆的操作提前半个周期,即由时钟的下降沿打入。实践证明这样做是可行的,因为假定一个时钟周期是10 ns,寄存器堆的访问只需要5 ns。这样,数据相关的指令条数就减至两条,其操作示意图如图2所示。

ic72新闻中心

      3 数据相关问题的解决

      在流水线处理器中处理数据相关问题有两种方法:一种是暂停相关指令的执行,即暂停流水线,直到能够正确读出寄存器操作数为止;另一种是采用专门的数据通路,直接把结果送到ALU的输入端,也就是把内部数据前推。描述这两种方法可参考图2所示的方案,即把写寄存器堆提前半个周期,这时,只需考虑两条相关指令。下面以ALU指令为例对暂停流水线的执行方法加以分析。

      3.1 暂停数据相关流水线

      暂停数据相关流水线指令是当数据相关出现时,暂时停止相关指令的执行,等剑相关数据能从寄存器读出再恢复执行。这里涉及到两个问题,一个是如何检测数据相关,另一个是如何暂停流水线。下面对这两个问题分别加以描述。

      首先考虑数据相关如何用硬件电路检测出来。由于I1与目的寄存器rd、I2和I3的源操作数是寄存器rs1或rs2中的数据,且只有当它们的rs1或rs2与I1的目的寄存器号rd相等时才有可能发生数据相关,因此,硬件电路中要有比较器。由于指令格式中的源寄存器号rs2与立即数部分重叠,而立即数是不会出现相关的,因此,指令操作码必须要参与检测,以区分是寄存器操作数还是立即数。另外,如I1指令的rd一定作为目的寄存器号使用,也就是当结果要被写入目的奇仔器时,后面的指令才有可能与之相关。上述规则用表达式表述如下(它们是在ID级检测数据相关的表达式):

ic72新闻中心

      由于一条指令中的两个源操作数都可能与上一条指令的目的操作数相关,因此,总的数据相关DEPEN由A DFPEN和B_DEPEN两部分组成。A_DEPEN指的是源寄存器rs1数据相关,B_DE-PEN指的是源寄存器rs2数据相关。另外,两条指令I2和I3也都可能与I1相关。如果是在流水线ID级检测数据相关,那么,对于I2来讲,I1处在EXE级;对于I3来讲,I1处在MEM级,因此,A_DEFPEN包括EXE_A_DEPEN和MEM_B_DEPEN两部分。EXE_A_DEPEN的意思是处在ID级的指令与处在EXE级的指令数据相关。同理,MEM_A_DEPEN的意思是处在ID级的指令与处在MEM级的指令数据相关。同样,B_DEPEN也包括EXE_B_DEPEN和MEM_B_DEPEN两部分。

      EXE_A_DEPEN为真的条件是:I2的rs1与I1的rd相等(ID_rs1==EXE_rd),rs1字段是寄存器(ID_rs1IsReg),并且I1的rd确实是目的寄存器(EXE_WREG==1)。后一个条件是为排除store指令而加上的。EXE_B_DEPEN与EXE_A_DEPEN类似,源寄存器号(ID_rs2IsReg)所包含的指令要比ID_rs1IsReg少得多。I3与I1的数据相关判断与此类似。

      得出了数据相关条件后。下一步的任务是确定如何暂停流水线。这里要特别注意的一个问题是不能停止所有指令的流水线,而只能暂停相关指令及其后续的所有指令。假如I2与I1相关,则只暂停I2及I2以下的指令,而不应把I1也暂停,否则,处理器将永远暂停下去。暂停流水线要注意以下3个方面:

ic72新闻中心

      (1) 封锁当前正译码的指令的写控制信号;

      (2) 不能把从存储器取来的下条指令打入IR;

      (3) 不改变当前PC值。

      实际操作时可使用如下的方法实现流水线的暂停:

      这样,当I2与I1相关时,流水线将暂停两个周期。I3与I1相关时,流水线暂停一个周期。通常把被暂停掉的周期称作流水线“气泡”。暂停流水线是解决流水线处理器数据相关问题的一种有效方法。使用这种方法可保证处理器能够从寄存器堆读出正确的数据。但是,暂停流水线两个或一个周期会造成处理器性能的损失。因此,如果没有数据相关,处理器完全可以多执行两条或一条指令。在使用这种方法的处理器组成的计算机系统中,高级语言的编泽器和汇编器在产生最终目标机器码时,应尽量避免出现过多的数据相关指令序列。编译器和汇编器最初可以在相关指令之间插入nop指令,然后进行优化,可以用一些有意义的不相关的指令替换掉nop,以减少“气泡”的出现。

      3.2 内部前推

      流水线数据相关问题的本质在于一条指令执行时要用到上面指令的计算结果,但这个结果尚未被写入寄存器堆,因此,如果让ALU使用从寄存器堆渎出的数据的话,流水线“气泡”问题也可以得到解决。试想,数据相关发生在ALU计算周期,而所有的计算任务均由这一个ALU来按顺序完成,也就是说,ALU计算时发现与上一条或两条指令的结果数据相关的话,这些结果实际上已由ALU计算出来了,只是还没有写入寄存器堆,但其结果还在流水线寄存器R和C中,这就可以把它们直接拿过来用。为此,可在ALU的两个数据输入端各加一个多路器,以使R和C中的数据能被直接送到ALU的输入端,这样就用内部前推技术提高了流水线的性能。

      4 结束语

      采用暂停数据相关流水线的方法可以解决数据相关问题。目前,笔者已将该方法应用于某32位浮点通用数字信号处理器中,而且该处理器已经没计完成,并通过综合仿真查验波形证明:该DSP完全符合要求。

 
【相关文章】
·对等网络(P2P)技术在IPTV中的应用研究
·高性能∑-Δ ADC的原理及应用
·正负脉冲电源用双重保护电路的研究
·TMS320F2812扩展正交解码脉冲接口的设计
·基于低压差线性LED驱动器的手机背光解决方案
·基于模糊控制的便携式心电监护仪的设计
·32位DSP设计中的流水线数据相关问题及解决办法
·MSP430在频率测量系统中的应用
·基于89C51的摄像镜头控制电路设计
·ACS706实验分析及在低成本伺服驱动器中的应用
·基于CPLD的声发射信号传输系统设计
·混频器用作开关,可使 DAC 采样频率加倍
·霍尔开关在铝电解天车自动兑料对位中的应用
 
 
IC新闻搜索
 
热点新闻
基于红外超声光电编码器的室内移动小车定位系
基于闪烁存储器的TMS320VC5409DSP并行引导装载方法
非移动市场需求飙升,ARM预计2010年出货量超50亿片
一种快速响应的电容式湿度传感器感湿薄膜设计
利用特殊应用模拟开关改进便携式设计
无线传感器网络跨层通信协议的设计
基于ARM9内核Processor对外部NAND FLASH的控制实现
基于GSM技术的汽车防盗系统的设计
热电阻在烟叶初烤炕房温度控制中的应用
高速数据转换系统对时钟和数据传输的性能要求
友情连接
 关于我们  IC论坛  意见反馈  设置首页  广告服务  用户帮助  联系我们
copyright:(1998-2005) IC72 中国·芯片交易在线
(北京)联系电话:(010)82614113、82614123 传真:(010)82614123 客户服务:service@IC72.com 库存上载:IC72@IC72.com
在线MSN咨询:ic72sale8@hotmail.com 通信地址:北京市西城区西直门内大街2号大厦15层 邮政编码:100013
(深圳)联系方式: 在线MSN咨询:ic72sale6@hotmail.com 在线QQ咨询:191232636 通信地址:深圳市福田区振华路
注 册 号: 1101081318959(1-1)

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 0 1 2 3 4 5 6 7 8 9