电子文章 | 电子资料下载 | 家电维修 | 维修资料下载 | 加入收藏 | 全站地图
您现在所在位置:电子爱好者维修技术维修教程知识电子制作多声道数字音频系统的编码及应用

多声道数字音频系统的编码及应用

09-08 00:46:07 | http://www.5idzw.com | 电子制作 | 人气:677
标签:电子小制作,http://www.5idzw.com 多声道数字音频系统的编码及应用,http://www.5idzw.com
1、前言
对于CD格式来说,大家都知道它具有良好的信噪比、超过80dB以上的动态范围以及超过15kHz的频率范围,这使得它具有良好的音频质量和满意的收听效果,但是它仅仅提供了两个声道。多声道数字音频系统通过声道的扩展,不仅在质量上与CD音频不相上下,同时还带给听众身临其境的感受,而这是传统单声道和立体声无法实现的,因此多声道数字音频系统已被更多的听众接受,同时也逐渐成为
图2 编码、传输、人耳听音的实现
2.1 根据听觉域度对可闻信号进行编码
  人耳对声振动的感受,在频率及声压级方面都有一定的范围,频率范围正常人约为20Hz~20kHz,而声压级范围则是如图听阈曲线来描述的。意即在这条曲线之下的对应频率的信号是听不到的。
图16 MPEG-2音频混合后环绕声兼容性 如图3所示,对于信号A来说,由于其声压级超过听阈曲线的声压级域值,所以可以对人耳造成声振动的感
受,意即听到A信号。而对B信号来说,其声压级位于听阈曲线之下,虽然它是客观存在的,但人耳是不可闻的。因此,可以将类似的信号去除掉,以减少音频数据率。
2.2 根据掩蔽效应,只对幅度强的掩蔽信号进行编码
人耳能在寂静的环境中分辨出轻微的声音,但在嘈杂的环境中,同样的这些声音则被嘈杂声淹没而听不到了。这种由于一个声音的存在而使另一个声音要提高声压级才能被听到的现象称为听觉掩蔽效应。 
  如图4所示,虽然B、C两信号的声压级已超过听阈曲线的范围,人耳已可以听到B、C两信号的存在,但是由于A信号的存在,通过前向掩蔽将C信号淹没掉,通过后向掩蔽将B信号淹没掉,从而最终到达人耳引起感觉的只有A信号。因此,可以将类似的B、C信号去除掉以减少音频数据率。
2.3 量化噪声使得不必全部编码原始信号
类似于人耳的听阈曲线,由于数字信号存在着量化噪声,如图5所示,对于信号A和B来说,并不一定要将A、B信号进行全部幅度的编码,而只需将A、B信号与量化噪声的差值进行编码就可以达到相同的听觉效果,因此,在编码过程中实际量化幅度就可以大大的减少,而减少数据率。


2.4 通过子带分割来进行优化、编码
在传统的编码过程中,都是将整个频带作为操作对象,采用相同的比特分配对每个信号进行量化。而实际上,由于听觉曲线的存在及其它因素,对于幅度较小的信号可以分配较少的比特数就可以达到要求,因此将整个频带分成多个子频带,然后对每个子频带的信号独立编码,从而使得在每个子频带中比特分配可以根据信号自身来适应。
如图ABCD四个信号,如果对整个频带编码,对于D信号来说分配16比特来量化则显得多余浪费,所以如果将ABCD分别置于不同的子带内,则可在分别所处的子带内使用最适合的比特数分配给信号来编码,从而减少数据率,同时如果用于分割的子带分辨率越高,意即子带的频带相对越窄,那么在子带中分配的比特数
就越精确,而减少了比特率。
2.5 不同的实现方式
当前在数字音频编码领域存在着各种不同的编码方案和实现方式,为了能够让大家对此有一个较完整的认识,在本文中仅对当前流行的几种典型的编码方法做一个介绍。不管是通过那一种方式实现,其基本的编码思路方框图都大同小异,如图7所示。对于每一个音频声道中的PCM音频信号来说,首先都要将它们映射到频域中,这种时域到频域的映射可以通过子带滤波器(如MPEG Layers I,II,DTS)或通过变换滤波器组(如AC-3,MPEG AAC)实现。这两种方式的最大不同之处在于滤波器组中的频率分辨率的不同。
每个声道中的音频采样块首先要根据心理声学模型来计算掩蔽门限值,然后由计算出的掩蔽门限值来决定如何将公用比特区中的比特分配给不同的频率范围内的信号,如MPEG Layers I,II,DTS所采用;或由计算出的掩蔽门限值来决定哪些频率范围内的量化噪声可以引入而不需要去除,如AC-3,MPEG AAC所采用。
然后根据音频信号的时域表达式进行量化,随后采用静噪编码(如MPEG Layers I,II,DTS,MPEG AAC)。最后,将控制参数及辅助数据进行交织产生编码后的数据流。解码过程则首先将编码后的数据流进行解复用,然后通过比特流中传输的控制参数对音频数据反量化,或通过心理声学模型参数反向运算得到音频信号(如AC-3),最后将得到的音频信号由频域反变换到时域,完成解码过程。
另外多声道数字音频编码技术还充分利用了声道之间的相关性及双耳听觉效应,来进一步去除声道之间的冗余度和不相关度。去除通道之间的相关度,一种最常用的方法是M/S方式,在这种方式中是将两个独立声道的频谱相加和相减,根据两个声道的相关度大小,来决定是传输和/差信号还是传输原始信号。
由于人耳对于频率超过2-3kHz的声音定位主要是通过内耳密度差分(IID)实现的,因此为了进一步减少数据率,将各个声道中频率超过约定门限值的信号组合后再进行传输。这种技术应用在MPEG Layers I,II,III中,实现强度立体声编码;用在AC-3中对两个声道或耦合声道实现多声道编码。在MPEG AAC中,则既可实现强度立体声编码,又可实现多声道编码。
1、杜比数字AC-3编解码压缩过程
AC-3最早是在1991年的电影“Batman Returns”中应用的。它的应用不仅在电影界占有一席之地,而且它已被北美地区的数字电视及DVD视频定为其数字音频实施规范。我们熟知的AC-2,AC-3都是由两声道发展而来的,即杜比数字(Dolby Digital)。对于数字音频信号来说,通过应用数字压缩算法,来减少正确再现原始脉冲编码调制(PCM)样本所需要的数字信息量,得出原始信号经数字压缩后的表达式。 
3.1 AC-3编码过程
AC-3编码器接受PCM音频并产生相应的AC-3数码流。在编码时,AC-3算法通过对音频信号的频域表达式进行粗量化,达到高的编码增益(输入码率对输出码率之比)。如图8所示。
编码过程的第一步是把音频表达式从一个PCM时间样本的序列变换为一个频率系数样本块的序列。这在分析滤波器中完成。512个时间样本的相互重叠样本块被乘以时间窗而变换到频域。由于相互重叠的样本块,每个PCM输入样本将表达在两个相继的变换样本块中。频域表达式则可以二取一,使每个样本块包含256个频率系数。这些单独的频率系数用二进制指数记数法表达为一个二进制指数和一个尾数。这个指数的集合被编码为信号频谱的粗略表达式,称作频谱包络。核心的比特指派例行程序用这个频谱包络,确定每个单独尾数需要用多少比特进行编码。将频谱包络和6个音频样本块粗略量化的尾数,格式化成一个AC-3数据帧(FRAME)。AC-3数码流是一个AC-3数据帧的序列。
在实际的AC-3编码器中,还包括下述功能:
l附有一个数据帧的信头(header),其中包含与编码的数码流同步及把它解码的信息(比特率、取样率、编码的信道数目等)。
l插入误码检测码字,以便解码器能检验接收的数据帧是否有误码。
l可以动态的改变分析滤波器组的频谱分辨率,以便同每个音频样本块的时域/频域特性匹配的更好。
l频谱包络可以用可变的时间/频率分辨率进行编码。
l可以实行更复杂的比特指派,并修改核心比特分派例行程序的一些参数,以便产生更加优化的比特指派。
l一些声道在高频可以耦合在一起,以便工作在较低比特率时,可得到更高的编码增益。
l在两声道模式中,可以有选择的实行重新设置矩阵的过程,以便提供附加的编码增益,以及当两信道的信号解码时使用一个矩阵环绕声解码器,还能获得改进的结果。发展是从85年以后开始的,其中包括了我们熟知的Eureka 147 DAB(尤里卡147数字音频广播)和DVB。不断发展的数字调制方式及编码算法都为数字音频广播提供了更加有效的传输和存储方式,使得在有限的带宽中以较低比特率来传输声道数更多、质量更优的音频信号成为可能。同样在数字音频广播系统的发展中也充分利用了这些以此为核心的新技术。以前,立体声广播起着主导的作用,现在随着越来越多的多声道数字音频系统的应用,在数字音频广播领域也已经开始接纳并制定相关的音频标准了。在Eureka 147 DAB和DVB中,已经包括了多声道数字音频的扩展。

[1] [2] [3] [4]  下一页

,多声道数字音频系统的编码及应用
关于《多声道数字音频系统的编码及应用》的更多文章