电子文章 | 电子资料下载 | 家电维修 | 维修资料下载 | 加入收藏 | 全站地图
您现在所在位置:电子爱好者维修技术维修教程知识电子制作多声道数字音频系统的编码及应用

多声道数字音频系统的编码及应用

09-08 00:46:07 | http://www.5idzw.com | 电子制作 | 人气:677
标签:电子小制作,http://www.5idzw.com 多声道数字音频系统的编码及应用,http://www.5idzw.com
AAC可以在低数据率的情况下提供较高质量的音频信息,如每个声道仅64kb/s时就会有比较好的性能。
AAC当前的应用主要用于日本的数字音频广播及美国的IBOC(带内同频技术)。
6、 用于DTS的相干声学编码
DTS系统中采用的数字音频压缩算法——相干声学编码,主要目的就是用于提高民用音频重放设备重放的音频质量的,其音频重放质量可以超越原有的如CD唱片的质量。同时通过更多扬声器的使用,使得听众可以感受到普通立体声无法达到的声音效果。因此总体目标就是将听众真正的带入专业的音响领 域及多声道环绕声的天地。
相干声学编码器是一种感知、优化、差分子带音频编码器,它使用了多种技术对音频数据进行压缩。下面将分别对其进行详细的描述。从整体来看,编码器与解码器的实现是不对称的。理论上编码器可以设计的非常复杂,但实际上,编码器



图19 相干声学解码器流程图
第二步是通过在每个子带中传输的辅助信息指令,对子带中的差分信号进行反量化得到子带PCM信号。这些通过反量化得到的子带PCM信号再进行反滤波处理,得到每个声道的全频带的时域PCM信号。在解码器中,没有程序用于音频质量的调整。
在解码器中包括一个可选的DSP功能模块,这个模块主要用于用户的编程使用。它允许对单个声道或全部声道中子带或是全频带PCM信号进行处理。这些功能诸如上矩阵变换、下矩阵变换、动态范围控制以及声道之间的延时调整等。
6.3
DTS系统最早是用于电影应用中的。在1993年的电影“Jurassic Park”(侏罗纪公园)中,没有使用AC-3,而是使用了DTS多声道数字音频系统。DTS系统中的音频数据是存储在一张CD-ROM上的,取代了将声音记录在胶片上的方式,而是在胶片上记录用于同步CD-ROM音频信息的时间码,通过电影胶片上的时间码来同步播放CD-ROM。由于CD-ROM与电影胶片磁迹相比,具有更大的容量和更稳定的可靠程度,因此它可以在4:1压缩比的情况下提供质量更高的多声道音频信息。对于AC-3来说,典型的压缩比为12:1。随着应用的普及,DTS系统又提出一种低数据率版本,其参数规范如下:
音频声道的个数DTS=1——10.1
FsDTS=8——192kHz
RDTS=16——24bit
BDTS=32——6144kb/s
数据帧大小DTS=512样本
在低数据率版本中,由0到24kHz的32个子带的频率,通过一个512抽头的多相正交镜象滤波器(PQMF)来实现从时域到频域的映射。另外8个附加的子带覆盖了24kHz到48kHz之间频率范围,2个附加的子带覆盖了48 kHz到96 kHz之间的频率范围。为了进一步减小冗余度,采用了前向自适应线性预测,同时心理声学模型用来对信号进行预测,在量化过程中使用了标度量化和矢量量化。
DTS的大多数应用都是采用相对较小的压缩比、工作在几乎无损情况的模式下的。一般来说,数据率在1Mb/s的情况下,DTS可以提供较好质量的音频。DTS的应用也主要是在电影、CD及DVD视频中。另外,DTS所具有的可变比特率编码方式使得它同样可以应用于DAB及DVD的广播中。
7、
数字音频广播系统的

www.5idzw.com3.4 杜比数字AC-3的兼容性
由于AC-3比特流中同步结构中的AB0~AB5是独立解码的,因此可以将这些编码信号重新构造为所需的输
出信号,即输出的下行兼容性。

在许多重放系统中,扬声器的数目不能同编码的音频声道的数目匹配。为了重现完整的音频节目需要向下混合。在帧同步中,AB0~AB5中记录着六个独立声道的音频数据,按照AC-3重放时的安排,我们称之为L、R、C、Ls、Rs、LFE。一般用于向下混合的过程中,低音增强LFE通道记录的音频信号主要用于渲染烘托气氛,所以向下混合时,只用其中的L、R、C、Ls、Rs。从图中可以看到编码后的AC-3数据流可以直接传输后经解码器解码为5.1通道音频信息进行重放,也可以向下混合为两个声道信号,然后经不同的解码器得到不同的重放模式。就单一环绕声道(n/1模式)而言,把S称为单个环绕声道。从图中可看出,向下混合提供两种类型:向下混合为Lt、Rt矩阵环绕编码的立体声对;
向下混合为通常的立体声信号Lo、Ro。向下混合的立体声信号(Lo、Ro或Lt、Rt)可进一步向下混合为单声道M,通过两个声道简单的相加即可。如果将Lt、Rt向下混合为单声道,环绕信息将会丢失。当希望需要一个单声道信号时则Lo、Ro向下混合更可取。
用于Lo、Ro立体声信号的一般3/2向下混合方程式为:
Lo=1.0′L+clev′C+slev′Ls;
Ro=1.0′R+clev′C+slev′Rs;
如果接着Lo、Ro被组合成单声道信号重放,有效的向下混合方程式为:
M=1.0′L+2.0′clev′C+1.0′R+slev′Ls+slev′Rs;
如果只出现单个环绕声道S(3/1模式),则向下混合方程式为:
Lo=1.0′L+clev′C+0.7′slev′S;
Ro=1.0′R+clev′C+0.7′slev′S;
M=1.0′L+2.0′clev′C+1.0′R+1.4′slev′S;
其中clev、slev分别代表中央声道混合声级系数和环绕声道混合声级系数,在BSI数据中由Cmixlev、Surmixlev比特字段来指出相对应的值。
用于Lt、Rt立体声信号的一般3/2向下混合方程式为:
Lt=1.0′L+0.707′C-0.707′Ls-0.707′Rs;
Rt=1.0′R+0.707′C+0.707′Ls+0.707′Rs;
如果只出现单个环绕声道S(3/1模式),则向下混合方程式为:
Lt=1.0′L+0.707′C-0.707′S;
Rt=1.0′R+0.707′C+0.707′S;
经过对独立声道的音频信号进行不同的分配及矩阵重组,则实现了AC-3数据流的向下兼容性, 意即通过不同的解码器、解码矩阵方式,可以得到杜比数字5.1声道环绕声、立体声、杜比Prologic、单声道以及杜比的虚拟环绕声方式。其中Lo、Ro与Lt、Rt的最大区别就是Lt、Rt是记录的全部的L、R、环绕声的信息,经过矩阵重解可得到环绕声信息,而Lo、Ro则是将环绕声信息增加支立体声信号中,无法再重现环绕声信号信息。
4、MPEG-2多声道编解码过程
MPEG-2感知编码系统充分利用了心理声学中的掩蔽效应和哈斯效应,利用压缩编码技术,将原始音频信号中不相关分量和冗余分量有效的去除掉,在不影响人耳听觉阈度和听音效果质量上,将音频信号压缩。
4.1 MPEG音频子带编码器的基本结构
感知型子带音频编码器不断地对音频输入信号进行分析。由一个心理声学模型动态地确定掩蔽门限,即在该掩蔽门限之下的多余的噪声是无法为人的听觉系统听到的。由该心理声学模型产生的信息被馈至一个比特分配模块,该模块的任务是将各声道可用的比特以一种优化的方式在频谱范围内进行分配。输入信号还与上述过程并行地被分割到一系列称为子带的频带中。每个子带信号都在经过定
标处理后被重新进行量化,该量化编码过程引入的量化噪声不能超过已确定的对应子带的掩蔽门限。因此量化噪声频谱就与信号频谱进行了动态自适应。“比例因子”和各子带所使用的量化器的相关信息与编码后的子带样值一同进行传输。
解码器可以在不了解编码器如何确定编码所需信息的情况下对码流进行解码。这可以降低解码器的复杂度,并为编码器的选择和解码器开发提供了很大的灵活性。如在心理声学研究上取得了新的结果,则更高效率和更高性能的编码器可在与所有现有解码器完全兼容的条件下得以应用。这一灵活性目前已有了成功的例子,现在最高技术水平的编码器的性能已超过了标准化过程中使用的早期编码器。

4.2 层
MPEG音频标准包括了三种不同的算法,称为层。层数越高,相应可达到的压缩比就越高,而复杂度、延时及对传输误码的敏感度也越高。层II专门对广播应用进行了优化。它使用了具有32个等宽子带划分的子带滤波,自适应比特分配和块压扩。单声道的码率范围为32-192 kbps,立体声为64-384 kbps。
它在256 kbps及192 kbps相关立体声条件下的表现十分出色。128 kbps(立体声)条件下的性能在许多应用中仍可接受。
4.3 MPEG-2在多声道音频方面的扩展
ITU-R工作组TG10-1在关于多声道声音系统的建议方面进行了工作。该项工作的主要成果就是建议BS.775,其中说明一个适当的多声道声音配置应包含五个声道,分别代表左、中央、右、左环绕、右环绕声道。如果使用了一个作为选项的低频增强声道(LFE),则该配置被称为“5.1”。五声道配置也可表示为‘3/2’,即三个前置声道及两个环绕(后置)声道。

上一页  [1] [2] [3] [4]  下一页

,多声道数字音频系统的编码及应用
关于《多声道数字音频系统的编码及应用》的更多文章