音频数字化处理方法 音频数字化处理过程

  • A+
所属分类:音频杂谈

数字音频是指用一连串二进制数据来保存声音信号。这种声音信号在存储和电路传输及处理过程中,不再是连续的信号,而是离散的信号。关于离散的含义,可以这样去理解,比如说某一数字音频信号种,根据A代表的是该信号中的某一时间点a,数据B是记录时间点b,那么时间点a和时间点b之间可以分多少时间点,就已经固定,而不是无限制的。也就是说,在坐标轴上描述信号的波形和振幅时,模拟信号是用无限个点去描述,而数字信号是用有限个点的描述

多媒体计算机只能处理离散的二进制数字信号,因此,在处理模拟音频信号之前必须将模拟音频数字化。计算机对音频信号处理完成之后,必须将得到的数字音频信号转变成模拟信号进行播放。
1、音频的数字化处理
随着计算机技术的发展,特别是海量存储设备和大容量内存在PC机上的实现,对音频制作进行数字化处理便成为可能。数字化处理的核心是对音频信息的采样,通过对采集到的样本进行加工,达成各种效果,这是音频媒体数字化处理的基本含义。
2、音频的基本处理
基本的音频数字化处理包括以下几种:
不同采样率、频率、通道数之间的变换和转换。其中变换只是简单地将其视为另一种格式,而转换通过重采样来进行,其中还可以根据需要采用插值算法以补偿失真。
针对音频数据本身进行的各种变换,如淡入、淡出、音量调节等。
通过数字滤波算法进行的变换,如高通、低通滤波器。
3、音频的三维化处理
长期以来,计算机的研究者们一直低估了声音对人类在信息处理中的作用。当虚拟技术不断发展之时,人们就不再满足单调平面的声音,而更催向于具有空间感的三维声音效果。听觉通道可以与视觉通道同时工作,所以声音的三维化处理不仅可以表达出声音的空间信息,而且与视觉信息的多通道的结合可以创造出极为逼真的虚拟空间,这在未来的多媒体系统中是极为重要的。这也是在媒体处理方面的重要措施。
人类感知声源的位置的最基本的理论是双工理论,这种理论基于两种因素:两耳间声音的到达时间差和两耳间声音的强度差。时间差是由于距离的原因造成,当声音从正面传来,距离相等,所以没有时间差,但若偏右三度则到达右耳的时间就要比左耳约少三十微秒,而正是这三十微秒,使得我们辨别出了声源的位置。强度差是由于信号的衰减造成,信号的衰减是因为距离而自然产生的,或是因为人的头部遮挡,使声音衰减,产生了强度的差别,使得靠近声源一侧的耳朵听到的声音强度要大于另一耳。
基于双工理论,同样地,只要把一个普通的双声道音频在两个声道之间进行相互混合,便可以使普通双声道声音听起来具有三维音场的效果。这涉及到以下有关音场的两个概念:音场的宽度和深度。
音场的宽度利用时间差的原理完成,由于现在是对普通立体声音频进行扩展,所以音源的位置始终在音场的中间不变,这样就简化了我们的工作。要处理的就只有把两个声道的声音进行适当的延时和强度减弱后相互混合。由于这样的扩展是有局限性的,即延时不能太长,否则就会变为回音。
音场的深度利用强度差的原理完成,具体的表现形式是回声.音场越深,则回音的延时就越长.所以在回音的设置中应至少提供三个参数:回音的衰减率、回音的深度和回音之间的延时。同时,还应该提供用于设置另一通道混进来的声音深度的多少的选项。
4、音频数字化过程的具体步骤
第一步,将话筒转化过来的模拟电信号以某一频率进行离散化的样本采集,这个过程就叫采样;
第二步,将采集到的样本电压或电流值进行等级量化处理,这个过程就是量化;
第三步,将等级值变换成对应的二进制表示值(0和1),并进行存储,这个过程就是编码。音频编辑制作通过这三个环节,连续的模拟音频信号即可转换成离散的数字信号——二进制的0和1。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: