拒做声盲 声音格式与编码详解

  • A+
所属分类:音频杂谈

我们平常接触到各种各样的声音格式,声音的格式类型都有什么,他们有什么不同,而我们又是怎么通过解码得到声音的感观的,在声音输出方面发展历程是怎样的呢?你都了解多少呢?今天,小编为大家综合楼一篇详细的解释,我们就来一同学习一下吧。

音频格式是指要在计算机内播放或是处理音频文件,是对声音文件进行数、模转换的过程。音频格式最大带宽是20KHZ,速率介于40~50KHZ之间,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。一般主流的播放器都支持MP3,WMA,AAC,Ogg,PCM,M4A,AC3,WAV,ACC,AC3,DD+,APE,FLAC,cue,DTS, DTS-HD MA等等。下面我们就常用到的,并且我们比较关心的和联系比较密切的一些声音文件格式类型进行一下简单的介绍。

拒做声盲 声音格式与编码详解各种音频播放器

MP3
Mp3格式应该是大家最熟悉的的文件格式了,所以把MP3格式的声音文件放在第一位,在我国,MP3可以说是传播范围最广,也是最为大家所熟知的音频文件类型,几乎我们任何的声音文件特别是音乐都能搜到MP3的版本。

MP3全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III)。是当今较流行的一种数字音频编码和有损压缩格式,它设计用来大幅度地降低音频数据量。MP3能够以高音质、低采样率对数字音频文件进行压缩。,将音乐以1:10 甚至 1:12 的压缩率,压缩成较小的文件。换句话说,音频文件(主要是大型文件,比如WAV文件)能够在音质丢失很小的情况下(人耳根本无法察觉这种音质损失)把文件压缩到更小的程度。而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。

CD

CD格式的音质是比较高的音频格式。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV,这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音频。推荐大家使用这种方法。

AAC
AAC(Advanced Audio Coding),中文称为“高级音频编码”。AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。

优点:相对于MP3格式,AAC格式的音质更佳,文件更小。
不足:AAC属于有损压缩的格式,相对于APE和FLAC等时下流行的无损格式,音色“饱满度”差距比较大。
前景:很快会被淘汰。

WMA:
WMA(Windows Media Audio),它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质。一般使用Windows Media Audio编码格式的文件以WMA作为扩展名,一些使用Windows Media Audio编码格式编码其所有内容的纯音频ASF文件也使用WMA作为扩展名。
在较低的码率下,听觉上64kbps WMA的表现基本接近128kbps MP3的音质水平,但没有达到96K的wma略好于128K的MP3,WMA在高于128以上的各种比特率表现相差不大,高频和泛音都很丰富,一般人听不出WMA128Kbps以上的音质和音色的差异,总体感觉WMA的声音偏硬,适合流行摇滚,如果是古典或者纯人声的话,感觉有点生硬,在低于128K时,WMA对于MP3拥有绝对优势!128以上的WMA相比MP3会有薄的感觉。
WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。。在128kbps及以下码流的试听中WMA完全超过了MP3格式,低码流之王不是浪得虚名的。但是当码流上升到128kbp以后,WMA的音质却并没有如MP3一样随着码流的提高而大大提升。

OGG
Ogg全称应该是OGGVobis(oggVorbis)是一种新的音频压缩格式,类似于MP3等的音乐格式。Ogg是完全免费、开放和没有专利限制的。OggVorbis文件的扩展名是.OGG。Ogg文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。OGG格式音频图Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字。
MP3是有损压缩格式,因此压缩后的数据与标准的CD音乐相比是有损失的。VORBIS也是有损压缩,但通过使用更加先进的声学模型去减少损失,因此,同样位速率(Bit Rate)编码的OGG与MP3相比听起来更好一些。另外,还有一个原因,MP3格式是受专利保护的。如果你想使用MP3格式发布自己的作品,则需要付给 Fraunhofer(发明MP3的公司)专利使用费。而VORBIS就完全没有这个问题。对于乐迷来说,使用OGG文件的显著好处是可以用更小的文件获得优越的声音质量。而且,由于OGG是完全开放和免费的,制作OGG文件将不受任何专利限制,可望可以获得大量的编码器和播放器。

WAV
WAV格式,是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,跟CD一样,对存储空间需求太大不便于交流和传播。
它符合RIFF(Resource Interchange File Format:)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几!

FLAC
FLAC即是Free Lossless Audio Codec的缩写,中文可解为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。不同于其他有损压缩编码如MP3 及 AAC,它不会破坏任何原有的音频资讯,所以可以还原音乐光盘音质。现在它已被很多软件及硬件音频产品所支持。
这是很有发展前途的一个音频格式,并且在使用上不仅音质好,而且还是免费的哦。我们所说的“FLAC是免费的”不仅仅意味着你可以不花钱而得到它。更重要的是FLAC的文件格式是对公众完全开放的,你可以以任何目的使用它。

APE
APE是流行的数字音乐文件格式之一。与MP3这类有损压缩方式不同,APE也如同是一种无损压缩音频技术,也就是说从音频CD上读取的音频数据文件压缩成APE格式后,再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。APE的文件大小大概为CD的一半,APE可以节约大量的资源。
目前比较好的高清播放机上面加入了对于FLAC、APE等无损音乐的支持,也使得高清播放机在适用范围上面又扩展了领域,相信许多热爱音乐的朋友都希望自己的播放机支持无损的音乐。
了解了声音存在的大部分主流的格式后,我们只是知道了什么样的声音文件作为什么样的方式存在。我们来讨论一下关于声音的解码还原在影音设备运用上面的问题。这样我们需要了解一下关于次世代功放的问题。从次时代功放渊源上讲起,相信大家就会有清楚的认识,学习历史是为了更好的面对现实,我们了解了这些内容。知其然更要知其所以然,那么你也成为高清播放方面关于的行家了。

在对于声音的处理上有几个巨头,他们的发展也带动了声音解码的一次次革命。先看一下他们的历史轨迹。杜比的发展历史。
发展依次为杜比AC-3、杜比EX、杜比plus、杜比TrueHD,前3代都属于有损压缩,TrunHD属于无损压缩。在功放机里,会分别显示为DD、DD EX、DD+、TrueHD,看到相应字符,你就可以知道此时功放工作在何种状态下。
DTS也经历过几代发展,DTS、DTS ex、DTS-HD HR、DTS-HD MA,注意DTS-HD下面还分高低2种技术,只有DTS-HD MA才是真正无损压缩,其他几代都是有损的。

杜比(Dobly)
提到声音解码就要提大名鼎鼎的杜比了。杜比是以一个人的名字命名的,在对于声音编码方面一直引领着行业的发展。我们目前的大多数视频中,都可以看到他的身影。

拒做声盲 声音格式与编码详解

dobly杜比AC-3
杜比数字技术(Dolby Digital)。1994年12月27日,日本先锋公司宣布与美国的杜比实验室合作研制成功一种崭新的环绕声制式,并命名为“杜比AC-3(Dolby Surround Audio Coding-3)”。1997年初,杜比实验室已正式将杜比AC-3环绕声改称为杜比数码环绕声(Dolby Surround Digital),简称为Dolby Digital。
杜比数字是一种非常成熟的,并具备多种音频编/解码能力的尖端技术。杜比数字技术能传输单声道、立体声(两声道)、或者多达5.1声道的环绕声(分离式*多声道音频)。当然应用到了高清时代,双声道、单声道等早已经是被时代抛弃的了。我们关心的是5.1声道环绕声。
杜比数字AC-3提供的环绕声系统由五个全频域声道加一个超低音声道组成,所以被称作5.1个声道。五个声道包括前置的“左声道”、“中置声道”、“右声道”、后置的“左环绕声道”和“右环绕声道”。这些声道的频率范围均为全频域响应3-20000Hz。第六个声道也就是超低音声道包含了一些额外的低音信息,使得一些场景如爆炸、撞击声等的效果更好。由于这个声道的频率响应为3-120Hz,所以称“.1“声道。
杜比数字环绕声EX(Dolby Digital Surround EX)
杜比EX 原本是杜比实验室与卢卡斯电影公司于1998年10月共同为电影院还音系统开发成功的一种6.1声道数字环绕声制式。原来的杜比数字(Dolby Digital)只有左环绕和右环绕两个环绕声道,杜比数字环绕EX在杜比数字(Dolby Digital)基础上加入了第三个环绕声道,位置在原来左环绕和右环绕中间。环绕声效果更为显著。这样,杜比数字环绕声EX(Dolby Digital Surround EX)就具有左、中、右、左环绕、右环绕、后环绕一共6个声道,加上分离出来的低音声道,原来的5.1声道就变成6.1声道,因此,Dolby Digital Surround EX实际上是6.1声道系统。
杜比Digital EX就是在杜比5.1基础上增加了一个后置环绕,增加的我们可以认为是“后中置”,这样能完成从Audigy的5.1六声道向6.1七声道的输出升级能力。有了这个后置中央声道,我们欣赏大片时可以用身心感受后置左右声道之间的重要过渡和暗示信号,从而体会到真实的现场感,用一个词来形容就叫做身临其境。尤其是当观看影片时候从头上或者从身边开过一辆车或者飞机时候,那种呼啸而过的感觉让人十分销魂。
目前支持杜比数字EX的影片已有不少,如《飘流者》《角斗士》《星战前转》《魔戒指环王》《阿凡达》等等等等……个人觉得新格式普及得速度惊人。
杜比plus技术(Dolby Digital Plus、DD+)
杜比数字+技术是为将来的传输格式而设计的,但是与当前所有的A/V接收机完全兼容。通过杜比数字+技术,你可以得到更高品质的音频,更多的声道和更大的灵活性。杜比数字+技术会让你的耳朵感到惊叹。

杜比数字+的特点如下:

1.分离式声道输出的多声道环绕声。
2.声道数与节目数的扩展——可以处理多达7.1个声道的音频节目,并支持在一个已编码比特流中携带多个节目。
3.能够输出杜比数字比特流,在现有的杜比数字系统上播放。码率最高可达6Mbps。在HDDVD中码率至少为3Mbps,在Blu-ray光盘中码率最高为1.7Mbps。
4.精确再现导演与制作者精心设计的音效。为高端音响系统提供互动式混音与流媒体传输功能。
5.得到HDMI的支持,这是为高清晰度影音而开发的新的单线数字接口。
在杜比数字+技术中,杜比首次从编码到播放真正实现7.1声道,,因为7.1声道有双路后中置(6.1声道只有一个后置),而这双路后中置的最大作用就是为了防止听者因为没有坐在皇帝位而在听觉上产生声场的偏差。虽然DolbyProLogicIIx也能实现7.1声道的播放,但由于音频源文件并非7.1编码,必须依靠芯片经过复杂的音频函数运算,当然实现出的效果也无法与真正7.1编码的相比。

杜比TrueHD技术(Dolby TrueHD)
杜比TrueHD是下一代的音频编码技术,它可以提供纯净、无损的多声道音频。 在杜比TrueHD中拓展了元数据支持的范围,使内容制作商可以对音频播放过程进行更高级的控制,保证各种聆听环境都能有非凡的音效。
杜比TrueHD技术可以提供质朴的录音棚母带品质的声音,与原始录制的音效毫无二致。下一代的高清光盘播放机会兼容当前的A/V接收机。
不管你拥有的是采用杜比数字技术的传统的A/V接收机,还是具备HDMI接口或外置多声道线性输入的新式A/V接收机。也就是说不管是现在的高清播放机还是以后的高清播放机,这个技术都会兼容。
说完了巨头dobly以后我们开始再看一下另一有实力的存在,那就是DTS。同样大名鼎鼎的它在声音解码的探索上也写下了浓重的一笔。

DTS
DTS是“Digital Theatre System”的缩写,是“数字化影院系统”的意思。从技术上讲,DTS与包括Dolby Digital在内的其它声音处理系统是完全不同的。

拒做声盲 声音格式与编码详解

1.DTS Digital
与Dolby Digital编码格式类似,Digital Theater Sound也是一种有损音频编码技术。在电影中DTS的压缩比例通常在2.9:1到4.3:1之间。它所采用的压缩算法并不是基于人耳的听觉,而是基于数据的冗余度。由于采用了带有线形预测和自适应功能的小波编码方式,它能够非常有效地减少数据冗余度并进行压缩。

开发DTS系统的宗旨是想建立一个适用于所有影院的统一的数字音频标准,而不仅仅针对音响演示厅。它并不主张把音频数据直接保存到电影胶片上,而是试图通过其他媒介来实现更简便、更廉价、更稳定、更灵活同时具有更高音质的电影声音回放。由于DTS致力于把声音播放与电影胶片分离开来,这也成为它与其他影院声音系统最大的不同,比如它最主要的竞争对手—Dolby Digital系统。

不过如果我们仅仅讨论在家庭中观看DVD影碟的话,这两种环绕声系统之间并没有特别明显的差异,它们都需要硬件或者软件的解码器将数据分解为6个声道(5.1)。这是因为制作DVD影碟时,Dolby的音轨就不用再保存在电影胶片的边缘了。

DTS分左、中、右、左环绕、右环绕5个声道,加上低音声道组成5.1声道,这一点和杜比数字相同。但DTS在DVD中标准的数据流量为1536kbps(又叫全码DTS,以前在HDTV中我们还能看到很多768kbps的半码DTS),而Dolby Digital的数据流量是384Kbps~448Kbps,最高可提升到640Kbps,显然相比之下DTS具体更高的数据流量,也就具有更低的数字压缩比。数据压缩比越低,占用的记录空间越大,但其重放音质就有可能越好,加之DTS采取高比特、高取样率等措施,使之对原音重现的追求上就更进了一步,因此DTS被很多人认为比Dolby Digital具体更好的效果。

2.DTS ES
DTS-es称为“扩展环绕声”,分为DTS-es分离6.1及矩阵6.1两种,DTS-es 是DTS5.1声道的增强版。当DTS-es分离6.1解码时,解码器将DTS信号的核心部分与扩展部分作为一个整体考虑,利用算术减法可恢复出环绕左/右声道,环绕中置(又称背环绕中置)是直接解码而得,因此可产生完全分离的6.1声场。而矩阵6.1解码时只考虑信号的核心部分,忽略了扩展部分,但由于采用了DTS的专利后处理es矩阵模块,仍然能产生6.1“扩展环绕”声场。从这里可以看出,es的两种解码方式是有差异的。
增强的更逼真的家庭影院体验。由7个独立的声道组成的环绕声系统,在原有5.1环绕声的音箱位置,增加了一个后中置的声道,形成了新的6.1声道系统,让人们体会到更真实,更丰富的现场感。但是他也只是DTS5.1声道的增强版,使用一个额外的背环绕中置扬声器来实现6.1回放。DTS是世界上唯一能为家庭影院提供独立6.1扩展环绕技术的公司。

3.DTS -HD
DTS在ES 6.1声道之后推出过更多声道的DTS+格式,这个DTS-HD就是DTS++的正式注册商标名称。
这些特性是依靠码率较低的DTS HD格式来实现的,因为网络对速度的要求限制了传输数据流的带宽,不过DTS HD的数据流量完全可以根据使用者所需要的声音品质来做出灵活的变换,并且通过DTS公司新开发的无损压缩技术,让DTS HD的压缩比与Dolby Digital Plus相比要少,因而损失的细节更少,从而达到了品质更高的声音传送。 DTS HD(在一些蓝光光盘及HD-DVD文件中仍称为DTS++)已入选高清DVD(HD-DVD)以及蓝光DVD(Blu-ray)两种标准格式的音频备选方案。
DTS-HD能编码和解码的DTS格式有三种:DTS-HD主体音频(Master Audio),DTS-HD高分辨率音频(High Resolution Audio)和DTS数字环绕声(Digital Surround)。可以对付各式各样的最新娱乐要求。DTS-HD 7.1声道是在传统的5.1声道上增加了二个附加声道。就这二个声道就能使新系统的环绕声效果远远高过传统环绕声。
说了这么多其实相对于Dobly和DTS来说,抛去大家的偏爱的话,其实实际的效果在我们人类的接受范围内能够分辨的差异非常小。因此不影响大家的选购。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: