GSM话音编码技术详述

  • A+
所属分类:音频杂谈

由于GSM系统是一种数字通信系统,话音或其它信号都要进行数字化处理,因而第一步要把话音模拟信号转换成数字信号(即1和0的组合)。如我们熟悉的我国固定电话系统采用的PCM-A律编码,它是采用A律波形编码,分为3步:

 

 

 

采样:在某个短时间间隔内测量模拟信号的值。采样速率8kHz/s。

 

 

 

量化:对每个样值用8个比特的量化值来表示对应的模拟信号瞬间值,即为样值指配256(28)个不同电平值中的一个。

 

 

 

编码:每个量化值用8个比特的二进制代码表示,组成一串具有离散特性的数字信号流。

 

 

 

使用这种编码方式,数字链路上的数字信号比特速率为64kbit/s(8kbit/s×8)。如果GSM系统也采用此种方式进行话音编码,那么每个话音信道是64kbit/s,8个话音信道就是512kbit/s。考虑实际可使用的带宽,GSM规范中规定载频间隔是200kHz。因此要把它们保持在规定的带宽内,必需大大地降低每个话音信道的编码的比特率,这就要靠采用低速率话音编码技术来实现。

 

 

 

为了满足GSM系统的窄带通信模式,GSM采用三种话音编码技术,即:

 

速率为13k的全速率(FR)编码技术:规则脉冲激励线性预测编码技术(RPE-LPT)。

 

速率为12.2k的增强型全速率(EFR)编码技术:代数码激励线性预测编码技术(ACELPT)。

 

速率为6.5k的半速率(HR)矢量和激励线性预测编码技术编码方式(VSELP)。

 

 

 

下面以最常用的规则脉冲激励线性预测编码技术(RPE-LTP)为例来了解GSM的语音编码技术。

 

 

图1 RPE-LTP编码结构图

 

 

 

见图1,规则脉冲激励线性预测编码技术是一种混合编码技术,它集成了波形编码与声源编码两项技术之长。波形编码器可精确地再现原来的话音波形,话音质量较高,但要求的比特速率相应的较高,在12-16Kbit/s的范围内会造成话音质量恶化,波形编码器硬件上更容易实现,不受时延影响。声源编码是将话音信息用特定的声源模型表示。声码器编码可以是很低的速率(可以低于5kbit/s,虽然不影响话音的可懂性,但话音质量听起来不自然,很难分辨是谁在讲话。因此GSM系统话音编码器是采用声码器和波形编码器的混合物--- 混合编码器,全称为线性预测编码-长期预测编码-规则脉冲激励编码器(LPC-LTP-RPE编码器),见图1所示。LPC+LTP为声码器,RPE为波形编码器,再通过复用器混合完成模拟话音信号的数字编码,每话音信道的编码速率为13kbit/s。

 

 

 

声码器的原理是模仿人类发音器官喉、嘴、舌的组合,将该组合看作一个滤波器,人发出的声音使声带振动就成为激励脉冲。当然“滤波器 脉冲m频率是在不断地变换,但在很短的时间(10ms~30ms)内观察它,则发音器官是没有变换的,因此声码器要做的事是将话音信号分成20ms的声码块,然后分析这一时间段内所相应的滤波器的参数,并提取此时的脉冲串频率,输出其激励脉冲序列。相关的话音段是十分相似的,LTP将当前段与前一段进行比较,相应的差值被低通滤波后进行一种波形编码。故:LPC十LTP参数:3.6 kbit/s;RPE参数:9.4kbit/s;因此,话音编码器的输出比特速率是13kbit。

标签:  

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: