Android Audio System线性音量和对数音量的转换

发表评论

A+

Android的音频系统的代码中，应用程序对每个音频流的音量做出调整后，最终会转换为一个系数K，所有的音频数据在输出到硬件之前，都要乘以系数K，只要应用程序发出调整音量的调用，中间层的Audio System就会重新计算系数K的值。对应用程序来说，音量控制通常都是按照线性进行调整的，比如对于具有15级音量的音频流来说，我们预期每级的音量变化都是相当的，也就是说：从第5级调到第6级，和从第7级调到第8级，我们期望人耳可以感觉到同样大小的音量变化。但是，在Android的代码中，我们看到了计算系数K的公式，它相当奇怪，代码位于frameworks/base/media/libmedia/audiosystem.cpp中：

/*****************************************************************************************************/
声明：本博内容均由http://blog.csdn.net/droidphone原创，转载请注明出处，谢谢！
/*****************************************************************************************************/

[cpp] view plain copy

// convert volume steps to natural log scale
// change this value to change volume scaling
static const float dBPerStep = 0.50f;
// shouldn't need to touch these
static const float dBConvert = -dBPerStep * 2.302585093f / 20.0f;
static const float dBConvertInverse = 1.0f / dBConvert;
float AudioSystem::linearToLog(int volume)
{
// float v = volume ? exp(float(100 - volume) * dBConvert) : 0;
// LOGD("linearToLog(%d)=%f", volume, v);
// return v;
return volume ? exp(float(100 - volume) * dBConvert) : 0;
}
int AudioSystem::logToLinear(float volume)
{
// int v = volume ? 100 - int(dBConvertInverse * log(volume) + 0.5) : 0;
// LOGD("logTolinear(%d)=%f", v, volume);
// return v;
return volume ? 100 - int(dBConvertInverse * log(volume) + 0.5) : 0;
}

要理解上面代码中的公式，我们先要了解人耳的声心理学模型。根据人耳的声心理学的研究，人耳对声音大小的感知程度并不是线性的，而是呈对数关系。对数形式的单位是dB，在音频领域，通常我们会定义一个标准电平V0，那么电平X的转换公式是：

dB=20log(X/V0)；

例如：我们给喇叭输出满负荷最大音量时的电平是1V，如果有15级音量，如果按线性进行调整，1/15 = 66.6mV，我们就得到每级音量的调整量是：

66.6mV，133.2mV，200mV，......，866.8mV，933.4mV，1000mV；

如果按照这个步长进行调整，人耳感觉到的音量变化就不是连续的。

另一种方式是按对数进行调整，在数字音频领域，通常0dB代表最大音量，0dB意味着不对数据进行任何的变换处理，输出等于输入，所以20log(V0/V0)=20log(1)=0dB。这意味着最大音量以下的dB值为一个负数，现在我们把1V认为是0dB，最低音量是-28dB，那么对应15级音量的dB值就是：

-28dB，-26dB，-24dB，......，-4dB，-2dB，0dB；

对应的电平值是（使用公式Vx=10^(dB/20)*V0 ）：

39mV，50mV，63mV，......，630mV，794mV，1000mV；

Android Audio System线性音量和对数音量的转换

线性音量和对数音量的调整曲线

回到Android的代码中，它也使用了对数的调节方式，它先是定义了每次调节音量的步长值为0.5dB：

static const float dBPerStep = 0.50f;

然后他定义了一个计算用的中间常数：

static const float dBConvert = -dBPerStep * 2.302585093f / 20.0f;

这个一开始有点难于理解，尤其是奇怪的系数：2.302585093。所有这些定义都是为了得到用于与音频数据相乘的系数K，Android中有多种音频流，每种音频流的默认音量调节步数都不一样，有的是7步，有的是5步，有的是15步，为了便于计算的统一，计算前都会先把相应的步数映射为0-100步之间，因为步长已经定义为0.5dB，所以各级音量对应的dB数如下：

音量级别	0	1	2	3	......	97	98	99	100
dB数	mute	-49.5dB	-49dB	-48.5dB	......	-1.5dB	1.0dB	0.5dB	0dB

很显然，知道了音量为哪个步数级别后，相应的dB值也会知道，那么我们要做的就是把dB值转换为系数K值，K值实际上就是公式dB=20log(X/V0)中的比值：X/V0，根据此公式反推，音量级别为volume对应的K值：

(1) dB = -dBPerStep * ( 100 - volume )；

又因为：

(2) dB/20 = log(Vx/V0) = log(K);

把（1）式代入（2）式：

(3) -dBPerStep * ( 100 - volume ) / 20 = log(K)；

为了得到K，两边取以10为底的指数：

(4) 10 ^ ( -dBPerStep * ( 100 - volume ) / 20 ) = 10 ^ ( log(K) )；

(5) K = 10 ^ ( log(K) ) = 10 ^ ( -dBPerStep * ( 100 - volume ) / 20 ) ;

(6) K = 10 ^ ( dBConvert * ( 100 - volume ) ) ; // 令：dBConvert = -dBPerStep / 20；

使用（6）式即可得到系数K，需要计算以10为底的幂，可是这与Android使用的计算公式有些差异，Andrioid使用的公式是：