Android 音视频技术之录音获取实时音量

时间:2023-01-26 18:47:09

一、实时音量相关基础知识

说到获取音量,大家首先想到的应该就是分贝(dB),分贝是一个相对单位(是一个比值,是一个数值,是一个纯计数方法)。

在音频领域dB度量的是声音的强度,其计算的公式如下:

Android 音视频技术之录音获取实时音量

在上面的公式中,分子是测量值的声压,分母是参考值的声压(20微帕,人类所能听到的最小声压)。

 

在Android设备传感器中,我们能获取到的物理值是振幅值,一般使用下面的公式来计算分贝值:

Android 音视频技术之录音获取实时音量

 

我们从Android SDK中读取了某段音频数据的振幅后,取最大振幅或平均振幅(可以用平方和平均,或绝对值的和平均),代入上述公式的A1。参考的振幅A0取值定为1(这里取1是为了实现方便,如需更加精确建议拿一个标准分贝计做校准参考),作为 Android 麦克风能听到的最小的声音振幅。这样我们就可以计算出分贝值了。

二、Android 获取实时音量

获取音量之前,我们必须先在AndroidManifest.xml文件里面申请相应的权限:

<uses-permission android:name="android.permission.RECORD_AUDIO" />

在Android SDK提供的API中,我们能获取到音频方式有两个:android.media.MediaRecorderandroid.media.AudioRecord

1. MediaRecorder

MediaRecorder 是用来录制一段完整的音视频并写入到文件系统中的API。通过它,我们能很简单的通过它的无参方法getMaxAmplitude来获取一小段时间内音频源数据中的最大振幅,此方法是很多录音软件计算音量等级所采用的办法。(注:因为是取最大值,所以存在受到极端数据的影响而导致计算的分贝波动值较大的问题)。

使用MediaRecorder.getMaxAmplitude返回的是0到32767范围的16位整型。如果设置参考振幅为1的话,那么计算出来的分贝值域的正常范围应该为 0dB90.3dB

核心代码:

    /**
     * 开始录音 使用amr格式
     */
    public void startRecord() {
        // 开始录音
        /* ①Initial:实例化MediaRecorder对象 */
        if (mMediaRecorder == null)
            mMediaRecorder = new MediaRecorder();
        try {
            /* ②setAudioSource/setVedioSource */
            mMediaRecorder.setAudioSource(MediaRecorder.AudioSource.MIC);// 设置麦克风
            /* ②设置音频文件的编码:AAC/AMR_NB/AMR_MB/Default 声音的(波形)的采样 */
            mMediaRecorder.setOutputFormat(MediaRecorder.OutputFormat.DEFAULT);
            /*
             * ②设置输出文件的格式:THREE_GPP/MPEG-4/RAW_AMR/Default THREE_GPP(3gp格式
             * ,H263视频/ARM音频编码)、MPEG-4、RAW_AMR(只支持音频且音频编码要求为AMR_NB)
             */
            mMediaRecorder.setAudioEncoder(MediaRecorder.AudioEncoder.AMR_NB);
            /* ③准备 */
            mMediaRecorder.setOutputFile(Environment.getExternalStorageDirectory().getPath()   File.separator   "111.amr");
            mMediaRecorder.setMaxDuration(MAX_LENGTH);
            mMediaRecorder.prepare();
            /* ④开始 */
            mMediaRecorder.start();
            updateMicStatus();
        } catch (IllegalStateException | IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 停止录音
     */
    private void stopRecord() {
        if (mMediaRecorder == null) {
            return;
        }
        mMediaRecorder.stop();
        mMediaRecorder.reset();
        mMediaRecorder.release();
        mMediaRecorder = null;
    }

 

2. AudioRecord

此API相对MediaRecorder来说更偏底层一点,我们可以使用AudioRecord获得具体的音频数据。

音源数据通过read(byte[] audioData, int offsetInBytes, int sizeInBytes)方法从缓冲区读取到我们传入的字节数组audioData后,我们便可以对其进行操作,如求平方和或绝对值的平均值。这样可以避免个别极端值的影响,使计算的结果更加稳定。求得平均值之后,如果是平方和则代入常数系数为10的公式中,如果是绝对值的则代入常数系数为20的公式中,算出分贝值。

核心代码:

public void getNoiseLevel() {

    mAudioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC, SAMPLE_RATE_IN_HZ,
            AudioFormat.CHANNEL_IN_DEFAULT, AudioFormat.ENCODING_PCM_16BIT, BUFFER_SIZE);

    new Thread(new Runnable() {
        @Override
        public void run() {
            mAudioRecord.startRecording();
            short[] buffer = new short[BUFFER_SIZE];
            while (isGetVoiceRun) {
                //r是实际读取的数据长度,一般而言r会小于buffersize
                int r = mAudioRecord.read(buffer, 0, BUFFER_SIZE);
                long v = 0;
                // 将 buffer 内容取出,进行平方和运算
                for (short value : buffer) {
                    v  = value * value;
                }
                // 平方和除以数据总长度,得到音量大小。
                double mean = v / (double) r;
                double volume = 10 * Math.log10(mean);
                Log.d(TAG, "分贝值 = "   volume   "dB");
                synchronized (mLock) {
                    try {
                        mLock.wait(100); // 一秒十次
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                }
            }
            mAudioRecord.stop();
            mAudioRecord.release();
            mAudioRecord = null;
        }
    }).start();
}

 

github地址:https://github.com/renhui/RHAudioVolume/tree/master