一、数字音频基础知识
Fourier级数:
任何周期的波形可以分解成多个正弦波,这些正弦波的频率都是整数倍。级数中其他正线波的频率是基础频率的整数倍。基础频率称为一级谐波。
PCM:
pulse code modulation,脉冲编码调制,即对波形按照固定周期频率采样。为了保证采样后数据质量,采样频率必须是样本声音最高频率的两倍,这就是Nyquist频率。
样本大小:采样后用于存储振幅级的位数,实际就是脉冲编码的阶梯数,位数越大表明精度越高,这一点学过数字逻辑电路的应该清楚。
声音强度:
波形振幅的平方。两个声音强度上的差常以分贝(db)为单位来度量,
计算公式如下:
20*log(A1/A2)分贝。A1,A2为两个声音的振幅。如果采样大小为8位,则采样的动态范围为20*log(256)分贝=48db。如果样本大小为16位,则采样动态范围为20*log(65536)大约是96分贝,接近了人听觉极限和痛苦极限,是再线音乐的理想范围。windows同时支持8位和16位的采样大小。
二、相关API函数,结构,消息
对于录音设备来说,windows 提供了一组wave***的函数,比较重要的有以下几个:
打开录音设备函数
1.
MMRESULT waveInOpen(
2.
LPHWAVEIN phwi,
//输入设备句柄
3.
UINT
uDeviceID,
//输入设备ID
4.
LPWAVEFORMATEX pwfx,
//录音格式指针
5.
DWORD
dwCallback,
//处理MM_WIM_***消息的回调函数或窗口句柄,线程ID
6.
DWORD
dwCallbackInstance,
7.
DWORD
fdwOpen
//处理消息方式的符号位
8.
);
为录音设备准备缓存函数
1.
MMRESULT waveInPrepareHeader( HWAVEIN hwi, LPWAVEHDR pwh,
UINT
bwh );
给输入设备增加一个缓存
1.
MMRESULT waveInAddBuffer( HWAVEIN hwi, LPWAVEHDR pwh,
UINT
cbwh );
开始录音
1.
MMRESULT waveInStart( HWAVEIN hwi );
清除缓存
1.
MMRESULT waveInUnprepareHeader( HWAVEIN hwi,LPWAVEHDR pwh,
UINT
cbwh);
停止录音
1.
MMRESULT waveInReset( HWAVEIN hwi );
关闭录音设备
1.
MMRESULT waveInClose( HWAVEIN hwi );
Wave_audio数据格式
01.
typedef
struct
{
02.
WORD
wFormatTag;
//数据格式,一般为WAVE_FORMAT_PCM即脉冲编码
03.
WORD
nChannels;
//声道
04.
DWORD
nSamplesPerSec;
//采样频率
05.
DWORD
nAvgBytesPerSec;
//每秒数据量
06.
WORD
nBlockAlign;
07.
WORD
wBitsPerSample;
//样本大小
08.
WORD
cbSize;
09.
} WAVEFORMATEX;
waveform-audio 缓存格式
01.
typedef
struct
{
02.
LPSTR
lpData;
//内存指针
03.
DWORD
dwBufferLength;
//长度
04.
DWORD
dwBytesRecorded;
//已录音的字节长度
05.
DWORD
dwUser;
06.
DWORD
dwFlags;
07.
DWORD
dwLoops;
//循环次数
08.
struct
wavehdr_tag * lpNext;
09.
DWORD
reserved;
10.
} WAVEHDR;
相关消息
1.
MM_WIM_OPEN:打开设备时消息,在此期间我们可以进行一些初始化工作
2.
MM_WIM_DATA:当缓存已满或者停止录音时的消息,处理这个消息可以对缓存进行重新分配,实现不限长度录音
3.
MM_WIM_CLOSE:关闭录音设备时的消息。
相对于录音来说,回放就简单的多了,用到的函数主要有以下几个:
打开回放设备
1.
MMRESULT waveOutOpen(
2.
LPHWAVEOUT phwo,
3.
UINT
uDeviceID,
4.
LPWAVEFORMATEX pwfx,
5.
DWORD
dwCallback,
6.
DWORD
dwCallbackInstance,
7.
DWORD
fdwOpen
8.
);
为回放设备准备内存块
1.
MMRESULT waveOutPrepareHeader(
2.
HWAVEOUT hwo,
3.
LPWAVEHDR pwh,
4.
UINT
cbwh
5.
);
写数据(放音)
1.
MMRESULT waveOutWrite(
2.
HWAVEOUT hwo,
3.
LPWAVEHDR pwh,
4.
UINT
cbwh
5.
);
相应的也有三个消息,用法跟录音的类似:
三、程序设计
一个录音程序的简单流程:
打开录音设备waveInOpen===>准备wave数据头waveInPrepareHeader===>
准备数据块waveInAddBuffer===>开始录音waveInStart===>停止录音(waveInReset) ===>
关闭录音设备(waveInClose)
当开始录音后当buffer已满时,将收到MM_WIM_DATA消息,处理该消息可以保存已录好数据。
回放程序比这个要简单的多:
打开回放设备waveOutOpen===>准备wave数据头waveOutPrepareHeader===>写wave数据waveOutWrite===>停止放音(waveOutRest) ===>关闭回放设备(waveOutClose)
如何处理MM消息:
MSDN告诉我们主要有 CALLBACK_FUNCTION、CALL_BACKTHREAD、CALLBACK_WINDOW 三种方式,常用的是
Thread,window方式。
线程模式
waveInOpen(&hWaveIn,WAVE_MAPPER,&waveform,m_ThreadID,NULL,CALLBACK_THREAD),我们可以继承MFC的CwinThread类,只要相应的处理线程消息即可。
MFC线程消息的宏为:
1.
ON_THREAD_MESSAGE,
可以这样添加消息映射:
1.
ON_THREAD_MESSAGE(MM_WIM_CLOSE, OnMM_WIM_CLOSE)
窗口模式
类似于线程模式,参见源程序即可。