使用 Python 的 sounddevice 包录制系统声音

时间:2023-03-10 05:05:34
使用 Python 的 sounddevice 包录制系统声音

博客中的文章均为meelo原创,请务必以链接形式注明本文地址

sounddevice是一个与Numpy兼容的录音以及播放声音的包。

安装sounddevice包


直接通过pip就能安装。

pip install sounddevice

播放音乐


首先,用numpy生成440Hz的正弦波

import numpy as np
fs = 44100 # Hz
f = 440 # Hz
length = 5 #s
myarray = np.arange(fs * length)
myarray = np.sin(2 * np.pi * f / fs * myarray)

用sounddevice包播放音乐非常简单。调用play函数来播放声音,需要传入需要播放声音的波形,和采样率。

import sounddevice as sd
sd.play(myarray, fs)

查看声音设备


计算机上可能有多个声音播放/录制设备,sounddevice会默认使用系统默认的设备。调用query_devices()函数会显示系统所有的声音设备。

sd.query_devices()

下面是我计算机上的声音设备,>标示为默认输入设备,<表示默认的输出设备,声音设备名称之前是序号。默认的设备也可以通过sd.default.device查看,返回的是一个列表,有两个元素。第一个元素为默认的输入设备,第二个元素为默认的输出设备,设备是用序号来表示的。

   0 Microsoft 声音映射器 - Input, MME (2 in, 0 out)
> 1 立体声混音 (Realtek High Defini, MME (2 in, 0 out)
2 麦克风 (Realtek High Definition, MME (2 in, 0 out)
3 Microsoft 声音映射器 - Output, MME (0 in, 2 out)
< 4 扬声器 (Realtek High Definition, MME (0 in, 2 out)
5 主声音捕获驱动程序, Windows DirectSound (2 in, 0 out)
6 立体声混音 (Realtek High Definition Audio), Windows DirectSound (2 in, 0 out)
7 麦克风 (Realtek High Definition Audio), Windows DirectSound (2 in, 0 out)
8 主声音驱动程序, Windows DirectSound (0 in, 2 out)
9 扬声器 (Realtek High Definition Audio), Windows DirectSound (0 in, 2 out)
10 扬声器 (Realtek High Definition Audio), Windows WASAPI (0 in, 2 out)
11 立体声混音 (Realtek High Definition Audio), Windows WASAPI (2 in, 0 out)
12 麦克风 (Realtek High Definition Audio), Windows WASAPI (2 in, 0 out)
13 Speakers (Realtek HD Audio output), Windows WDM-KS (0 in, 6 out)
14 立体声混音 (Realtek HD Audio Stereo input), Windows WDM-KS (2 in, 0 out)
15 麦克风 (Realtek HD Audio Mic input), Windows WDM-KS (2 in, 0 out)
16 线路输入 (Realtek HD Audio Line input), Windows WDM-KS (2 in, 0 out)

修改默认的输入设备为系统输出声音


系统默认的声音输入设备是麦克风,如果需要录制系统声音则需要将声音设备切换成立体声混音。有可能不存在立体声混音这个选项,这时你需要升级你的声卡驱动更新为比2013-5-10发布的6.0.10.1900更高的版本。

通过上面运行sd.query_devices()可以看到,我的计算机立体声混音设备序号为1。因此我需要设置:

sd.default.device[0] = 1

录制系统声音


录音和声音播放一样简单,这时你需要调用rec函数,传入需要录音的时长(采样的点数),同时设置blocking=True表示录音完成再返回,最后设置channels=1表示只录制一个声道。

fs = 44100 # Hz
length = 5 # s
recording = sd.rec(frames=fs * length, samplerate=fs, blocking=True, channels=1)

最后使用scipy.io将音频保存为文件。

from scipy.io import wavfile
wavfile.write('recording.wav', fs, recording)