最近使用Python调用百度的REST API实现语音识别,但是百度要求音频文件的压缩方式只能是pcm(不压缩)、wav、opus、speex、amr,这里面也就wav还常见一点,但是一般设备录音得到的文件都是mp3,这就要把mp3转换为wav,由于python的效率并不高,很多实现都是使用C++或者Java,不过GitHub上有一个项目pydub(https://github.com/jiaaro/pydub/tree/master/pydub)可以暂时解决问题。
安装pydub
直接执行以下命令即可
1
|
pip install pydub
|
环境依赖
1
|
sudo apt - get install ffmpeg
|
mp3转换为wav
1
2
3
|
from pydub import AudioSegment
sound = AudioSegment.from_mp3( "/path/to/file.mp3" )
sound.export( "/output/path" , format = "wav" )
|
以上这篇Python 利用pydub库操作音频文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/wr132/article/details/59133085