文件名称:Tensorflow_Speech_Recognition
文件大小:12.16MB
文件格式:ZIP
更新时间:2024-04-25 15:31:13
JupyterNotebook
TENSORFLOW语音识别挑战以声音信号的形式表示声音,该声音信号具有诸如频率,带宽,分贝等参数。典型的声音信号可以表示为幅度和时间的函数。 对音频信号进行采样采样是指将连续时间信号转换为离散时间信号的过程。 采样频率/采样率是每秒的平均采样数。 f_S = 1 / T我们还将使用频谱图表示音频信号。 频谱图是一种直观地表示特定音频信号的波形中可用的不同频率下信号强度随时间变化的方式。 读取频谱图频谱图是二维图,其中第三维表示为色条。 时间沿X轴表示,垂直轴表示声波的音高。 幅度以三维表示(深色阴影对应于低幅度,而浅阴影对应于较低幅度的信号。) 在我们的项目中,当处理“零”声音的音频信号时,获得了以下频谱图。 对于python中的音频分析,我们使用了librosa软件包。 Librosa提供了用于检索声波的构建基块Librosa版本:0.8.0 Librosa函数用于以下目的。
【文件预览】:
Tensorflow_Speech_Recognition-main
----ReadMe File.docx(299KB)
----best_model.hdf5(6.19MB)
----Task-1.ipynb(756KB)
----README.md(4KB)
----Speech_Classsification_CNN.h5(6.19MB)