vad函数matlab代码-audio_segmentation:audio_segmentation

时间:2024-06-09 07:31:28
【文件属性】:

文件名称:vad函数matlab代码-audio_segmentation:audio_segmentation

文件大小:768KB

文件格式:ZIP

更新时间:2024-06-09 07:31:28

系统开源

vad函数matlab代码audio_segmentation 此存储库中有三种不同的细分方法。 Microsoft Azure细分 Microsoft Azure分段使用Microsoft Azure转录过程的输出,其中包括每个转录文本字符串的“偏移”和“持续时间”。 这用于生成段.wav文件和单词计时.npy文件。 注意:此分段将导致较短的段紧紧的单词边界。 不会有只有非语言表达(例如笑声或叹气)的片段。 组合式广告 ComboSAD算法。 原始代码:/nfs/turbo/McInnisLab/gideonjn/SegmentationScript/extractComboSAD.py John Gideon Paper :(纸张中列出的设置最小为700 ms静音) John Gideon :(电子邮件2021-01-22)我最终使用带注释的评估调用子集验证了ComboSAD算法。 #更新/问题: 转换为python3(将LPC函数更新为librosa) 添加了输入检查 分割沉默而不是语音有时会引起问题*** LPC函数抛出“数值错误,输入病态?” 对于一些音频 最大语音输入参数用


网友评论