AVSpeech – 视听语音数据集.torrent

时间:2023-07-11 09:54:35
【文件属性】:

文件名称:AVSpeech – 视听语音数据集.torrent

文件大小:8.48MB

文件格式:TORRENT

更新时间:2023-07-11 09:54:35

语音识别

AVSpeech是一个新的,大规模的视听数据集,包括语音视频剪辑没有干扰的背景噪声。视频片段长3-10秒,每个片段中可听到的声音都属于一个说话的人,在视频中可以看到。总的来说,这个数据集包含了大约4700个小时的视频片段,来自于YouTube上总共290k个视频,涵盖了各种人、语言和面部姿势。


网友评论