文件名称:AVSpeech – 视听语音数据集.torrent
文件大小:8.48MB
文件格式:TORRENT
更新时间:2023-07-11 09:54:35
语音识别
AVSpeech是一个新的,大规模的视听数据集,包括语音视频剪辑没有干扰的背景噪声。视频片段长3-10秒,每个片段中可听到的声音都属于一个说话的人,在视频中可以看到。总的来说,这个数据集包含了大约4700个小时的视频片段,来自于YouTube上总共290k个视频,涵盖了各种人、语言和面部姿势。
文件名称:AVSpeech – 视听语音数据集.torrent
文件大小:8.48MB
文件格式:TORRENT
更新时间:2023-07-11 09:54:35
语音识别
AVSpeech是一个新的,大规模的视听数据集,包括语音视频剪辑没有干扰的背景噪声。视频片段长3-10秒,每个片段中可听到的声音都属于一个说话的人,在视频中可以看到。总的来说,这个数据集包含了大约4700个小时的视频片段,来自于YouTube上总共290k个视频,涵盖了各种人、语言和面部姿势。