如何使用自己的数据集-cryptography and network security principles and practice edition(6th) 无水印原版pdf

时间:2024-06-30 16:12:40
【文件属性】:

文件名称:如何使用自己的数据集-cryptography and network security principles and practice edition(6th) 无水印原版pdf

文件大小:2.93MB

文件格式:PDF

更新时间:2024-06-30 16:12:40

kaldi

3.8 可以使用的公开数据库 首先感谢 povey 和他的同事的贡献,现在在英文数据集下已经有很多的数据 了,期待某天中文数据集可以这么开源。下面分别说下可以下的数据集 librispeech:大约为 1000 小时的英文数据,可以在 http://www.openslr.org/12/下载。 此外,还有其他的一些数据都可以在这个网站上下载: http://www.openslr.org/resources.php 当然,在这提醒大家的时候,如果自己没有足够的资源,比如内存或者 gpu 或者服务器,最好还是别去尝试这些数据。毕竟这些耗费的硬件也很多。作为学 生或者初学者,建议使用 timit 等一些小数据的数据。 这里还分享一个重要的资料就是: http://www.kaldi-asr.org/downloads/tree/trunk/ 这里有很多经过 kaldi 跑出来的结果,如果没有这些数据的话可以下载来看 看,也是一个非常好的资料。具体的大家可以去官网资料。 3.9 如何使用自己的数据集 这里暂时这么说下这个问题。以来最近遇到几个问这个问题的。拿到一个新 的数据集,对于 kaldi 来说, 第一步要做的就是数据准备阶段,这个具体可以看下后面翻译中《数据准备》 这部分的内容,看如何去准备和怎么去准备,这里可能需要自己写些脚本。


网友评论