文件名称:voxceleb_enrichment_age_gender:在Interspeech 2021上提交的论文“ VoxCeleb丰富的年龄和性别识别”的代码和数据存储库
文件大小:63.95MB
文件格式:ZIP
更新时间:2024-04-23 22:22:30
machine-learning deep-learning sound gender-recognition age-prediction
VoxCeleb丰富了年龄和性别 该存储库包含与论文“有关年龄和性别识别的VoxCeleb丰富化”相关的所有材料,该论文已提交在2021年国际交流大会上发表。对于那些对下载数据感兴趣的人,可以下载 csv文件。 抽象的 VoxCeleb数据集广泛用于说话人识别研究中。 我们的工作有两个目的。 首先,我们提供说话者年龄标签和(可选)说话者性别注释。 其次,我们通过构建具有不同特征和分类器的年龄和性别识别模型来演示此元数据的使用。 我们查询不同的名人数据库,并应用共识规则得出年龄和性别标签。 我们还将原始的VoxCeleb性别标签与我们的标签进行比较,以识别在原始VoxCeleb数据中可能被误贴的记录。 在建模方面,使用带有岭回归的i-vector特征获得了年龄回归中最低的平均绝对误差(MAE),为9.443年。 这表明从狂野风格的语音数据估计年龄会面临挑战。 作者 回购结构 该存储库