tartarus:音频和文字的深度学习

时间:2024-05-22 21:04:27
【文件属性】:

文件名称:tartarus:音频和文字的深度学习

文件大小:9.05MB

文件格式:ZIP

更新时间:2024-05-22 21:04:27

Python

塔塔鲁斯 Tartarus是用于音频和文本及其组合的深度学习实验的python模块。 它适用于多类和多标签分类,以及使用矩阵分解技术的推荐。 在本文档中,描述了3个实验。 测试实验以了解执行管道(SUPER数据集) 推荐实验 多标签分类实验 要求:该库可与Keras深度学习框架和Theano后端配合使用。 要使用音频,您还需要librosa音频库。 有一个Requirement.txt文件,其中包含所有运行库的要求。 安装Keras后,您必须在主目录的.keras / keras.json配置文件中设置Theano后端并进行排序: “ image_data_format”:“ channels_first”“ backend”:“ theano” 如果要使用Tensorflow,则必须在src / models.py中的卷积中更改顺序。 要使用此库,您需要创建一个文件夹结构,


【文件预览】:
tartarus-master
----dummy-data()
--------text()
--------index()
--------splits()
--------audio()
----LICENSE.txt(1KB)
----src()
--------run_experiments.py(39KB)
--------load.py(6KB)
--------train.py(27KB)
--------text-processing()
--------audio-processing()
--------scripts()
--------predict.py(21KB)
--------models.py(32KB)
--------eval.py(19KB)
--------common.py(3KB)
----requirements.txt(701B)
----README.md(8KB)
----.gitignore(255B)

网友评论