Kurdish-Language:NLP在库尔德语中的应用

时间:2024-05-19 22:18:26
【文件属性】:

文件名称:Kurdish-Language:NLP在库尔德语中的应用

文件大小:117.66MB

文件格式:ZIP

更新时间:2024-05-19 22:18:26

nlp speech-recognition kurdish HTML

库尔德语 此仓库将尝试在库尔德语上尝试不同的NLP技术 主要的挑战是关于这种语言只有两个或三个官方数据集。 当前的工作集中在语音识别任务上。 短期计划 文字预处理 音频预处理 为该任务训练一个简单的RNN 长期目标 建立端到端的ASR管道 使用语言模型 管道 获取原始的.sph文件 转换.sph到.wav格式 将.wav转换为pcm-16 wav 将音频和脚本转换为JSON表示形式的 将数据分为训练和验证语料库


【文件预览】:
Kurdish-Language-master
----language-modeling()
--------img()
--------language_grapher.ipynb(6KB)
--------requirements.txt(7B)
--------README.md(307B)
----speech-recognition()
--------train_utils.py(3KB)
--------utils.py(5KB)
--------char_map.py(497B)
--------sample_models.py(7KB)
--------data_engineering.ipynb(5KB)
--------data_generator.py(13KB)
--------README.md(3KB)
--------utils()
--------kurdish_dnn_speech_recognizer_training.ipynb(296KB)
----index.html(1.61MB)
----.gitignore(36B)
----embedding()
--------tensorboard-data()
----README.md(787B)
----visualizations()
--------tsne.gif(6.93MB)
--------query.gif(5.13MB)
--------start.gif(1.41MB)
----utils()
--------text8.txt(26.7MB)
--------dump_to_words_processor.ipynb(41KB)
--------text8ku.txt(16.88MB)
----favicon.ico(1KB)

网友评论