文件名称:nlp_preprocessing:NLP预处理脚本
文件大小:759KB
文件格式:ZIP
更新时间:2024-05-19 17:07:17
Shell
预处理实用程序 此存储库包含用于(韩语)NLP预处理的python脚本。 而且,它包含用于构建并行语料库的对齐器。 用法
【文件预览】:
nlp_preprocessing-master
----.gitignore(6B)
----word_mt.py(3KB)
----regex.txt(595B)
----data()
--------enko.dict(1.69MB)
--------enko.prev.dict(432KB)
----setup.WSL.sh(1KB)
----combine_line.py(428B)
----run_preprocessing_clien.sh(1KB)
----detokenizer.py(424B)
----tokenizer.py(349B)
----run_all_ted.sh(231KB)
----align.py(2KB)
----refine.py(823B)
----line_separator.py(393B)
----README.md(155B)
----post_tokenize.py(1016B)
----run_preprocessing.sh(3KB)
----run_all_news.py(1KB)
----align.ted.sh(767B)
----build_dict.sh(2KB)