parallel_corpus_crawler:机器翻译的平行语料库抓取工具

时间:2021-05-03 02:34:26
【文件属性】:
文件名称:parallel_corpus_crawler:机器翻译的平行语料库抓取工具
文件大小:5KB
文件格式:ZIP
更新时间:2021-05-03 02:34:26
crawler natural-language-processing deeplearning neural-machine-translation Python 机器翻译的平行语料库抓取工具 此仓库包含用于收集并行语料库的搜寻器。 但是,未经授权的爬网可能会引起问题。 在进行爬网之前,用户应检查有关允许爬网程序的网站政策。 另外,用户需要确保爬网的结果属于用户。 此仓库对任何爬网行为的结果不承担任何责任。 换句话说,用户对所有使用承担全部责任。 而且,此存储库中的源代码以幼稚的方式编码。 因此,它不能保证最佳操作。 用法 $ python joongang_daily.py [output_fn] $ python chosun.py
【文件预览】:
parallel_corpus_crawler-master
----selector_checker.py(933B)
----chosun.py(6KB)
----.gitignore(8B)
----README.md(659B)
----joongang_daily.py(4KB)

网友评论