parallel_corpus_crawler:机器翻译的平行语料库抓取工具

时间:2024-05-22 20:21:06
【文件属性】:

文件名称:parallel_corpus_crawler:机器翻译的平行语料库抓取工具

文件大小:5KB

文件格式:ZIP

更新时间:2024-05-22 20:21:06

crawler natural-language-processing deeplearning neural-machine-translation Python

机器翻译的平行语料库抓取工具 此仓库包含用于收集并行语料库的搜寻器。 但是,未经授权的爬网可能会引起问题。 在进行爬网之前,用户应检查有关允许爬网程序的网站政策。 另外,用户需要确保爬网的结果属于用户。 此仓库对任何爬网行为的结果不承担任何责任。 换句话说,用户对所有使用承担全部责任。 而且,此存储库中的源代码以幼稚的方式编码。 因此,它不能保证最佳操作。 用法 $ python joongang_daily.py [output_fn] $ python chosun.py


【文件预览】:
parallel_corpus_crawler-master
----selector_checker.py(933B)
----chosun.py(6KB)
----.gitignore(8B)
----README.md(659B)
----joongang_daily.py(4KB)

网友评论