文件名称:wikitext:一个从Wikipedia转储中提取纯文本的玩具程序
文件大小:15KB
文件格式:ZIP
更新时间:2024-05-29 22:08:37
Java
*转储的超级简单明文导出器 什么? 一个非常简单的程序,可以从Wikipedia转储中提取纯文本(严重的是,只有几行代码,所有繁重的工作都是由完成的)。 输入:Wikipedia转储的路径(命令的第一个参数) 输出:在stdout上将整个内容显示为纯文本(即删除所有标记) 为什么? 因为如果您只想看单词,那么标记就会妨碍您。 用法 wikitext PATH_TO_DUMP_FILE > PATH_TO_OUTPUT_FILE 您不需要通过管道将stdout传送到文件,但是鉴于转储可能非常庞大,您可能希望沿这些方式做一些事情。 编译安装 gradle build 将在build/distributions下产生可重新分发的存档,而 gradle installDist 将在build/install/wikitext/下build/install/wikitext/ 。
【文件预览】:
wikitext-master
----LICENSE(34KB)
----src()
--------main()
----README.md(1KB)
----build.gradle(516B)