nxml2txt:NLM .nxml 到文本格式的转换

时间:2024-07-01 09:22:14
【文件属性】:

文件名称:nxml2txt:NLM .nxml 到文本格式的转换

文件大小:108KB

文件格式:ZIP

更新时间:2024-07-01 09:22:14

Python

xml2txt NLM .nxml 到文本格式的转换 用法: ./nxml2txt NXMLFILE [TEXTFILE] [SOFILE] 例如(使用测试文档): ./nxml2txt test/PMC3357053.nxml test/PMC3357053.txt test/PMC3357053.so 这将创建文件test/PMC3357053.txt ,其中包含输入文档的文本内容,以及test/PMC3357053.so ,以简单的对峙格式包含注释(XML 元素及其属性)。 nxml2txt 假设一个类 Unix 环境。 如果输入 .nxml 文件包含嵌入的 TeX-math,则 nxml2txt 需要和 。 该工具最初是作为 BioNLP Shared Task 2011 支持资源 ( ) 的一部分引入的。


【文件预览】:
nxml2txt-master
----data()
--------entities.dat(36KB)
----test()
--------PMC4222443.nxml(186KB)
--------PMC3357053.nxml(191KB)
----nxml2txt.sh(746B)
----LICENSE(1KB)
----src()
--------standoff.py(6KB)
--------rewritemmla.py(4KB)
--------respace.py(19KB)
--------rewritetex.py(16KB)
--------rewriteu2a.py(9KB)
--------__init__.py(0B)
--------txt2clean.py(11KB)
--------extracttex.py(4KB)
----nxml2txt(2KB)
----README.md(792B)

网友评论