MetaDataExtraction:从 PDF 科学文章中提取元数据

时间:2024-08-02 00:47:54
【文件属性】:

文件名称:MetaDataExtraction:从 PDF 科学文章中提取元数据

文件大小:12.17MB

文件格式:ZIP

更新时间:2024-08-02 00:47:54

Java

Metadata Extractor application 1.DESCRIPTION 所呈现的应用程序是从科学文章中自动提取标题元数据。 它使用经过训练的 CRF 分类器来标记 PDF 格式的科学文章的标题。 该应用程序可用于训练或测试 CRF 分类器,它还有一个 GUI,它提供了一个简单的界面,用于使用经过训练的分类器来标记文章标题。 该应用程序包含两个项目: PDFExtact MetadataExtraction 2.CONFIGURATION 可以通过设置MetadataExtraction/src/res/metadata_extraction.properties 配置文件中的值来配置应用程序。 3. 开始使用 CD 包含软件的编译版本。 只需双击位于 project/MetadataExtraction/dist/MetadataExtraction.jar 中的


【文件预览】:
MetaDataExtraction-master
----model()
--------crf_model(11.36MB)
----src()
--------view()
--------control()
--------res()
--------model()
--------util()
--------log4j.properties(264B)
--------crf()
----cora_data()
--------cora_header_labels(2.47MB)
--------tagged_headers.txt(1.28MB)
--------cora_header_labels_training(1.55MB)
--------cora_header_labels_test(943KB)
----nbproject()
--------genfiles.properties(475B)
--------build-impl.xml(79KB)
--------project.properties(3KB)
--------project.xml(961B)
----README.md(2KB)
----build.xml(4KB)
----manifest.mf(85B)
----lib()
--------mallet-2.0.7.jar(2.03MB)
--------slf4j-log4j12-1.6.1.jar(10KB)
--------trove4j-2.0.2.jar(723KB)
--------log4j-1.2.17.jar(478KB)
--------bcprov-jdk15on-150.jar(2.61MB)
--------slf4j-api-1.7.5.jar(25KB)
----lexicons()
--------address.txt(183B)
--------name.txt(2.4MB)
--------country.txt(2KB)
--------university.txt(86KB)
--------city.txt(75KB)
--------email.txt(12B)
--------keyword.txt(54B)
--------phone.txt(54B)
--------affiliation.txt(269B)
--------month.txt(191B)
--------web.txt(588B)
--------abstract.txt(64B)
----test()
--------results.txt(579B)

网友评论