文件名称:CERMINE:Content ExtRactor和MINEr
文件大小:108.79MB
文件格式:ZIP
更新时间:2024-06-02 07:23:14
java pdf machine-learning metadata-extraction reference-parsing
Content ExtRactor和MINEr CERMINE是一个Java库和一个Web服务( ),用于从包含学术出版物的PDF文件中提取元数据和内容。 CERMINE是由Java编写的。 该代码已获得GNU Affero通用公共许可证版本3的许可。 如何引用陶瓷素: Dominika Tkaczyk, Pawel Szostek, Mateusz Fedoryszak, Piotr Jan Dendek and Lukasz Bolikowski. CERMINE: automatic extraction of structured metadata from scientific literature. In International Journal on Document Analysis and Recognition (IJDAR), 2015, vol.