捕鱼java源码-DESIR-CodeSprint-TrackA-TextMining:DesirCodeSprint-TrackA-文本挖掘

时间:2024-06-26 07:33:30
【文件属性】:

文件名称:捕鱼java源码-DESIR-CodeSprint-TrackA-TextMining:DesirCodeSprint-TrackA-文本挖掘

文件大小:60.07MB

文件格式:ZIP

更新时间:2024-06-26 07:33:30

系统开源

捕鱼java源码 轨道 A :books: 使用 GROBID 和外部 DARIAH 服务处理来自 PDF 的书目数据和引文 该存储库包含一个工作区和一个演示器,这些演示器由 DESIR 项目组织的两个代码冲刺产生。 为了促进工具、服务和倡议合作,DESIR 组织了一系列传播活动,其中之一是代码冲刺。 其目的是将不仅来自 DARIAH 社区的开发人员和附属机构聚集在一起。 第一次代码冲刺于 2018 年 7 月 31 日至 8 月 2 日在柏林举行,而第二次代码冲刺于 2019 年 9 月 24 日至 26 日在同一城市举行。 在同一主题书目元数据:两个代码冲刺的引用和参考文献下,活动分为几个轨道。 为支持主题,轨道 A侧重于作为提取 Pdf 科学文件的书目和引文数据的工具的使用和探索。 目标 第一个代码冲刺 第一个代码冲刺的目标是: 探索并改进 Grobid 作为提取 Pdf 文件,尤其是科学文章的工具的可用性; 使用从 Grobid 以外的服务中提取的一些其他信息来丰富从 Grobid 中提取的数据; 我们选择集成的一些外部服务是: 针对*和维基数据提取和解析实体的服务 entity-c


网友评论