文件名称:KD:Keyphrase Digger(KD)是基于规则的密钥短语提取系统
文件大小:37.08MB
文件格式:ZIP
更新时间:2024-05-03 12:25:34
Java
KD:关键短语挖掘者 Keyphrase Digger(KD)是用于提取关键短语的基于规则的系统。 它是KX工具的Java重新实现(Pianta和Tonelli,2010),具有新的体系结构和新功能。 KD将统计量度与PoS模式提供的语言信息相结合,以从文本中识别和提取加权的关键短语。 主要特点: 多词提取 多语种(EN,IT,FR和DE) 轻松扩展到其他语言 比KX更高的可定制性 处理速度快 同一引理下的关键短语聚类 各种公认的格式和PoS标签集:Stanford PoS Tagger(EN,FR),TreeTagger(IT,DE,FR和EN),TextPro(IT和EN) 提升特定PoS模式 介绍 本文档介绍了用于在代码中启动和使用KD工具提取密钥短语的API。 该工具同时使用统计量度和语言信息来检测表示文本最重要概念的n-gram的加权列表。 要求: 需要Java 1.8+