文件名称:swsd:一个简单的词义消歧库
文件大小:170.01MB
文件格式:ZIP
更新时间:2024-07-01 01:46:48
Scala
简单词义消歧库 (swsd) 用java api用scala编写的简单词义消歧库 依赖项: Wordnet 3.0(使用 extJWNL) 斯坦福NLP Neo4j 图数据库和 scala-gremlin 方法: 在输入文本上,执行词性标记 在标记文本上,为单词的不同可能同义词集导出交叉点 消除可以与一个或多个交点相关联的词的歧义 对于剩下的词,消除该词类最流行的上下文的歧义 未来的工作: 添加对单词复合的支持 提供一个简单的 play webapp 将其部署为 REST 服务 研究使用 StanfordNLP 的其他替代方案 研究使用其他图形数据库或内存图形,如 TinkerGraph 等。
【文件预览】:
swsd-master
----LICENCE.md(423B)
----src()
--------test()
--------main()
----repo()
--------thirdparty()
----README.md(808B)
----pom.xml(7KB)
----data()
--------SentiWordNet_3.0.0_20130122.txt(12.96MB)
--------file_properties.xml(3KB)
--------stanfordnlp()
--------WordNetConceptMapping.txt(2KB)
--------stopwords.txt(4KB)
--------conceptnetjson()
--------DKProWSD_SK_graph.ser(65.72MB)