文件名称:使用同义词词林扩展版的词语相似度计算剖析
文件大小:1.61MB
文件格式:ZIP
更新时间:2022-05-25 02:53:23
同义词词林 java实现 含源文件分层
本例是基于《哈工大信息检索研究中心同义词词林扩展版》做的,其中详细分析了将源文件差拆分成五层结构,并对同义词计算,进行了跟踪分析。 其中根目录下的Synonymy是项目文件|||Synonymy/text-file中的origin.txt其实就是根目录下的:xx词林扩展版.txt |||SliceArrangement.java 是我自己手写的拆分方法,但是比较慢。期待改良。||| CiLin.java ||| 来源于网上的计算方法(具体参照了田久乐先生的论文中所提出的计算方法,详情请参照:基于同义词词林的词语相似度计算方法.pdf)||| AboutCiLin.java ||| 剖析了词林的利弊。
【文件预览】:
Synonymy
----.project(384B)
----synonymy()
--------third.txt(11KB)
--------first.txt(64B)
--------fourth.txt(38KB)
--------last.txt(1.47MB)
--------second.txt(624B)
----src()
--------synonymy()
--------about()
--------split_arrangement()
----.settings()
--------org.eclipse.jdt.core.prefs(598B)
--------org.eclipse.core.resources.prefs(57B)
----text-file()
--------origin.txt(889KB)
----.classpath(301B)
----bin()
--------synonymy()
--------about()
--------split_arrangement()
基于同义词词林的词语相似度计算方法.pdf
哈工大信息检索研究中心同义词词林扩展版.txt
readme.md