文件名称:pywsd:词义歧义消除(WSD)技术的Python实现
文件大小:23.23MB
文件格式:ZIP
更新时间:2024-02-24 09:10:34
python nlp wordnet wsd lesk
ws 词义歧义消除(WSD)技术的Python实现: 莱斯克算法 原始韭菜(Lesk,1986) 改编/扩展的韭菜(Banerjee和Pederson,2002/2003) 简单的韭菜(包括定义,示例和超+超义词) 余弦列克(使用余弦来计算重叠而不是使用原始计数) 最大化相似性(另请参见 ) 路径相似度(Wu-Palmer,1994; Leacock和Chodorow,1998) 信息内容(Resnik,1995; Jiang and Corath,1997; Lin,1998) 基准线 随机感 NLTK第一感 最高引理数 注意:PyWSD现在仅支持Python 3( pywsd>=1.2.0 )。 如果您使用的是Python 2,则最后一个可能的版本是pywsd==1.1.7 。 安装 pip install -U nltk python -m nltk.downloader 'popular' pip install -U pywsd 用法 $ python >> > from pywsd . lesk import simple_lesk >> > sent =
【文件预览】:
pywsd-master
----setup.py(593B)
----Benchmark.md(735B)
----requirements.txt(64B)
----test_lesk_speed.py(1KB)
----test_merlin.py(2KB)
----Precompute Signatures.ipynb(24KB)
----LICENSE.md(1KB)
----test_wsd.py(5KB)
----.travis.yml(332B)
----test_allwords_wsd.py(3KB)
----consistency_test.py(1KB)
----merlin()
--------gaussian.py(862B)
--------perceptron.py(2KB)
--------naive_bayes.py(3KB)
--------LICENSE.md(1KB)
--------__init__.py(597B)
--------linear_classifier.py(2KB)
--------utils.py(2KB)
--------svm.py(2KB)
--------README.md(555B)
--------mira.py(2KB)
--------simple_data_set.py(5KB)
----CHANGELOG.md(973B)
----README.md(7KB)
----quick_reference.md(3KB)
----test_corpus_processor.py(1KB)
----pywsd()
--------semeval.py(6KB)
--------data()
--------__init__.py(732B)
--------corpus.py(1B)
--------allwords_wsd.py(3KB)
--------lesk.py(14KB)
--------utils.py(5KB)
--------similarity.py(5KB)
--------tokenize.py(5KB)
--------baseline.py(2KB)
--------stopwords.py(0B)
--------test()
--------cosine.py(1KB)
----tox.ini(155B)