【文件属性】:
文件名称:pywsd:词义歧义消除(WSD)技术的Python实现
文件大小:23.23MB
文件格式:ZIP
更新时间:2021-02-03 15:23:54
python nlp wordnet wsd lesk
ws
词义歧义消除(WSD)技术的Python实现:
莱斯克算法
原始韭菜(Lesk,1986)
改编/扩展的韭菜(Banerjee和Pederson,2002/2003)
简单的韭菜(包括定义,示例和超+超义词)
余弦列克(使用余弦来计算重叠而不是使用原始计数)
最大化相似性(另请参见 )
路径相似度(Wu-Palmer,1994; Leacock和Chodorow,1998)
信息内容(Resnik,1995; Jiang and Corath,1997; Lin,1998)
基准线
随机感
NLTK第一感
最高引理数
注意:PyWSD现在仅支持Python 3( pywsd>=1.2.0 )。 如果您使用的是Python 2,则最后一个可能的版本是pywsd==1.1.7 。
安装
pip install -U nltk
python -m nltk.downloader 'popular'
pip install -U pywsd
用法
$ python
>> > from pywsd . lesk import simple_lesk
>> > sent =
【文件预览】:
pywsd-master
----setup.py(593B)
----Benchmark.md(735B)
----requirements.txt(64B)
----test_lesk_speed.py(1KB)
----test_merlin.py(2KB)
----Precompute Signatures.ipynb(24KB)
----LICENSE.md(1KB)
----test_wsd.py(5KB)
----.travis.yml(332B)
----test_allwords_wsd.py(3KB)
----consistency_test.py(1KB)
----merlin()
--------gaussian.py(862B)
--------perceptron.py(2KB)
--------naive_bayes.py(3KB)
--------LICENSE.md(1KB)
--------__init__.py(597B)
--------linear_classifier.py(2KB)
--------utils.py(2KB)
--------svm.py(2KB)
--------README.md(555B)
--------mira.py(2KB)
--------simple_data_set.py(5KB)
----CHANGELOG.md(973B)
----README.md(7KB)
----quick_reference.md(3KB)
----test_corpus_processor.py(1KB)
----pywsd()
--------semeval.py(6KB)
--------data()
--------__init__.py(732B)
--------corpus.py(1B)
--------allwords_wsd.py(3KB)
--------lesk.py(14KB)
--------utils.py(5KB)
--------similarity.py(5KB)
--------tokenize.py(5KB)
--------baseline.py(2KB)
--------stopwords.py(0B)
--------test()
--------cosine.py(1KB)
----tox.ini(155B)