文件名称:phrase:使用不同策略识别文本中的短语的模块
文件大小:25KB
文件格式:ZIP
更新时间:2024-06-20 08:15:11
Python
短语 一个基于 nltk 和 gensim 自动生成短语的库。 安装 使用 pip 将包添加到您的 python 路径: pip install phrase 用法 要创建一个短语词典并打印出前 25 个短语: create_phrase_dictionary < corpus> < phrase> 这不是一个轻松的过程,它可能会占用大量内存和时间,因此请注意。 测试 要运行所有测试,您需要运行 py.test 来获取单元测试。 Lettuce 目前用于 BDD 测试,需要从测试文件夹运行或将 tests/ 添加到 PYTHONPATH(测试使用units.helpers 模块) py.test PYTHONPATH=tests lettuce tests/features cd tests lettuce f
【文件预览】:
phrase-master
----.gitignore(52B)
----README.md(796B)
----tests()
--------units()
--------debug_lettuce.py(221B)
--------features()
--------data()
----requirements.txt(27B)
----LICENSE.txt(7KB)
----MANIFEST.in(43B)
----setup.py(2KB)
----phrase()
--------tokenization.py(1KB)
--------create_phrase_dictionary_from_folder.py(928B)
--------phrase_dictionary.py(9KB)
--------__init__.py(0B)
--------corpus.py(2KB)
--------phrase_generation.py(6KB)
--------noun_phrase_dictionary.py(4KB)
--------word_list.py(1KB)