文件名称:复合词:复合词在韩国文档中搜索新词或复合词
文件大小:31KB
文件格式:ZIP
更新时间:2024-03-09 09:11:05
Python
复合机 基本信息 该项目旨在从各种类型的文本源中搜索复合词 兼容性 Python版本:3.6 设置 强烈建议将Visual Studio Code与Anaconda一起使用。 (起初可能会有点困难)使用Python 3.6版设置自己的conda env。 pip install eunjeon pip install kss pip install pandas C: mkdir comfinder 如何使用每个脚本 csvreader.py(不建议使用)从C:\ comfinder \ text.csv的NEWS_BODY列中获取文本,并将其保存在C:\ comfinder \ inputDoc.txt中 compounder.py(不建议使用)从C:\ comfinder \ inputDoc.txt查找复合词并在命令行上显示 compounder2.py从csv,txt或字符串中查
【文件预览】:
Compounder-main
----text.csv(16KB)
----wordspliiter.py(5KB)
----sample.py(11KB)
----Dockerfile(1KB)
----LICENSE(7KB)
----inputDoc.txt(4KB)
----requirements.txt(196B)
----csvreader.py(2KB)
----.dockerignore(324B)
----README.md(907B)
----compounder2.py(13KB)
----compounder.py(13KB)
----.vscode()
--------launch.json(494B)
--------tasks.json(449B)