nlp-id:Kumparan的NLP服务

时间:2024-05-28 15:57:04
【文件属性】:

文件名称:nlp-id:Kumparan的NLP服务

文件大小:7.37MB

文件格式:ZIP

更新时间:2024-05-28 15:57:04

Python

Kumparan的NLP服务 nlp-id是模块的集合,为印度尼西亚语的自然语言处理提供各种功能。 该存储库包含与NLP服务相关的所有源代码。 安装 要安装nlp-id ,请使用以下命令: $ pip install nlp-id 用法 本节将详细说明如何使用lemmatizer,tokenizer,POS-tagger等。 脱胶机 Lemmatizer用于从句子中的每个单词中获取词根。 from nlp_id.lemmatizer import Lemmatizer lemmatizer = Lemmatizer() lemmatizer.lemmatize('Saya sedang mencoba') # saya sedang coba 分词器 令牌生成器用于将文本转换为单词,标点,数字,日期,电子邮件,URL等的令牌。此存储库中有两种令牌生成器:标准令牌生成器和短


【文件预览】:
nlp-id-master
----nlp_id()
--------postag.py(8KB)
--------tokenizer.py(5KB)
--------lemmatizer.py(8KB)
--------data()
--------__init__.py(221B)
--------stopword.py(916B)
----tests()
--------lemmatizer()
--------stopword()
--------__init__.py(0B)
--------postag()
--------tokenizer()
--------README.md(163B)
----LICENSE(1KB)
----setup.cfg(39B)
----setup.py(1KB)
----.gitignore(68B)
----README.md(6KB)

网友评论