文件名称:hazm:用于消化波斯文字的Python库
文件大小:820KB
文件格式:ZIP
更新时间:2024-05-22 04:57:15
natural-language-processing persian Python
哈兹姆 用于提取波斯文字的Python库。 文字清理 句子和单词分词器 词词化器 POS标记器 浅解析器 依赖解析器 波斯语料库的接口 兼容 Python 2.7、3.4、3.5、3.6、3.7和3.8支持 用法 >> > from __future__ import unicode_literals >> > from hazm import * >> > normalizer = Normalizer () >> > normalizer . normalize ( 'اصلاح نويسه ها و استفاده از نیمفاصله پردازش را آسان مي كند' ) 'اصلاح نویسهها و استفاده از نیمفاصله پردازش را آسان میکند' >> > sent_tokenize ( 'ما هم برای و