UD-Kanbun:繁体中文的分词器POS-tagger和依赖项解析器

时间:2024-04-23 02:25:29
【文件属性】:

文件名称:UD-Kanbun:繁体中文的分词器POS-tagger和依赖项解析器

文件大小:1.05GB

文件格式:ZIP

更新时间:2024-04-23 02:25:29

UD-看板 用于中文的Tokenizer,POS-Tagger和Dependency-Parser(汉文/文言文)。 基本用法 >> > import udkanbun >> > lzh = udkanbun . load () >> > s = lzh ( "不入虎穴不得虎子" ) >> > print ( s ) # text = 不入虎穴不得虎子 1 不 不 ADV v ,副詞,否定,* Polarity = Neg 2 advmod _ Gloss = not | SpaceAfter = No 2 入 入 VERB v ,動詞,行為,移動 _ 0 root _ Gloss = enter | SpaceAfter = No 3 虎 虎 NOUN n ,名詞,主体,動物 _ 4 nmod _ Gloss = tiger | SpaceAfter = No 4 穴 穴 NOUN n


【文件预览】:
UD-Kanbun-master
----setup.py(2KB)
----LICENSE.txt(1KB)
----README.md(5KB)
----trial.png(19KB)
----upload.sh(342B)
----udkanbun.ipynb(4KB)
----udkanbun()
--------spacy()
--------supar-kanbun()
--------mecab-kanbun()
--------udkanbun.py(7KB)
--------__init__.py(74B)
--------ud-kanbun.udpipe(12.09MB)
--------simplify.py(47KB)
--------viewer.html(1KB)
--------download.py(1KB)
--------cli.py(2KB)
--------danku.py(1KB)
--------supar.py(2KB)
--------kaeriten.py(8KB)
--------mecabrc(20B)

网友评论