SuPar-Kanbun:繁体中文的分词器POS-tagger和依赖项解析器

时间:2024-03-31 07:46:38
【文件属性】:

文件名称:SuPar-Kanbun:繁体中文的分词器POS-tagger和依赖项解析器

文件大小:2GB

文件格式:ZIP

更新时间:2024-03-31 07:46:38

Python

苏帕·坎邦 带有 , 和经典中文文本(汉文/文言文)的Tokenizer,POS-Tagger和Dependency-Parser。 基本用法 >> > import suparkanbun >> > nlp = suparkanbun . load () >> > doc = nlp ( "不入虎穴不得虎子" ) >> > print ( type ( doc )) < class> >> > print ( suparkanbun . to_conllu ( doc )) # text = 不入虎穴不得虎子 1 不 不 ADV v ,副詞,否定,* Polarity = Neg 2 advmod _ Gloss = not | SpaceAfter = No 2 入 入 VERB v ,動詞,行為,移動 _ 0 root _ Gloss


网友评论