文件名称:SuPar-Kanbun:繁体中文的分词器POS-tagger和依赖项解析器
文件大小:2GB
文件格式:ZIP
更新时间:2024-03-31 07:46:38
Python
苏帕·坎邦 带有 , 和经典中文文本(汉文/文言文)的Tokenizer,POS-Tagger和Dependency-Parser。 基本用法 >> > import suparkanbun >> > nlp = suparkanbun . load () >> > doc = nlp ( "不入虎穴不得虎子" ) >> > print ( type ( doc )) < class> >> > print ( suparkanbun . to_conllu ( doc )) # text = 不入虎穴不得虎子 1 不 不 ADV v ,副詞,否定,* Polarity = Neg 2 advmod _ Gloss = not | SpaceAfter = No 2 入 入 VERB v ,動詞,行為,移動 _ 0 root _ Gloss