文件名称:pos-tagging:英语的词性标记器
文件大小:68.59MB
文件格式:ZIP
更新时间:2024-05-17 07:33:46
natural-language-processing english logistic-regression part-of-speech-tagger conditional-random-fields
后置匕首 实现英语的词性标记器使用包含几乎12,000个英语句子的语料库训练词性标记器模型。 检查我写的详细的中等故事: : 模型 回购中的模型(微型模型)使用微型数据进行训练,该微型数据仅包含近100个英语句子。 因此,它的性能不够好。 我鼓励您使用data /目录中的语料库自行训练新模型。 我在配备3.1 GHz Intel Core i7处理器的设备上进行了为时32分钟的培训。 训练精度为100% ,而开发精度为93% 。 用法 $ python3 pos_tag.py输入语句 例子 $ cd src $ python3 pos_tag.py“家庭和平,世界和平。” -> POS标记器已加载。 -> [('Peace','NN'),('at','DT'),('home','NN'),(',',','),('peace','NN '),('on','IN'),('earth',
【文件预览】:
pos-tagging-master
----data()
--------en-ud-dev.conllu(328KB)
--------en-ud-train.conllu(2.59MB)
----model()
--------pos_tagger.gz(33.99MB)
--------postag_model.gz(33.99MB)
----LICENSE(1KB)
----src()
--------train.py(7KB)
--------pos_tag.py(573B)
----.gitignore(52B)
----README.md(1KB)
----mini_data()
--------en-ud-dev.conllu(13KB)
--------en-ud-train.conllu(39KB)