serbian-nlp-resources:塞尔维亚语的解析,标记和词义化资源

时间:2024-06-01 11:14:42
【文件属性】:

文件名称:serbian-nlp-resources:塞尔维亚语的解析,标记和词义化资源

文件大小:98.15MB

文件格式:ZIP

更新时间:2024-06-01 11:14:42

塞尔维亚人-nlp资源 塞尔维亚语的解析,标记和词义化资源 该存储库包含作为以下工作的一部分开发的塞尔维亚语的NLP资源: Miletic,Aleksandra(2018)。 树木丛生的联合国:宪法与剥削。 Thèsede doctorat。 法国图卢兹大学-让·雅鲁斯(JeanJaurès)。 这些资源包括: ParCoTrain-Synt :一个101K令牌树库,使用POS标签,详细的形态语法标签,原子形态语法特征,引理和句法依赖性进行手动注释。 ParCoLex :具有6M条目的词法语法词典。 基于过渡的解析模型:使用Talismane解析器创建的解析模型。 基于图的解析模型:使用MST解析器创建的解析模型。 句法标记模型:一种使用HunPOS标记器开发的详细形态句法标记的POS标记模型。 合法化模型:使用CSTLemma lemmatizer开发的合法化模型。 解


【文件预览】:
serbian-nlp-resources-master
----Models()
--------Lemmatisation()
--------Tagging()
--------Parsing()
----ParCoTrain-Synt()
--------parcotrainsynt_full_v1.0.conll(5.78MB)
--------ParCoTrain-Synt_Guide_lemmatisation-v1.0.pdf(220KB)
--------ParCoTrain-Synt_Guide_morphosyntax-v1.0.pdf(410KB)
--------parcotrain-synt_dev_v1.0.conll(586KB)
--------_README.txt(2KB)
--------parcotrain-synt_train_v1.0.conll(4.62MB)
--------parcotrain-synt_test_v1.0.conll(597KB)
--------ParCoTrain-Synt-v0.1()
--------ParCoTrain-Synt_Guide_syntax-v1.0.pdf(839KB)
----Lexicons()
--------ParCoLex()
--------Wikimorph-sr()
----README.md(1KB)

网友评论