文件名称:SoNar2Naf:从 Folia 到 NAF 的转换器
文件大小:333KB
文件格式:ZIP
更新时间:2024-07-03 02:29:27
HTML
自 20-02-2015 起 作者 Marten Postma ( ) 埃米尔·( ) 目标 SoNaR语料库是一个大型的荷兰语料库( ),其中一部分已经用Cornetto senses进行了注释( ) 在 DutchSemcor 项目 ( ) 中。 该项目的目标是: 已完成:将每个文件从 Folia xml ( ) 转换为 NAF ( ) 已完成:包括 dutchsemcor 注释 已完成:添加开源荷兰语 Wordnet 注释 TODO:运行荷兰管道以添加 NER、NEL、最新的 alpino、SRL、timex 等等。 用法 这个github有两个主要目的: 将 folia xml 文件转换为包含 wf 和术语层的 NAF。 cd 到脚本文件夹并调用 python FoliaToNaf.py -h 以获取有关如何使用它的信息。 将 DutchSemcor 转换为
【文件预览】:
SoNar2Naf-master
----INSTALL.md(317B)
----LICENSE.md(553B)
----resources()
--------base_naf.xml(145B)
--------1.3.1.ALLWORDS_DSC()
--------cdb_syn_FILT.xml.lu-map(333KB)
----dutch_pipeline()
--------constituency_parser_nl()
--------pipedemo()
--------dependency-parser-nl()
--------README.md(956B)
--------run.sh(1KB)
----scripts()
--------FoliaToNaf.py(11KB)
--------html()
--------utils.py(6KB)
--------get_folia_pos_and_morphofeat.py(6KB)
--------main.py(3KB)
--------queue.py(2KB)
----README.md(2KB)