文件名称:ParlaMint:ParlaMint:可比的国会语料库
文件大小:8.56MB
文件格式:ZIP
更新时间:2024-03-05 12:18:18
XSLT
ParlaMint:可比的国会语料库 旨在为许多国家/地区的语言创建具有语言注释的可比议会语料库。 语料库将被编码为通用模式,这是一种特殊。 该项目旨在承载开发中的ParlaMint语料库的模式和示例,以执行编码验证,并拥有一个通过GitHub问题报告问题的论坛。 每个国家/地区都有用于其样本的专用目录,该目录最终应至少包含四个文件: ParlaMint-XX.xml:“纯文本”样本的语料库根文件,其中X包含其组成文件 ParlaMint-XX_zzz.xml:至少一个“纯文本”样本语料库组件文件 ParlaMint-XX.ana.xml:具有语言注释的样本的语料库根文件,其中XIncludes组件文件 ParlaMint-XX_zzz.ana.xml:至少一个带有语言注释的示例语料库组件文件 作为例子请。 请参阅主体的版本1的文件,即BG,HR,PL,SI目录。 文件夹包含用于验