文件名称:folia:FoLiA:语言注释的格式-FoLiA是一种基于XML的丰富注释格式,用于使用语言注释来表示语言资源(包括语料库)。 支持多种语言注释,使FoLiA成为NLP任务和数据交换的有用格式。 请注意,用于处理FoLiA的实际Python库是作为PyNLPl的一部分实现的,它包含使用该库的高级工具以及完整的文档,验证架构和集合定义。
文件大小:12.8MB
文件格式:ZIP
更新时间:2024-02-27 08:17:01
python nlp language library xml
FoLiA:语言注释的格式 | | | | | | | CLST /拉德布德大学奈梅亨&KNAW人文学科小组的Maarten van Gompel FoLiA是基于XML的注释格式,适用于语言注释的语言资源的表示。 FoLiA的预期用途是作为一种存储和/或交换语言资源(包括语料库)的格式。 我们的目标是引入一种单一的丰富格式,该格式可以通过单一的广义范例来容纳多种语言注释类型。 我们不承诺任何标签集,语言或语言理论。 这始终留给语言资源的开发人员使用,并提供最大的灵活性。 XML是一种固有的分层格式。 FoLiA通过最大程度地利用分层的内联设置来做到这一点。 我们从D-Coi格式继承,