文件名称:Arabic Stemming Corpora-开源
文件大小:402KB
文件格式:RAR
更新时间:2024-06-16 01:20:24
开源软件
该语料库包含81,000个带有基本标签(动词,名词,形容词)的阿拉伯语资源(当代阿拉伯语(CCA)[1]和阿拉伯语Wikipedia [2])带标签的单词。 [1] http://www.comp.leeds.ac.uk/eric/latifa/research.htm。 [2] http://ar.wikipedia.org。
【文件预览】:
StemCorp.xml