文件名称:Aelius Brazilian Portuguese POS-Tagger:基于Python的基于NLTK的软件包,用于巴西葡萄牙语的浅层解析-开源
文件大小:60.11MB
文件格式:ZIP
更新时间:2024-05-20 14:10:02
开源软件
Aelius是一个正在进行的开源项目,旨在开发一套基于NLTK的Python模块,以及与外部免费可用工具的接口,用于浅析巴西葡萄牙语。 它还包括语言资源,例如语言模型,示例文本和黄金标准。 目前,Aelius已经提供了用于POS标记和分块语料库以及以不同格式(例如,TEI P5编码方案中的XML)输出注释的工具。
【文件预览】:
Aelius-February-25-2013
----aelius_data()
--------lipral.txt(6KB)
--------lipral.chptb.gold.txt(7KB)
--------AeliusPerceptronOpenNLP.bin(1.48MB)
--------lipral.bosque.notok.gold.txt(7KB)
--------README.html(12KB)
--------LICENSE.txt(4KB)
--------luzia_inicio.txt(858B)
--------freq_tycho_a.pkl(300KB)
--------actg.txt(3KB)
--------AeliusRegexpTagger.pkl(3KB)
--------AeliusHunPos(10.51MB)
--------lipral.mm.gold.txt(7KB)
--------lipral.edt.txt(4KB)
--------AeliusMaxEntMM()
--------AeliusRUBT.pkl(1.68MB)
--------AeliusBRUBT.pkl(1.59MB)
--------template.xml(516B)
--------AeliusStanfordMM(9.74MB)
--------lipral.bosque.gold.txt(8KB)
--------exemplo.txt(1KB)
--------exemplo.nltk.gold.txt(2KB)
--------luzia_inicio.tok.txt(913B)
--------AeliusMaxEnt()
--------AeliusFreeLing(0B)
--------luzia_inicio.mm.gold.txt(1KB)
--------tag_mapping.txt(227B)
--------AeliusMaxentOpenNLP.bin(4.55MB)
--------AeliusHunPosMM(8.48MB)
----LICENSE.txt(572B)
----NOTICE.txt(533B)
----README.txt(3KB)
----INSTALL.pdf(128KB)
----INSTALL.html(28KB)
----Aelius()
--------ExpandeContracoes.py(6KB)
--------openNLPJava.py(5KB)
--------AnotaCorpus.py(19KB)
--------Toqueniza.py(12KB)
--------ProcessaNomesProprios.py(6KB)
--------FreeLing.py(6KB)
--------SimplificaEtiquetas.py(1KB)
--------CorrigeTexto.py(2KB)
--------ProcessaCorpus.py(535B)
--------ConstroiBRUBT.py(2KB)
--------MXPOST.py(4KB)
--------__init__.py(2KB)
--------Extras.py(2KB)
--------Chunking.py(5KB)
--------Avalia.py(4KB)
--------CalculaEstatisticasLexicais.py(4KB)
--------ConstroiRUBT.py(3KB)
--------openNLP.py(5KB)
--------AnotaTextosLXTagger.py(1KB)
----UBUNTU.html(18KB)
----MANUAL.txt(41B)