文件名称:Linguakit:NLP的多语言工具包
文件大小:36.02MB
文件格式:ZIP
更新时间:2024-05-21 19:18:27
Perl
语言包 由ProLNat @ GE Group( ),CiTIUS,圣地亚哥·德Kong波斯特拉大学和加利萨大学开发。 LinguaKit是一种自然语言处理工具,包含多个NLP模块(不断更新和改进): 依赖解析器(DepPattern) PoS标记器 NER(命名实体识别) NEC(命名实体分类) 命名实体的共指解析 情绪分析 多字提取 关键字提取 关系提取 语言识别 分词器 句子分割 合法化 上下文中的关键字 实体链接和语义注释 总结器 动词共轭器 语言检查器(拼写,词典,语法) 演示版 LinguaKit.com上提供了Web界面。 描述 linguakit命令能够处理4种语言:葡萄牙语,英语,西班牙语和加利西亚语。 自2018年2月以来,已添加了一种新语言:Xavier Canosa的历史加利西亚语-葡萄牙语( histgz ),它仍然是将要改进的原型。 可以使用以下工具