文件名称:book-nlp:图书长度文件的自然语言处理管道
文件大小:59.87MB
文件格式:ZIP
更新时间:2024-05-24 14:28:08
natural-language-processing digital-humanities Java
BookNLP BookNLP是一种自然语言处理管道,可扩展到书籍和其他长文档(英语),包括: 词性标记(斯坦福大学) 依赖项解析(MaltParser) 命名实体识别(斯坦福大学) 角色名称聚类(例如,“ Tom”,“ Tom Sawyer”,“ Mr。Sawyer”,“ Thomas Sawyer”-> TOM_SAWYER) 说话者语录识别 代词共指解析 过度标记(例如“动物”,“人工制品”,“身体”,“认知”等) 该管道在下面的文章中进行了描述。 如果您使用此软件撰写研究论文,请引用: David Bamman,Ted Underwood和Noah Smith,“文学角色的贝叶斯混合效应模型”,ACL 2014。 怎么跑 初赛 下载外部jar(对于GitHub的100MB文件大小限制而言,它们太大了) 下载并解压缩 将stanford-corenlp-4.1.0