AutoPhrase:AutoPhrase:Massive Text Corpora中的自动短语挖掘

时间:2024-03-02 05:28:30
【文件属性】:

文件名称:AutoPhrase:AutoPhrase:Massive Text Corpora中的自动短语挖掘

文件大小:61.98MB

文件格式:ZIP

更新时间:2024-03-02 05:28:30

text-mining automatic lexicon multi-language phrase

自动短语:从大量文本语料库中自动进行短语挖掘 刊物 如果您使用的是我们的工具,请引用以下两篇论文。 谢谢! 尚静波,刘加禄,姜萌,任翔,Clare R Voss,韩佳玮,“”,被IEEE Transactions on Knowledge and Data Engineering,2018年2月接受。 刘加鲁*,尚静波*,王驰,任翔和韩佳伟,“”,2015年ACM SIGMOD国际数据管理大会(SIGMOD'15),澳大利亚墨尔本,2015年5月。(*同样贡献, ) 近期变动 2020.06.14 用git master更新docker镜像 2018.03.04 修复了预处理和后处理过程中的一些错误,即Tokeninzer.java 。 以前,当语料库包含/之类的字符时,结果可能是错误的,或者可能发生错误。 当短语分段提供新文本时,对于知识库( wiki_quality.txt


网友评论