文件名称:ShortTextStreamClassification:基于概念的带有主题漂移检测的短文本流分类
文件大小:7.46MB
文件格式:ZIP
更新时间:2024-05-20 09:09:02
ShortTextStreamClassification 基于概念的带有主题漂移检测的短文本流分类 短文本流分类由于其短长度,信号微弱,速度快和特殊主题漂移等特点,是一项非常具有挑战性和重大意义的任务。 但是,这一挑战很少受到研究界的关注。 为此,我们提出了一种新的功能扩展方法,用于使用从Web语料库获得的大规模通用语义网络对短文本流进行分类。 我们的方法基于增量集成分类模型。 首先,在开放语义网络方面,我们在短文本中引入了更多语义上下文,以弥补数据稀疏性。 同时,我们通过术语的语义来消除歧义,以减少噪声的影响。 其次,为了有效地跟踪隐藏的主题漂移,我们提出了一种基于概念聚类的主题漂移检测方法。 最后,大量实验证明,与几种众所周知的数据流概念漂移检测方法相比,我们的方法可以有效地检测主题漂移。 同时,与几种最新的短文本分类方法相比,我们的方法在文本数据流的分类中性能最佳。 介绍 短
【文件预览】:
ShortTextStreamClassification-master
----README.md(16KB)
----Used-Data-Sets-and-demo.rar(7.47MB)