文件名称:论文研究-基于可区分语言模型的微博在线话题检测.pdf
文件大小:790KB
文件格式:PDF
更新时间:2022-08-11 17:00:49
话题检测,特征选择,微博,语言模型,可区分语言模型
针对微博话题检测中需要解决的高维数据、噪声信息以及话题的快速演化等主要问题,提出一个有效的微博在线话题检测模型——可区分语言模型(discriminative language model,DLM)。该模型首先选择微博数据的可区分特征子空间,接着利用一元语言模型实现微博话题的在线检测。实验表明,在MACRO_F1和AVG_CDET等指标上,DLM明显优于现有模型,DLM能准确及时发现微博话题。