文件名称:多变参pLSI文本敏感特征抽取算法 (2015年)
文件大小:1.07MB
文件格式:PDF
更新时间:2024-05-18 16:30:41
工程技术 论文
敏感词等特征的抽取是社交网络敏感话题分析的关键环节。目前热门的概率主题模型在社交网络敏感话题分析领域,受到特征语义复杂以及高噪声的影响,处理性能不够理想。提出了一种多变参概率潜在语义索引(pLSI)算法,可以利用社交网站标签、文本表情图片等多种辅助信息提高特征抽取的效果。实验数据显示,该算法有较高的分类准确率和较低的时间开销。该算法是理想的降维算法,适用于社交网络的敏感特征抽取。