文件名称:语义图的概率主题建模
文件大小:128KB
文件格式:PDF
更新时间:2024-04-26 05:59:27
研究论文
在本文中,我们提出了一个新颖的框架,即带有语义图的主题模型(TMSG),它将主题模型与DBpedia的丰富知识相结合。 首先,我们使用文档实体链接系统(即DBpedia Spotlight)从文档集中提取消歧的实体,从该数据库中,从DBpedia创建两种类型的实体图,分别捕获本地和全局上下文知识。 给定文档的语义图表示形式,我们使用语义图的歧义实体传播固有的主题文档分布。 在两个真实世界的数据集上进行的实验表明,TMSG可以大大优于最新技术,即作者-主题模型(ATM)和带偏向传播的主题模型(TMBP)。