文件名称:LDA文本分类模型
文件大小:843KB
文件格式:PDF
更新时间:2015-06-17 14:45:26
lda
基于语义模型的场景建模算法常常会关注模型中的参数与视频中的信息的对应关系,一般来说,模型里相对重要的参数都有其特有的意义(对应视频中的一个事件或者是主题概率等)。LDA(Latent Dirichlet Allocation)模型[21]是一种简单而有效的基于语义模型的场景建模建模算法,由于这种模型被广泛而大量的使用,下面将对这种模型做详细的介绍。 LDA模型原本用于文本分类领域,下面是LDA模型里的一些定义: 单词(word)是一个离散的、模型里的最小单位。 词典(vocabulary)是所有可能出现的单词的集合(单词类型不重复)。换句话说,每一个单词都是词典集合内的一个元素。 文档(document)是N个单词的集合,其中同一种单词可以重复出现。 文集(corpus)是M个文档的集合。