The Properties of Posterior of Topic Model

时间:2024-06-01 21:36:50

1.Tang, Jian, et al. "Understanding the Limiting Factors of Topic Modeling via Posterior Contraction Analysis." ICML. 2014.

This is the best paper of ICML 2014.  The first author is Jian Tang(his weibo:http://weibo.com/1741301241, Phd of Peking University.)

Qiaozhu Mei is associate professor of university of Michigan(Graduated from peking university).

Long Nguyen may be from Vietnam(not for sure).

这篇文章主要是探索LDA的后验分布随着文档数等的变化如何变化。 首先它的理论基础是Posterior contraction of the population polytope in finite admixture models这篇文章。基本上就是用这篇文章的理论进行了模拟实验。然后它还做了真实数据集上的实验,我觉得真实数据的实验没法说明理论结果,因为真实数据根本不知道真实的后验分布。我觉文档数量以及长度什么的其实在直觉上就能搞明白,我比较关心的是超参的选取。当然论文中做了一些关于超参的实验,但是并没有理论上的结论。但是文章写得比较条理清晰,写作上可以给很高的分。

2.Nguyen, XuanLong. "Posterior contraction of the population polytope in finite admixture models." Bernoulli 21.1 (2015): 618-646.