文件名称:superuser-topic-modeling:超级用户论坛主题建模
文件大小:46.63MB
文件格式:ZIP
更新时间:2024-05-18 11:06:24
machine-learning analysis topic-modeling lda superuser
关于 此仓库包含使用gensim软件包在SuperUserForum上应用主题建模的代码 我用于分析的ipython笔记本可在找到 可以在找到该项目的交互式视图 我上课时使用的 再现结果 下载数据集转储是从下载的 保存并将文件夹保存到“数据”文件夹中。数据文件夹应具有一个Posts.xml文件 生成sqlitedb xml文件很大且不容易访问。 以其当前格式,很难获得整个页面(问题和答案)。 脚本analysis / makdeb.py创建一个sqlite数据库 python analysis/makedb.py data/Posts.xml data/data.sqlite 分析结果 ipython notebook 导航到analysis / superuser.ipynb 运行部署的代码 bower,npm必须安装 安装Bower依赖项 bower install 安装