文件名称:TwitterLDATopicModeling:使用主题建模来标识Twitter用户的关注者关系之间的上下文
文件大小:2.42MB
文件格式:ZIP
更新时间:2024-02-26 20:52:23
python twitter tweets community-detection networkx
描述 Twitter用户经常基于相似的兴趣与其他用户关联并社交。 可以使用训练有素的LDA模型对这些用户的Tweet进行分类,以自动发现他们的相似性。 先决条件 由于模式库当前与大多数Python 3版本不兼容,因此建议使用python 2.7。 Python 3.6可以与模式库一起使用,尽管它可能需要从源代码构建,因为大多数较新Linux发行版都没有预安装它。 linux_setup_py3.6.sh脚本中提供了从源代码构建Python 3.6的命令。 正在安装 Linux 下载: git clone https://github.com/kethort/twitter_LDA_top
【文件预览】:
TwitterLDATopicModeling-master
----requirements_py3.6_nvidia_jetson.txt(1KB)
----linux_setup_py2.7.sh(1KB)
----requirements_py3.txt(1KB)
----patches()
--------nltk_downloads.py(262B)
--------wikicorpus.py(13KB)
--------prog_class.py(7KB)
--------english(936B)
----src()
--------get_community_tweets.py(5KB)
--------create_LDA_model.py(8KB)
--------twitter_user_grabber.py(12KB)
--------plot_distances.py(24KB)
--------nltk_downloader.py(294B)
--------manage_aws_s3_bucket.py(2KB)
--------oauth_handler.py(2KB)
--------plot_dataset.py(2KB)
--------plot_communities_vs_cliques.py(13KB)
--------tweets_on_LDA.py(7KB)
--------oauth_handler.pyc(2KB)
----requirements_py3.6_OSX.txt(1KB)
----img()
--------topology.png(66KB)
--------community_median_internal_external.png(214KB)
--------lda_model.png(70KB)
--------text_preprocess_remove_symbols.png(332KB)
--------text_preprocess_remove_url.png(434KB)
--------text_preprocess_remove_emoji.png(486KB)
--------user_internal_external.png(69KB)
--------coherence_simple_wiki.png(46KB)
--------lda_architecture.png(160KB)
--------community_size_distribution.png(45KB)
--------text_preprocess_lemmatize.png(348KB)
--------user_x_distribution.png(83KB)
--------tweet_distribution.png(42KB)
--------user_x_lda_vis.png(138KB)
----requirements_py3.8_Windows10.txt(822B)
----Command Line Examples.txt(2KB)
----requirements_py2.txt(1KB)
----linux_setup_py3.6.sh(1KB)
----README.md(2KB)
----osx_setup_py3.6.info(328B)
----docs()
--------doc_to_vec_transformation.txt(38KB)
--------document_vectors_explained(4KB)
--------jensen_shannon_calcs.txt(4KB)