TwitterHashtagR:教育研究中的文本挖掘

时间:2024-05-17 07:28:09
【文件属性】:

文件名称:TwitterHashtagR:教育研究中的文本挖掘

文件大小:149KB

文件格式:ZIP

更新时间:2024-05-17 07:28:09

R

推特 目的 这个小型项目旨在帮助从事SNS和学习分析的研究人员以更轻松的方式收集数据,尤其是那些希望通过标签从Twitter收集数据的研究人员。 有两种情况: 收集过去的数据 将来收集数据 身份验证,第一要务 安装R( ;如果您是在PC上,则可能也要安装R studio( )) 在上创建一个新应用程序(您首先需要一个Twitter帐户)。 创建应用程序时,请记住将回调URL设置为 。 保存消费者密钥和消费者秘密,以备将来使用。 运行Authentication.R中的代码; 请记住用您自己的消费者密钥和机密替换“ xxxxx”。 收集过去的数据 Twitter API限制了使用发生在过去的事件中的#标签进行数据收集。 如果您过去必须收集完整的数据,则可以考虑执行以下操作。 在Twitter上搜索哈希,然后向下滚动直到所有推文都加载到该网页上。 将网页另存为本地驱动器上的ht


【文件预览】:
TwitterHashtagR-master
----Data Collection()
--------collectUsers.R(1KB)
--------Authentication.R(1KB)
--------hashtagSearch.R(920B)
--------parse_Tweets.R(3KB)
--------getTweetsByUser.R(982B)
--------getTweetsByAllUser.R(3KB)
----Data Cleaning()
--------cleanData.R(2KB)
----Data Processing()
--------preProcess.R(1KB)
--------stopwords.csv(558B)
--------termDocumentMatrixConverter.R(2KB)
----Data Analysis()
--------highFrequencyWords.R(771B)
--------lexicalVar.R(2KB)
--------hclusterofwords.R(3KB)
--------lexicon.csv(136KB)
--------sentiment.R(2KB)
----README.md(3KB)
----Data()
--------edutech.csv(235KB)
--------SITE.csv(148KB)
--------stopwords.csv(558B)
--------lexicon.csv(136KB)
--------diary.csv(11KB)
----.gitignore(146B)

网友评论