文件名称:twitter-sentiment-analysis
文件大小:695KB
文件格式:ZIP
更新时间:2024-03-27 13:24:58
Python
Twitter情绪分析 客观的 构建可伸缩的,容错的和高可用性的(临时的)批处理框架,以在指定的时间段内提取,处理和执行与主题相关的推文的情绪分析。 项目概况 Twitter API将用于从Twitter提取推文数据。 以15分钟的时间突发获取数据,在指定的时间间隔内每15分钟回顾100条推文。 这些推文文本以及一些用户元数据都存储在暂存区域中。 tweet_id和text (tweet本身)被推送到Kinesis数据流以进行进一步处理。 流式传输的Kinesis数据已消耗,并且对于每条推文,都使用AWS Comprehend ML作为服务来执行情感分析。 情感分析API返回“积极”,“消极”,“中立”或“混合”类别的文本的总体情感,并以“标签”作为最终结论。 标签只是一个字符串,代表所有指定类别中的最高概率。 使用者使用此结果,并将数据写入“情感”存储区。 在这里,每个Kinesis
【文件预览】:
twitter-sentiment-analysis-main
----Dockerfile(214B)
----README.md(10KB)
----redshift()
--------copy-tweet(298B)
--------create-sentiment.sql(395B)
--------create-tweet.sql(395B)
--------copy-sentiment(324B)
----module()
--------consumer.py(3KB)
--------ingest.py(6KB)
----docs()
--------architecture.png(123KB)
--------grafana-long-gif.gif(604KB)
----docker-compose.yaml(150B)
----emr-script.py(3KB)
----config()
--------secret.ini(308B)
--------app.yaml(819B)
----requirements.txt(65B)