文件名称:Project_Twitter_NLP:为Twitter构建事件提取和趋势框架
文件大小:36MB
文件格式:ZIP
更新时间:2024-02-27 02:05:46
nlp machine-learning twitter cosine-similarity event-extraction
为Twitter构建事件提取和趋势框架 这是我在大会上沉浸于数据科学领域的顶峰项目。 在这个项目中,我的目标是: 设置实时数据收集流程和数据基础架构 检查收集的推文上的不同自然语言处理工具 根据相似度比较创建A | B测试模型 使用时间序列建模来捕捉趋势 调整超参数以改进模型 要测试我的框架: 我通过使用TwitterStream API收集并清理了超过150万条推文 /lib/get_tweets.py 创建计划的和按需的LSA处理以进行文本替换 /ipynb/01_Fit_pipeline_TfiDf_SVD.ipynb 使用余弦相似度和ARIMA建模进行事件和趋势检测