文件名称:Sentiment-Analysis-NYT-Immigration-Articles:使用VADER和textblob词典对NYT移民数据进行情感分析
文件大小:83.07MB
文件格式:ZIP
更新时间:2024-06-12 20:31:06
HTML
情感分析-纽约时报文章 使用VADER和Textblob词典对NYT时间移民数据进行情感分析 海报参考项目: : 使用的工具 R工作室 Jupyter笔记本(python) 第一步:从NYT API提取数据 文件夹:1-NYT API数据提取 创建R笔记本 使用在类似结构的表格中提取文章 使用“移民或移民或移民或移民或移民或难民或外国人或无证件或庇护”的查询摘录的移民文章,以整体上获得广泛的移民。 Exctracting NYT API(allNYTSearch1981to2020)中提供了1981-2020年的原始数据。 文章是从请求的最后日期开始提取的,直到API的调用次数达到上限为止。 这是手动完成的操作,通常在笔记本中指定的每个查询每2年数据失败一次。 第二步:预处理和培训 文件夹:2-标准化和培训 删除重复的文章。 数据标准化:使用preprocess_regex函数标准