文件名称:Data_Wrangling_Twitter:整理和分析数据
文件大小:1.38MB
文件格式:ZIP
更新时间:2024-05-01 01:17:18
RichTextFormat
数据_争吵_Twitter 数据争吵 目标:作为Udacity的Data Ananlyst Nanodegree计划的一部分,我不得不整理WeRateDogs Twitter数据以创建有趣且可信赖的分析和可视化。 Twitter档案很好,但是只包含非常基本的推文信息。 需要进行额外的收集,然后评估和清理,才能进行“哇!”的分析和可视化。 数据 WeRateDogs Twitter存档包含其所有5000+条推文的基本推文数据,但不是全部。 但是,存档确实包含一列:每条推文的文本,我用来提取等级,狗的名字和狗的“阶段”(即doggo,floofer,pupper和puppo),以使该Twitter存档“得到增强”。 图像预测使用神经网络在每个推文ID,图像URL和对应于最可靠预测的图像编号(从1到4,因为推文最多可包含四个图像)的旁边归档一个充满图像预测的表(仅前三个) )。 带有推文
【文件预览】:
Data_Wrangling_Twitter-main
----twitter-archive-enhanced.csv(894KB)
----tweet-json copy(10.12MB)
----.DS_Store(6KB)
----README.md(3KB)
----tweet-json.txt(10.12MB)
----.gitattributes(66B)
----twitter-api.rtf(2KB)