文件名称:yelp-nlp:Yelp 学术数据集分析
文件大小:418.44MB
文件格式:ZIP
更新时间:2024-07-27 15:59:38
Python
yelp-nlp 查看之间的关系: Yelp:评论数量 Yelp:评论的文字情感 Yelp:评论之星 城市数据:各种其他有趣的城市数据(交通、犯罪率、就业等) 设置 下载数据集 解压文件,并将其重命名为yelp并将其放入此文件夹中。 我们使用clean-yelp.py文件清理clean-yelp.py数据。 我们使用clean-city.py文件清理城市数据。 数据集注释 每个文件由单个对象类型组成,每行一个 json-object。 查看一些示例以帮助您入门: : 。 每个州的企业数量: {u'ON': 305, u'XGL': 1, u'MN': 1, u'ELN': 8, u'MA': 1, u'NY': 2, u'CA': 1, u'NC': 1, u'MLN': 102, u'WI': 2118, u'SCB': 2, u'NTH': 1, u'FIF': 3,
【文件预览】:
yelp-nlp-master
----extra()
--------sentimentAnalysis.py(801B)
--------countAmounts.py(137B)
--------clean-yelp.py(4KB)
----yelp-MN()
--------0.json(1KB)
--------business.json(510B)
----city()
--------city-crime.csv(2KB)
----yelp-NV()
--------1.json(69.2MB)
--------3.json(63.16MB)
--------7.json(65.54MB)
--------6.json(65.75MB)
--------review.json(62.33MB)
--------review_10000.csv(7.12MB)
--------4.json(67.34MB)
--------0.json(62.96MB)
--------review.csv(46.6MB)
--------review_1000.csv(840KB)
--------2.json(66.68MB)
--------review_100.csv(90KB)
--------5.json(65.31MB)
--------json-to-csv.py(2KB)
--------business.json(12.26MB)
----yelp-ELN()
--------0.json(22KB)
--------business.json(5KB)
----yelp-AZ()
--------1.json(85.04MB)
--------3.json(83.98MB)
--------4.json(80.44MB)
--------0.json(82.71MB)
--------2.json(84.91MB)
--------business.json(18.25MB)
----clean-yelp-state-review.py(943B)
----R files()
--------sentiment-multiple-regression.R(330B)
--------.Rapp.history(0B)
--------simple-linear.R(702B)
--------reviewDistribution_pieChart.R(428B)
--------pos-neg-user-rating-new.R(648B)
--------.Rhistory(13KB)
--------reviewCount-yelpingSince.R(615B)
--------sentiment-reviewStars.R(285B)
--------numReviews_pieChart.R(782B)
--------pos-neg-user-rating.R(560B)
--------sentiment-usefulVotes.R(221B)
--------sentiment-yelpingSince.R(524B)
--------yelpingSince-fans.R(521B)
----yelp-user()
--------user_improved_1000.csv(33KB)
--------user_improved_10000.json(36.1MB)
--------user_improved_1000.json(3.52MB)
--------user_10000.json(45.16MB)
--------analysis.py(1KB)
--------user_1000.json(4.35MB)
--------user_improved_10000.csv(328KB)
--------json-to-csv.py(2KB)
----user-analysis.py(1KB)
----setup.py(0B)
----.gitignore(680B)
----yelp-EDH()
--------0.json(21.86MB)
--------business.json(2.36MB)
----yelp-MLN()
--------0.json(691KB)
--------business.json(85KB)
----yelp-ON()
--------0.json(1.72MB)
--------business.json(286KB)
----yelp-NY()
--------0.json(13KB)
--------business.json(2KB)
----city-breakdown.py(2KB)
----clean-yelp-state-business.py(530B)
----README.md(6KB)
----meeting-notes()
--------yelp-dataset-1.md(602B)
----yelp-MA()
--------0.json(2KB)
--------business.json(499B)
----Plots()
--------lin-reg-1-summary.PNG(14KB)
--------boxplot.PNG(14KB)
--------pie-chart.png(27KB)
--------pos-neg-user-rating.png(25KB)
--------lin-reg-2-line.PNG(19KB)
--------lin-reg-4-sd.PNG(8KB)
--------lin-reg-3-res.PNG(17KB)
--------multiple-regression.png(41KB)
----yelp-CA()
--------0.json(3KB)
--------business.json(449B)
----yelp-XGL()
--------0.json(3KB)
--------business.json(461B)
----json-to-csv.py(2KB)