Yelp-Dataset-Challenge:信息检索课程的最终项目

时间:2024-07-16 20:11:32
【文件属性】:

文件名称:Yelp-Dataset-Challenge:信息检索课程的最终项目

文件大小:93.2MB

文件格式:ZIP

更新时间:2024-07-16 20:11:32

Java

Yelp-数据集-挑战 信息检索课程的最终项目 简介 - yelp 数据集挑战赛涉及来自凤凰城、拉斯维加斯、麦迪逊、滑铁卢和爱丁堡的数据,由大约 42153 家企业组成,用户为这些企业提供了他们的提示和评论。 这里的挑战分为 2 个任务。 第一个任务期望通过使用多个用户提供给他们的评论对这些评论进行适当的分类。 第二个任务涉及使用每个企业可用的提示和评论对特定企业进行评级。 预处理 - 原始 Yelp 数据集以 JSON 格式提供。 在这里,我们将 JSON 文件中的信息存储为 Mongo DB 集合,然后将 mongoDB 信息用于这些文件,这有助于我们检索必要的信息并忽略与任务无关的信息。 这些文件稍后会转换为 ARFF 文件格式,因为用于此挑战的机器学习工具采用 ARFF 格式的输入文件。 我们将这个项目分为两个主要任务:1.根据评论文本预测类别 2.根据评论文本预测用户评分


【文件预览】:
Yelp-Dataset-Challenge-master
----Task 1()
--------Input()
--------Dependancies()
--------Output()
--------Code()
----Task 2()
--------Dependancies()
--------Input Files()
--------Code()
--------Output Files()
----ILS Z534 Project Report.pdf(590KB)
----Final Presentation_Team3.pptx(136KB)
----README.md(1KB)
----Preprocessing()
--------csvToArffTask1.java(3KB)
--------mongodbandpythoncode()
--------csvToArffTask2.java(3KB)

网友评论