文件名称:Barnes-and-Noble
文件大小:322KB
文件格式:ZIP
更新时间:2024-07-28 12:50:03
Python
Barnes and Noble 数据挖掘项目 这是我们 CSE 597A 课程项目的存储库。 数据集文件名:book_data_1225.csv 在这个新数据集中,收集了 1225 本独特的书籍。 添加了很多功能,但不会太多,如果你用 Excel 打开数据集,它会爆炸。 就目前而言,当您将数据集输入机器学习算法时,请使用两组特征: 第 1 组: 3、4、5、6、7、8、10、11 第 2 组:第 1 组 + 12 ~134 两者都针对功能 1 下面是数据说明: 我们在这个数据集中有 134 个特征。 评级:这是目标,你们可能都知道。 标题:就目前而言,我们不会将此功能包含在我们的机器学习算法测试中。 但是我会给你的下一个数据集(在接下来的几天内?)将有一个基于标题的词袋转换。 价格:是的,价格。 Nook:本书是否自带Nook(电子书)版本。 音频:本书是否自带
【文件预览】:
Barnes-and-Noble-master
----book_sampling.py(921B)
----README.md(2KB)
----scrape_batch_books.py(705B)
----scrape_batch_books.pyc(964B)
----scrape_one_book.pyc(2KB)
----scrape_one_book.py(2KB)
----data()
--------book_data.csv(165KB)
--------data_descrption.txt(399B)
--------publishers_encode.txt(6KB)
--------data_description.docx(138KB)
--------book_urls_1205.txt(277KB)
--------book_data_1225.csv(403KB)
--------sampling_urls.txt(8KB)
--------book_urls.txt(54KB)