文件名称:Data_Mining_Project:ITC数据科学课程中数据挖掘项目的存储库
文件大小:5.78MB
文件格式:ZIP
更新时间:2024-04-18 13:10:05
Python
数据挖掘项目 这是ITC数据科学课程的数据挖掘项目的回购。 描述 该项目的目的是从ebay提取数据并进行分析。 抓取工具会接收CLI参数。 输入: 搜索字词(str)-输入要搜索的字词,并用空格隔开(将脚本作为列表输入)。 如果搜索键超过一个单词,请在它们之间使用“ _”。 -p /-pages标志(int)-输入每个搜索词要搜索的页面数。 输入模式:$ python WebScraping.py search_key1 search_key2 ... -p page_num 输出:该程序为每个搜索词打印以下内容:产品类别,产品标题,价格,供应商所在的国家/地区,运输成本和条件,卖方名称,卖方反馈分数和卖方积极反馈百分比。 所有价格均为以色列谢克尔(即NIS或ILS)。 该程序还可以将数据存储在预定义的数据库中,如下所示: 产品表-包括单个产品数据。 列: product_i