文件名称:coding-dojo-spark-ml:在Apache Spark上编码Dojo(使用机器学习)
文件大小:5.05MB
文件格式:ZIP
更新时间:2024-06-02 15:29:47
Scala
编码dojo-spark-ml 在Apache Spark上编码Dojo(使用机器学习) 数据集 我们将使用的。 数据集描述如下: 该数据与葡萄牙银行机构的直接营销活动(电话)有关。 分类的目的是预测客户是否将认购定期存款(变量y)。 我们将使用此数据集用于多种目的: 基本操作:计算男女人数,计算平均年龄等。 分类:预测客户是否会订阅 回归:根据其他属性(工作,教育程度等)预测服务对象的年龄 属性信息 输入变量: 银行客户资料: 1-年龄(数字) 2-工作:工作类型(类别:“管理员”,“蓝领”,“企业家”,“女仆”,“管理”,“退休”,“自雇”,“服务”,“学生” ,“技术员”,“待业”,“未知”) 3-婚姻状况:婚姻状况(类别:“离婚”,“已婚”,“单身”,“未知”;注意:“离婚”是指离婚或丧偶) 4-教育(类别:“基本4y”,“基本6y”,“基本9y”,“高中”,“
【文件预览】:
coding-dojo-spark-ml-master
----vagrant()
--------Vagrantfile(3KB)
--------playbook.yml(572B)
--------requirements.yml(43B)
--------roles()
--------README.md(678B)
----dojo-spark-ml()
--------pom.xml(7KB)
--------src()
----.gitignore(329B)
----README.md(3KB)
----slides()
--------img()
--------fonts()
--------index.html(20KB)
--------scripts()