小白初次使用该工具箱,概要记录下过程。
首先需要注意的是,数据集是 “样本的特征” 加上 “标签” 构成的。因此首先应对样本进行特征提取,形成n×m的特征矩阵,然后将标签列于其后,形成n×(m+1)的矩阵
打开classification learner,点击新建会话,从工作区或者文件导入
导入数据后,分6条进行设置
1:选择变量
2:根据个人数据的情况,选择以什么作为变量,因为我每一行是一个样本提取出来的特征,因此以列作为变量。
3:选代表标签的那一列做为 响应
4:选除去标签之外的其他列为训练数据
5:选取验证方式,防止过拟合
6:选择 开始会话
完成设置后,继续操作
1:选择模型
4:选择最终的分类类别
2:点击训练
3:画各种评价指标图