【文件属性】:
文件名称:matlabauc代码-CSE-847-Homework4:CSE-847-家庭作业4
文件大小:1.47MB
文件格式:ZIP
更新时间:2021-05-24 10:14:04
系统开源
Matlab的耳语CSE
847家庭作业4报告
姓名:易卜拉欣·艾哈迈德(Ibrahim
Ahmed)
NetID:ahmedibr
点击这里包含Matlab代码和图形。
问题1:逻辑回归:实验
根据所进行的实验,可以清楚地看到,随着您增加进入Logistic回归分类器的样本数量,测试准确性就越高。
这似乎是合乎逻辑的,因为构成数据集的模式在具有更多样本的情况下更具代表性。
样本越多,模型可以推广的越好。
在下面,您可以找到模型的测试准确性,该准确性是训练时使用的样本数的函数。
随着我们包括越来越多的样本,这种趋势呈明显的上升趋势。
问题2:稀疏Logistic回归:实验
根据进行的实验,理想的正则化参数为0.1
。
较大的正则化参数会导致AUC降级,并且0或0的性能也很差。
此外,等于1的正则化参数正好等于50%的测试准确度。
这是有道理的,因为测试数据包含74个阳性样品和74个阴性样品。
该模型始终预测为0,这将正确分类一半样本。
下图说明了精度与l1正则化参数的关系。
在分析使用的功能数量时,实验还揭示了一个非常有趣的模式。
显然,根据模型,此数据集中只有约15-20个特征相关。