研究生2年期间自学的机器学习,通过各种视频,博客和论文,唯独缺少一本系统学习的书。开始拿起西瓜书啃。分章节写成读书笔记,怕忘的太多,所以记录一个知识框架用来回忆。
第二章是经验评估,讲的是如何评估模型的好坏。从正确率上考虑,引出了二范数的代价函数(cost function)。从性能上考虑,引出了查全率(recall)和查准率(precision),查全率也有个熟悉的名字叫召回率。然后从查全率(R)和查准率(P)引出了评估模型性能的几个算法——F1、ROC与AUC,又有R、P进一步引出了代价敏感误差率,这个代价敏感误差率比之前的由P、R得出F1啊,ROC啊AUC啊多考虑了不同的错误会带来不同的后果。因为之前只是统计上的结论。
未完待续,睡觉。