文件名称:数据挖掘面试题
文件大小:40KB
文件格式:RAR
更新时间:2018-01-08 05:03:37
数据挖掘 数据挖掘面试
一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。 Grubbs’ test(是以Frank E.Grubbs命名的),又叫maximumnormed residual test,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。
【文件预览】:
数据挖掘分析面试题.docx