前言
在做数据分析时常常用到两个概念:精度(Precision)和准确度(Accuracy)。这两个词可以在口语中作为同义词使用,但它们在科学方法背景下是完全不同的。其具体意义是怎样的,在科学研究中需要深究,以免报告交流时产生错用的尴尬。
来自Wiki中的定义
Accuracy:指在一定实验条件下多次测定的平均值与真值相符合的程度,以误差来表示,用来表示系统误差的大小。
Precision:是随机误差的描述,是统计变异性的度量。是多次重复测定同一量时各测定值之间彼此相符合的程度。表征测定过程中随机误差的大小。
ISO 5725-1,定义“Accuracy”用于描述测量与真实值的接近程度。 当该术语被应用于相同测量的测量集时,它涉及随机误差的分量和系统误差的分量。 在这种情况下,actual (true)值是一组测量结果的均值与实际(真实)值的接近程度,精度是一组结果之间的一致性。
简单说,给定一组测量的数据点(比如多次测量一段直线的长度),如果这些值接近被测量的平均值,则可以说这组数据是精确的;如果这组数据接近被测量的真实值,则可以说测量是精确的。这两个概念是彼此独立的,因此一组特定的数据可以说是准确的,或是精确的,或两者都是,或两者都不是。
图:Accuracy是测量结果与真实值的接近度,precision是重复性测量误差。
进一步解释
在科学,工程和统计领域,测量系统的准确度是数次测量值与该真实值的接近程度。测量系统的精度与重现性和重复性有关,是在不变条件下重复测量结果相同的程度。
测量系统可以是准确的,但不精确,也可以是精确但不准确的,··· ···。例如,如果实验包含系统误差,则增加样本数量通常会提高精度,但不会提高准确度。消除系统误差可以提高准确度,但不会改变精度。如果一个测量系统既准确又精确,则被认为是有效的。
除了精度和精度外,测量还可能具有测量分辨率。测量分辨率是在测量中响应物理量的最小变化的度量,可以用精度表示。
这四个射击点点阐述了accurate和precise的区别
参考
https://en.wikipedia.org/wiki/Accuracy_and_precision
http://blog.csdn.net/luo123n/article/details/50754104
http://f.dataguru.cn/forum.php?mod=viewthread&action=printable&tid=708550
https://celebrating200years.noaa.gov/magazine/tct/tct_side1.html