最近在工作中需要用到数据分析,发现上学期间学过的丁点统计学知识基本都遗忘了,于是在网易公开课里找了一门统计学的课程学习,顺便把每次的学习成果记录下来,希望对同样在学习数据分析的小伙伴有所帮助。
首先介绍下平均数、中位数和众数。
一般情况下,我们观察一组数据的平均水平,需要借助于平均数、中位数和众数三个统计量。
(1)平均数
a、算数平均数,一般我们讲的平均数即算数平均数,计算起来很简单,就是将一组数据中所有数据求和后再除以这组数据的个数就能得到。计算公式为:
除此之外还有几何平均数、调和平均数、加权平均数、平方平均数和指数平均数。
b、几何平均数,是将一组数据中所有数据求乘积后再求n次方根。计算公式为:
几何平均数多用于计算平均比率和平均速度。如:平均利率、平均发展速度、平均合格率等。
几何平均数的计算举例:
假定某地储蓄年利率(按复利计算):5%持续1.5年,3%持续2.5年,2.2%持续1年。请问此5年内该地平均储蓄年利率。该地平均储蓄年利率:
C、调和平均数,又称为倒数平均数,主要是用来解决在无法掌握总体单位数(频数)的情况下,只有每组的变量值和相应的标志总量,而需要求得平均数的情况下使用的一种数据方法。是总体各统计变量倒数的算术平均数的倒数,分为简单平均式和加权平均式。
调和平均数与算术平均数的举例分析:
例一 水果甲级每元1公斤,乙级每元1.5公斤,丙级每元2公斤。问:
(1)若各买1公斤,平均每元可买多少公斤?
(2)各买6.5公斤,平均每元可买多少公斤?
(3)甲级3公斤,乙级2公斤,丙级1公斤,平均每元可买几公斤?
(4)甲乙丙三级各买1元,每元可买几公斤?
d、加权平均数,是具有不同比重的数据(或平均数)的算术平均数。
比重也称为权重,数据的权重反映了该变量在总体中的相对重要性,每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。依据各个数据的重要性系数(即权重)进行相乘后再相加求和,就是加权和。加权和与所有权重之和的比等于加权算术平均数。加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。
加权算术平均数的计算,根据分组整理的数据计算的算术平均数。其计算公式为:
e、平方平均数,又名均方根,是指一组数据的平方的平均数的算术平方根。应用在一些具有一定体积的物体的边长、直径、半径等资料上。其计算公式为:
f、指数平均数,也叫EXPMA指标,是一种趋向类指标,其构造原理是对股票价格收盘价进行算术平均,并根据计算结果来进行分析,用于判断价格未来走势的变动趋势。
与MACD指标、DMA指标相比,EXPMA指标由于其计算公式中着重考虑了价格当天(当期)行情的权重,因此指标自身的计算公式决定了作为一类趋势分析指标,它在使用中克服了MACD指标信号对于价格走势的滞后性。同时也在一定程度中消除了DMA指标在某些时候对于价格走势所产生的信号提前性,是一个非常有效的分析指标。
我们先来看一下EXPMA指标的计算公式,并以此对指标的特征作进一步的了解:
EXPMA=(当日或当期收盘价-上一日或上期EXPMA)/N+上一日或上期EXPMA,其中,首次上期EXPMA值为上一期收盘价,N为天数。