统计学——中位数、众数

时间:2024-01-29 15:28:09

   2中位

    中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数用Me表示。

   从中位数的定义可知,所研究的数据中有一半小于中位数,一半大于中位数。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。

在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响;如果研究目的就是为了反映中间水平,当然也应该用中位数。在统计数据的处理和分析时,可结合使用中位数。

     中位数的计算:确定中位数,必须将总体各单位的标志值按大小顺序排列,最好是编制出变量数列。这里有两种情况:

     1、对于未分组的原始资料,首先必须将标志值按大小排序。设排序的结果为:

      

     则中位数就可以按下面的方式确定:

     

   例如,根据下表的数据,计算50名工人日加工零件数的中位数。

    

    中位数的位置在(50+1/2 = 25.5,中位数在第25个数值(123)和第26个数值(123)之间,即Me = (123+123)/2=123()

     2由分组资料确定中位数

     由组距数列确定中位数,应先按的公式求出中位数所在组的位置,然后再按下限公式或上限公式确定中位数。

     

     公式中:

         Me——中位数;

         L——中位数所在组下限;

         U——中位数所在组上限;

         fm——为中位数所在组的次数;

        ——总次数;

        d——中位数所在组的组距;

        Sm 1——中位数所在组以下的累计次数;

        Sm + 1——中位数所在组以上的累计次数。

    例:根据上面例表的数据,计算50名工人日加工零件数的中位数。

  解(某企业50名工人加工零件中位数计算表):

     

    由上表可知,中位数的位置=50/2=25,即中位数在120125这一组,L=120Sm − 1 = 16U=125Sm + 1 = 20fm = 14d=5,根据中位数公式得:

    

 

   3

     众数是指一组数据中出现次数最多的那个数据,一组数据可以有多个众数,也可以没有众数。众数是由英国统计学家皮尔生首先提出来的。所谓众数是指社会经济现象中最普遍出现的标志值。从分布角度看,众数是具有明显集中趋势的数值。

    统计上把这种在一组数据中出现次数最多的变量值叫做众数。用Mo表示。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。

     众数的计算:一般情况下,找出一组数据中出现次数最多的数值即可。但若所掌握的资料是组距式数列,则只能按一定的方法来推算众数的近似值。计算公式为:

     

    公式中:

       L——众数所在组下限;

       U——众数所在组上限;

       ——众数所在组次数与其下限的邻组次数之差;

       ——众数所在组次数与其上限的邻组次数之差;

       d——众数所在组组距。

  :根据下表的数据,计算50名工人日加工零件数的众数。

       

     解:从表中的数据可以看出,最大的频数值是14,即众数组为120~125这一组,根据公式得50名工人日加工零件的众数为:

       

       众数是一种位置平均数,是总体中出现次数最多的变量值,因而在实际工作中有时有它特殊的用途。诸如,要说明一个企业中工人最普遍的技术等级,说明消费者需要的内衣、鞋袜、帽子等最普遍的号码,说明农贸市场上某种农副产品最普遍的成交价格等,都需要利用众数。但是必须注意,从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在;如果有两个最高峰点,也可以有两个众数。只有在总体单位比较多,而且又明显地集中于某个变量值时,计算众数才有意义。

       如果一组数据中存在离群值,中位数和众数一般不受离群值的影响,算术平均数容易受到离群值的影响。