平均值在计量专业和统计学中有着广泛的应用如:描述数据集中趋势、比较不同组数据、评估数据的代表性、决策和判断、回归分析概率统计与财务分析等。此外,在计量专业中,平均值还被广泛应用于各种测量和校准过程中,以确保测量结果的准确性和可靠性。例如,在实验室测量中,多次测量的平均值可以提高测量的精度;在质量控制中,通过计算产品的平均质量水平来评估生产过程的稳定性等。
算数平均数(Mean):
算术平均值为所有数值相加后除以数值的个数,它反映了数据的一般水平。其中,简单平均数(算术平均数)是把所有数值相加,然后用总数除以数值的个数。这种方法假设每个数值具有相同的权重或重要性。简单平均数是反映一组数据的一般水平的重要指标,它利用了所有数据的信息,并且在数学上是使误差平方和达到最小的统计量。
x
ˉ
=
x
1
+
x
2
+
x
3
+
.
.
.
+
x
n
n
=
Σ
i
=
1
n
x
i
n
\bar{x}=\frac{x_{1}+x_{2}+x_{3}+...+x_{n}}{n}=\frac{\Sigma^{n}_{i=1}x_{i}}{n}
xˉ=nx1+x2+x3+...+xn=nΣi=1nxi 衍生公式(如计算方差时用到):
V
a
r
i
a
n
c
e
=
1
n
∑
i
=
1
n
(
x
i
−
A
M
)
2
Variance = \frac{1}{n} \sum_{i=1}^{n} (x_i - AM)^2
Variance=n1∑i=1n(xi−AM)2
A
M
=
1
n
∑
i
=
1
n
x
i
AM = \frac{1}{n} \sum_{i=1}^{n} x_i
AM=n1∑i=1nxi,其中 :
*
n
n
n :数据的数量
*
x
i
x_i
xi :每个数据点。
建立样品数据:
name <- c("大天二", "陈浩南", "刘亦菲", "山鸡", "蕉皮", "洪满天",
"刘华强", "马大脚", "奥利给", "大金刚", "马里奥", "GGBond",
"菲菲", "刘老二")
gender <- c("男", "女", "男", "女", "女", "男", "男", "女",
"男", "男", "女", "女", "男", "女")
stat <- c(11, 12, 15, 85, 76, 45, 78, 99, 64, 10, 73, 74, 82, 72)
math <- c(44, 67, 82, 91, 45, 23, 1, 98, 23, 45, 24, 30, 75, 69)
econ <- c(99, 85, 79, 68, 49, 79, 88, 92, 93, 94, 89, 84, 46, 77)
student_data <- data.frame(姓名=name, 性别=gender, 统计学=stat,数学=math, 经济学=econ)
print(student_data)
计算统计学的平均分数:
simple_mean <- mean(student_data$统计学)
print(simple_mean)
# 输出: 56.85714
平均值在以下情况下可以作为最佳估约值:
- 数据分布均匀:当数据集中的数值分布相对均匀,没有明显的极端值时,平均值能够较好地代表整体数据的中心趋势。
- 大样本量:当样本量足够大时,平均值受个别极端值的影响会相对较小,因此更能准确地反映数据的整体情况。
- 对称分布:对于对称分布的数据集(如正态分布),平均值是描述数据中心位置的最佳选择。
但需要注意的是,在数据存在极端值或分布严重偏斜的情况下,平均值可能不是最佳的估约值(比如存在系统误差)。在这种情况下,中位数或众数可能更能代表数据的中心趋势。因此,在选择使用平均值作为估约值时,需要综合考虑数据的分布特点和具体应用场景。
加权算数平均值
在计算平均数时,给每个数据赋予一个权重,以反映数据的重要性。每个数据与其对应的权重相乘,然后将所得的乘积求和,再除以所有权重的总和。加权平均数能够更准确地反映数据的实际重要性,特别是在数据点的重要性或频率不均匀分布的情况下。
x
ˉ
=
m
1
f
1
+
m
2
f
2
+
m
3
f
3
+
.
.
.
+
m
k
f
k
f
1
+
f
2
+
f
3
+
.
.
.
+
f
k
=
Σ
i
=
1
k
m
i
f
i
n
\bar{x}=\frac{m_{1}f_{1}+m_{2}f_{2}+m_{3}f_{3}+...+m_{k}f_{k}}{f_{1}+f_{2}+f_{3}+...+f_{k}}=\frac{\Sigma_{i=1}^{k}m_{i}f_{i}}{n}
xˉ=f1+f2+f3+...+fkm1f1+m2f2+m3f3+...+mkfk=nΣi=1kmifi *
x
ˉ
\bar{x}
xˉ:表示加权平均值。
* m i m_i mi:表示第 i i i个测量值或数据点。
* f i f_i fi:表示与第 i i i个测量值相关联的权重(或称为频数)。
* k k k:表示测量值的数量。
* n n n:表示所有权重的总和,即 n = f 1 + f 2 + f 3 + . . . + f k n = f_1 + f_2 + f_3 + ... + f_k n=f1+f2+f3+...+fk。
* Σ i = 1 k \Sigma_{i=1}^{k} Σi=1k:表示从 i = 1 i=1 i=1到 i = k i=k i=k的求和符号。
* m 1 f 1 + m 2 f 2 + m 3 f 3 + . . . + m k f k m_{1}f_{1} + m_{2}f_{2} + m_{3}f_{3} + ... + m_{k}f_{k} m1f1+m2f2+m3f3+...+mkfk:这部分是测量值与对应权重的乘积之和。它表示了每个测量值根据其权重对总和的贡献。
* f 1 + f 2 + f 3 + . . . + f k f_{1} + f_{2} + f_{3} + ... + f_{k} f1+f2+f3+...+fk:这是所有权重的总和,也称为 n n n。它用于标准化上述乘积之和,以确保加权平均值在合理的范围内。
因此,加权平均值 x ˉ \bar{x} xˉ是测量值与权重乘积之和除以权重之和。这反映了每个测量值根据其权重对平均值的贡献。
在计量专业中加权算数平均值的计算公式为:
x w = Σ i = 1