【样本标准差计算公式】在统计学中,标准差是衡量一组数据离散程度的重要指标。而样本标准差则是用于描述从总体中抽取的样本数据波动情况的统计量。与总体标准差不同,样本标准差在计算时需要进行一定的调整,以更准确地估计总体的标准差。
一、样本标准差的基本概念
样本标准差(Sample Standard Deviation)是反映样本数据与其均值之间偏离程度的统计量。它通过计算每个数据点与样本均值的差的平方,再求平均后开平方得到。
由于样本数据通常只是总体的一部分,为了更准确地估计总体标准差,样本标准差在计算时使用的是“无偏估计”,即分母为 $ n - 1 $(而不是 $ n $),其中 $ n $ 是样本容量。
二、样本标准差的计算公式
样本标准差的计算公式如下:
$$
s = \sqrt{\frac{1}{n - 1} \sum_{i=1}^{n} (x_i - \bar{x})^2}
$$
其中:
- $ s $ 表示样本标准差
- $ x_i $ 表示第 $ i $ 个数据点
- $ \bar{x} $ 表示样本均值
- $ n $ 表示样本容量
- $ \sum $ 表示求和符号
三、计算步骤总结
| 步骤 | 操作说明 |
| 1 | 计算样本均值 $ \bar{x} $:将所有数据相加,除以样本容量 $ n $ |
| 2 | 计算每个数据点与均值的差 $ x_i - \bar{x} $ |
| 3 | 将每个差值平方 $ (x_i - \bar{x})^2 $ |
| 4 | 对所有平方差求和 $ \sum (x_i - \bar{x})^2 $ |
| 5 | 将总和除以 $ n - 1 $,得到方差 |
| 6 | 对方差开平方,得到样本标准差 $ s $ |
四、示例说明
假设有一组样本数据:$ 5, 7, 8, 10, 12 $
1. 计算均值:
$$
\bar{x} = \frac{5 + 7 + 8 + 10 + 12}{5} = \frac{42}{5} = 8.4
$$
2. 计算每个数据点与均值的差并平方:
| 数据点 $ x_i $ | 差 $ x_i - \bar{x} $ | 平方 $ (x_i - \bar{x})^2 $ |
| 5 | -3.4 | 11.56 |
| 7 | -1.4 | 1.96 |
| 8 | -0.4 | 0.16 |
| 10 | 1.6 | 2.56 |
| 12 | 3.6 | 12.96 |
3. 求和:
$$
\sum (x_i - \bar{x})^2 = 11.56 + 1.96 + 0.16 + 2.56 + 12.96 = 29.2
$$
4. 计算方差:
$$
\text{方差} = \frac{29.2}{5 - 1} = \frac{29.2}{4} = 7.3
$$
5. 计算样本标准差:
$$
s = \sqrt{7.3} \approx 2.70
$$
五、总结
样本标准差是评估数据分布离散程度的重要工具,尤其适用于无法获取全部总体数据的情况。通过上述公式和步骤,可以系统地计算出样本标准差,并据此分析数据的稳定性与波动性。在实际应用中,理解并正确使用样本标准差对于数据分析和决策具有重要意义。


