物理实验引发的思考：总体标准偏差和样本标准偏差的区别是什么？标准偏差和标准误的区别是什么？

一、有偏估计和无偏估计假设我们测量了变量xxx，测得的结果是x1,x2,⋯ ,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn。令xˉ\bar xxˉ是它们的算术平均值，μ\muμ是xxx的真实值。我们使用标准（偏）差（Standard Deviation）来度量数据分布的分散程度。标准差越大，数据分布越离散，反之越集中。我们在小学/初中学过标准差的计算公式σ=∑i=1N(xi−

seh_sjlj

10905人浏览 · 2022-03-14 15:50:15

seh_sjlj · 2022-03-14 15:50:15 发布

一、总体标准偏差和样本标准偏差

假设我们测量了变量 $x$ ，测得的结果是 $x_1,x_2,\cdots,x_n$ 。令 $\bar x$ 是它们的算术平均值， $\mu$ 是 $x$ 的真实值。

我们使用标准（偏）差（Standard Deviation）来度量数据分布的分散程度。标准差越大，数据分布越离散，反之越集中。

我们在小学/初中学过标准差的计算公式 $\sigma=\sqrt{\frac{\sum_{i=1}^{N}(x_i-\mu)^2}{N}}$ 其中 $\mu$ 是总体的平均值。但是物理实验中采用的是 $S=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar x)^2}{n-1}}$ 其中 $\bar x$ 是样本的平均值。那为什么分母变成 $n - 1$ 了呢？包括我在内的很多人都不理解。

实际上， $\sigma$ 叫做总体标准偏差（Population Standard Deviation），而 $S$ 叫做样本标准偏差（Sample Standard Deviation），是两种不同的标准偏差。它们的区别何在？总体标准偏差就是你已经知道了所有的数据，比如班级的成绩，然后你要计算它的离散程度。这在物理测量当中是不可能出现的，因为你可以测量无限次。样本标准偏差就是你要用一些数据（样本）来估计整体情况，相当于以偏概全。物理实验中就是这样一种情况，你测得一组数据，然后用这组数据近似表示真实值。在这种情形下，如果我们测得一组数据 $x_1,x_2,\cdots,x_n$ ，用总体标准偏差 $\sigma$ 来表征离散程度的话，就出现问题了：总体平均值，也就是真实值 $\mu$ ，我们是不知道的。那我们用 $\bar x$ 代替 $\mu$ ，就会导致：我们计算的是 $x_1,x_2,\cdots,x_n$ 围绕样本的平均值 $\bar x$ 的离散程度，而不是围绕真实值 $\mu$ 的离散程度。对于一组数 $x_1,x_2,\cdots,x_n$ 和一个变量 $t$ ，令 $f(t)=\sum\limits_{i=1}^n(x_i-t)^2$ ，这是一个开口向上的二次函数，在 $t=-\frac{b}{2a}=\frac{\sum\limits_{i=1}^n2x_i}{2n}=\frac{\sum\limits_{i=1}^nx_i}{n}=\bar x$ 的时候取得最小值。也就是说， $\sum\limits_{i=1}^n(x_i-\bar x)^2\le\sum\limits_{i=1}^n(x_i-\mu)^2$ 。这就意味着，我们低估了数据的离散程度。我们需要将分母改为 $n - 1$ ，来稍稍增大偏差的值。

那为什么是 $n - 1$ 呢？纯统计学的严格证明颇为复杂，但我们可以用一种别样的思考方式。现在我们获得的样本有 $n$ 个测量结果，就是有 $n$ 条独立的信息。我们已经知道 $\bar x$ ，如果再知道 $x_1-\bar x,x_2-\bar x,\cdots,x_{n-1}-\bar x$ ，那 $x_n-\bar x$ 自然就知道了。现在我们把这些偏差的平方加起来，应该只有 $n - 1$ 条独立的信息，所有除以 $n - 1$ 才说得通。专业的名词叫做有 $n - 1$ 个“自由度”。

其实到这里你也许还是没有理解。是的，我也没有理解。在系统学习统计学之前是不可能理解的。但是很多人对采用 $n - 1$ 作为分母的说法是“约定俗成的”，即用 $n - 1$ 更符合统计规律。所以我们也不用在乎那么多了，记住在物理实验的时候用 $n - 1$ 作为分母来算标准偏差就好了。

最后，我想说的是，当 $n\to\infty$ 的时候，即测量无限次，那 $\bar x$ 就是 $\mu$ ， $\sigma$ 和 $S$ 的比值就会趋近于 $1$ ，这时总体标准偏差和样本标准偏差就是一回事了。

二、标准偏差和标准误

还是讨论物理实验中的问题。我们刚才讲了标准偏差（Standard Deviation），它的公式是 $S=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar x)^2}{n-1}}$ 关于分母为什么是 $n - 1$ 就已经够让我们头疼了，现在又冒出来一个标准误（Standard Error of Mean），这玩意又是什么呢？

标准误的含义用来估计样本平均值和真实值有多少差异的，用 $\sigma_{\bar x}$ 表示。例如， $\bar x=0.370$ ， $\sigma_{\bar x}=0.002$ ，那么测量结果就写成 $0.370\pm0.002$ 。

对于标准偏差和标准误的区别，知乎上有一个我感觉很好的解释：在这里插入图片描述
举个栗子，现在我们测量了 $200$ 次，分为 $20$ 组，每组 $10$ 个数取一个平均值，那这 $20$ 个平均值的标准偏差就是这 $200$ 个数据的标准误。

标准误的计算公式是 $\sigma_{\bar x}=\frac{S}{\sqrt n}=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar x)^2}{n(n-1)}}$
为什么要除以 $\sqrt n$ 呢？我们考虑 $n\bar x=x_1,x_2\cdots,x_n$ 的标准偏差，而 $x_1,x_2\cdots,x_n$ 是相互独立的，所以它们的标准偏差都等于 $S$ ，其中 $S$ 是 $x$ 的标准偏差。那么 $\sigma_{n\bar x}^2=nS^2$ ，即 $n^2\sigma_{\bar x}^2=nS^2$ ， $\sigma_{\bar x}=\frac{S}{\sqrt n}$ 。