1 误差

真值定义为:

在某一时刻和某一状态下,某量的客观值或实际值。

真值一般是未知的;相对意义上来说,真值又是已知的。

误差定义为:

试验中获得的试验值与它的客观真实值在数值上的不一致。

1.1 绝对误差

绝对误差(absolute error) 定义为:

绝对误差 = 试验值 - 真值,
Δ x = x − x t . \Delta x = x - x_t. Δx=xxt.

当真值未知,绝对误差也未知时,可以用下式估计出绝对误差的范围:

∣ Δ x ∣ = ∣ x − x t ∣ ≤ ∣ Δ x ∣ max ⁡ , \lvert \Delta x \rvert = \lvert x-x_t \rvert \leq \lvert \Delta x \rvert_{\max}, Δx=xxtΔxmax,

x t ≈ x ± ∣ Δ x ∣ max ⁡ , x_t \approx x \pm \lvert \Delta x \rvert_{\max}, xtx±Δxmax,
其中 ∣ Δ x ∣ max ⁡ \lvert \Delta x \rvert_{\max} Δxmax 称为绝对误差限绝对误差上界

1.2 相对误差

相对误差(relative error) 定义为:

相对误差 = 绝对误差 / 真值,
E R = Δ x x t = x − x t x t . E_R = \frac{\Delta x}{x_t} = \frac{x - x_t}{x_t}. ER=xtΔx=xtxxt.

若真值未知,则常将 Δ x \Delta x Δx 与试验值或平均值之比作为相对误差:

E R ≈ Δ x x , E_R \approx \frac{\Delta x}{x}, ERxΔx,

E R = Δ x x ˉ . E_R = \frac{\Delta x}{\bar{x}}. ER=xˉΔx.

同样的,可以估计出相对误差的大小范围:

∣ E R ∣ = ∣ Δ x x t ∣ ≤ ∣ Δ x x t ∣ max ⁡ , \left \lvert E_R \right \rvert =\left \lvert \frac{\Delta x}{x_t} \right \rvert \leq \left \lvert \frac{\Delta x}{x_t} \right\rvert_{\max}, ER=xtΔxxtΔxmax,

x t = x ( 1 ± ∣ E R ∣ ) . x_t = x \left(1 \pm \left\lvert E_R \right\rvert \right). xt=x(1±ER).
其中 ∣ Δ x x t ∣ max ⁡ \left\lvert \frac{\Delta x}{x_t} \right\rvert_{\max} xtΔxmax 称为相对误差限相对误差上界

相对误差常常表示为百分数(%)或千分数(‰)。

1.3 算术平均误差

算术平均误差(average discrepancy) 定义为:

Δ = ∑ i = 1 n ∣ x i − x ˉ ∣ n = ∑ i = 1 n ∣ d i ∣ n , \Delta = \frac{\sum_{i=1}^{n} \left\lvert x_i - \bar{x} \right\rvert}{n} = \frac{\sum_{i=1}^{n} \left\lvert d_i \right\rvert}{n}, Δ=ni=1nxixˉ=ni=1ndi,
其中 d i d_i di 是试验值 x i x_i xi 与算术平均值 x ˉ \bar{x} xˉ 之间的偏差。

算术平均误差可以反映一组试验数据的误差大小。

1.4 标准误差

标注误差(standard error) 定义为:

当试验次数 n n n 无穷大时,总体标准差:
σ = ∑ i = 1 n ( x i − x ˉ ) 2 n = ∑ i = 1 n x i 2 − ( ∑ i = 1 n x i ) 2 / n n . \sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n}} = \sqrt{\frac{\sum_{i=1}^{n}x_i^2 - (\sum_{i=1}^{n} x_i)^2 / n}{n}}. σ=ni=1n(xixˉ)2 =ni=1nxi2(i=1nxi)2/n .
当试验次数为有限次时,样本标准差:
s = ∑ i = 1 n d i 2 n − 1 = ∑ i = 1 n ( x i − x ˉ ) 2 n − 1 = ∑ i = 1 n x i 2 − ( ∑ i = 1 n x i ) 2 / n n − 1 . s = \sqrt{\frac{\sum_{i=1}^{n} d_i^2}{n-1}} = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}} = \sqrt{\frac{\sum_{i=1}^{n}x_i^2-(\sum_{i=1}^{n}x_i)^2/n}{n-1}}. s=n1i=1ndi2 =n1i=1n(xixˉ)2 =n1i=1nxi2(i=1nxi)2/n .

标准差表示试验值的精密度,标准差 ↓ \bm{\downarrow} ,试验数据精密度 ↑ \bm{\uparrow}

推导:(补充)
σ = ∑ i = 1 n ( x i − x ˉ ) 2 n = ∑ i = 1 n ( x i 2 − 2 x i x ˉ + x ˉ 2 ) n = ∑ i = 1 n x i 2 − ∑ i = 1 n 2 x i x ˉ + ∑ i = 1 n x ˉ 2 n = ∑ i = 1 n x i 2 − 2 x ˉ ∑ i = 1 n x i + n x ˉ 2 n = ∑ i = 1 n x i 2 − 2 x ˉ n x ˉ + n x ˉ 2 n = ∑ i = 1 n x i 2 − n x ˉ 2 n = ∑ i = 1 n x i 2 − ( ∑ i = 1 n x i ) 2 / n n . \begin{aligned} \sigma &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n}} \\ &= \sqrt{\frac{\sum_{i=1}^{n}(x_i^2-2x_i\bar{x}+\bar{x}^2)}{n}} \\ &= \sqrt{\frac{\sum_{i=1}^{n}x_i^2-\sum_{i=1}^{n}2x_i\bar{x}+\sum_{i=1}^{n}\bar{x}^2}{n}} \\ &= \sqrt{\frac{\sum_{i=1}^{n}x_i^2-2\bar{x}\sum_{i=1}^{n}x_i+n\bar{x}^2}{n}} \\ &= \sqrt{\frac{\sum_{i=1}^{n} x_i^2 - 2\bar{x}n\bar{x}+n\bar{x}^2}{n}} \\ &= \sqrt{\frac{\sum_{i=1}^{n}x_i^2 - n\bar{x}^2}{n}} \\ &= \sqrt{\frac{\sum_{i=1}^{n}x_i^2 - (\sum_{i=1}^{n} x_i)^2 / n}{n}}. \end{aligned} σ=ni=1n(xixˉ)2 =ni=1n(xi22xixˉ+xˉ2) =ni=1nxi2i=1n2xixˉ+i=1nxˉ2 =ni=1nxi22xˉi=1nxi+nxˉ2 =ni=1nxi22xˉnxˉ+nxˉ2 =ni=1nxi2nxˉ2 =ni=1nxi2(i=1nxi)2/n .

1.5 误差来源

试验数据误差主要分为随机误差、系统误差和过失误差。

1.5.1 随机误差

随机误差(random error)

  • 定义:以不可预知的规律变化着的误差,绝对误差时正时负,时大时小。
  • 产生原因:偶然因素。
  • 特点:具有统计规律。
    • 小误差比大误差出现机会多。
    • 正、负误差出现的次数近似相等。
    • 当试验次数足够多时,误差的平均值趋向于零
    • 可以通过增加试验次数减小随机误差。
    • 随机误差不可完全避免。

1.5.2 系统误差

系统误差(systematic error)

  • 定义:一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差。
  • 产生原因:多方面。
  • 特点:
    • 系统误差大小及其符号在同一试验中是恒定的
    • 它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小。
    • 只要对系统误差产生的原因有了充分的认识,才能对它进行校正,或设法消除。

1.5.3 过失误差

过失误差(mistake)

  • 定义:一种显然与事实不符的误差。
  • 产生原因:实验人员粗心大意造成。
  • 特点:
    • 可以完全避免。
    • 没有一定规律。

【参考】

  1. 课程老师的 PPT.

【修改记录】

时间内容
2022年4月12日15:45:11样本标准差 S S S 改为 s s s
Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐