方差分析(Analysis of Variance,简称ANOVA),是用于两个及两个以上样本均数差别的显著性检验。方差分析中,由于各种因素的影响,研究所得的数据呈现波动状,这种波动可以分为组间波动和组内波动两种情况。
单因素方差分析:

食物1食物2食物3
355
236
147
均值:2均值:4均值:6

引入三个概念及算法:
(1)SST(Sum of squares for total)总离差平方和:
所有数据点离均值的距离的平方之和,假设有m组数据,每组n条数据,则自由度为mn-1。
SST=(3-4)²+(2-4)²+(1-4)²+(5-4)²+(3-4)²+(4-4)²+(5-4)²+(6-4)²+(7-4)²=30。
自由度:3x3-1=8。
(2)SSW(Sum of squares within)组内平方和:
各组内数据与组均值距离的平方之和,自由度为m
(n-1),因为在一组内知道n-1个点的信息就可以知道第n个点的信息,每组n个数据的自由度就是n-1,共m组,所以自由度为m*(n-1)。
SSW=(3-2)²+(2-2)²+(1-2)²+(5-4)²+(3-4)²+(4-4)²+(5-6)²+(6-6)²+(7-6)²=6。
自由度:3*(3-1)=6。
(3)SSB(Sum of squares between)组间平方和:
其所在组的均值减去总均值的平方和,把每一个组内的点当作这个组的组内均值来计算。自由度为m-1,因为知道m-1个组的均值就可以得到第m个组的均值。
SSB=(2-4)²+(2-4)²+(2-4)²+(4-4)²+(4-4)²+(4-4)²+(6-4)²+(6-4)²+(6-4)²=24。
自由度:3-1=2。

由此可见:SST=SSW+SSB

F统计量假设检验: F统计量是组间平方和同除以其自由度m-1,然后除以组内平方和除以其自由度m(n-1),如果分子比分母大很多,则说明大部分波动来自于各组之间,总体均值之间存在差异。如果这个数字很小,分母更大,则意味着组内波动比组间波动在总波动中占比更多,意味着差异可能是随机产生的。
即F-statistic=
零假设:吃三种食物对人体没有影响
备选假设:吃三种食物对人体有影响
带入公式:分子:24/2 分母:6/6 结果:12
查f分布表得:3.46(m为SSB自由度,n为SSW自由度)
12远大于3.46,故拒绝原假设,食物对人体是有影响的
在这里插入图片描述
双因素方差分析:

因素地区1地区2地区3地区4地区5行均值j
品牌1365350343340323344.2
品牌2345368363330333347.8
品牌3358323353343308337
品牌4288280298260298284.8
列均值i339330.25339.25318.25315.5328.45

在这里插入图片描述
在这里插入图片描述
其中:SSR=5*(344.2-328.45)²+5*(347.8-328.45)²5*(337.2-328.45)²5*(284.8-328.45)²=13004.55
SSC=4*(339-328.45)²+4*(330.25-328.45)²+4*(339.25-328.45)²+4*(318.25-328.45)²+4*(315.5-328.45)²=2011.7
SSE计算公式如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐