统计学之方差分析
方差分析是用于两个及两个以上样本均数差别的显著性检验。方差分析中,由于各种因素的影响,研究所得的数据呈现波动状,这种波动可以分为组间波动和组内波动两种情况。第一组数据第二组数据第三组数据355236147均值:2均值:4均值:6引入三个概念及算法:(1)SST(Sum of squares for total)总离差平方和:数据点...
方差分析(Analysis of Variance,简称ANOVA),是用于两个及两个以上样本均数差别的显著性检验。方差分析中,由于各种因素的影响,研究所得的数据呈现波动状,这种波动可以分为组间波动和组内波动两种情况。
单因素方差分析:
食物1 | 食物2 | 食物3 |
---|---|---|
3 | 5 | 5 |
2 | 3 | 6 |
1 | 4 | 7 |
均值:2 | 均值:4 | 均值:6 |
引入三个概念及算法:
(1)SST(Sum of squares for total)总离差平方和:
所有数据点离均值的距离的平方之和,假设有m组数据,每组n条数据,则自由度为mn-1。
SST=(3-4)²+(2-4)²+(1-4)²+(5-4)²+(3-4)²+(4-4)²+(5-4)²+(6-4)²+(7-4)²=30。
自由度:3x3-1=8。
(2)SSW(Sum of squares within)组内平方和:
各组内数据与组均值距离的平方之和,自由度为m(n-1),因为在一组内知道n-1个点的信息就可以知道第n个点的信息,每组n个数据的自由度就是n-1,共m组,所以自由度为m*(n-1)。
SSW=(3-2)²+(2-2)²+(1-2)²+(5-4)²+(3-4)²+(4-4)²+(5-6)²+(6-6)²+(7-6)²=6。
自由度:3*(3-1)=6。
(3)SSB(Sum of squares between)组间平方和:
其所在组的均值减去总均值的平方和,把每一个组内的点当作这个组的组内均值来计算。自由度为m-1,因为知道m-1个组的均值就可以得到第m个组的均值。
SSB=(2-4)²+(2-4)²+(2-4)²+(4-4)²+(4-4)²+(4-4)²+(6-4)²+(6-4)²+(6-4)²=24。
自由度:3-1=2。
由此可见:SST=SSW+SSB
F统计量假设检验: F统计量是组间平方和同除以其自由度m-1,然后除以组内平方和除以其自由度m(n-1),如果分子比分母大很多,则说明大部分波动来自于各组之间,总体均值之间存在差异。如果这个数字很小,分母更大,则意味着组内波动比组间波动在总波动中占比更多,意味着差异可能是随机产生的。
零假设:吃三种食物对人体没有影响
备选假设:吃三种食物对人体有影响
带入公式:分子:24/2 分母:6/6 结果:12
查f分布表得:3.46(m为SSB自由度,n为SSW自由度)
12远大于3.46,故拒绝原假设,食物对人体是有影响的
双因素方差分析:
因素 | 地区1 | 地区2 | 地区3 | 地区4 | 地区5 | 行均值j |
---|---|---|---|---|---|---|
品牌1 | 365 | 350 | 343 | 340 | 323 | 344.2 |
品牌2 | 345 | 368 | 363 | 330 | 333 | 347.8 |
品牌3 | 358 | 323 | 353 | 343 | 308 | 337 |
品牌4 | 288 | 280 | 298 | 260 | 298 | 284.8 |
列均值i | 339 | 330.25 | 339.25 | 318.25 | 315.5 | 328.45 |
其中:SSR=5*(344.2-328.45)²+5*(347.8-328.45)²5*(337.2-328.45)²5*(284.8-328.45)²=13004.55
SSC=4*(339-328.45)²+4*(330.25-328.45)²+4*(339.25-328.45)²+4*(318.25-328.45)²+4*(315.5-328.45)²=2011.7
SSE计算公式如下:
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)