x2检验的用途


x2检验的用途

文章插图
一、卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等 。
二、卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合 。
三、X2检验的基本原理是假设各个样本来自同一属性的总体,各组中实际数之间的差别仅仅由于抽样误差造成的;通过分别计算各组实际数与理论数的离散情况,求得总的误差X2值,从而测定假设存在的概率,即可能性 P 。
如果假设成立,那么X2值就不会很大,而保持在一定范围内,相应的 P值就大于 5%(P>0.05),即仅仅由于抽样误差而造成样本之间这么大小差别的可能性大于5%,说明各样本间的差别本质上无明显差异,它们来之于同一属性的总体,假设被肯定 。
反过来说,如果推算出的X2值很大,而超出了一定范围,相应的P值就小于 5%或1%,即由于抽样误差造成样本之间如此大的差别的可能性小于5%或1%;说明各组间差别不是由于抽样造成的,可能两者的确有差别,它们不是来之于同一属性的总体,假设被否定 。
扩展资料:
如果性别和化妆与否没有关系,四个格子应该是括号里的数(期望值,用极大似然估计55=100*110/200,其中110/200可理解为化妆的概率,乘以男人数100,得到男人化妆概率的似然估计),这和实际值(括号外的数)有差距,理论和实际的差距说明这不是随机的组合 。
注:独立四格表的拟合度公式可以写成n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d)
【x2检验的用途】总结:独立四格表资料检验
四格表资料的卡方检验用于进行两个率或两个构成比的比较 。
1、专用公式:
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),(或者使用拟合度公式)
自由度v=(行数-1)(列数-1)=1
2、应用条件:
要求样本含量应大于40且每个格子中的理论频数不应小于5 。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率 。
参考资料来源:百度百科-卡方检验
x2检验的基本公式是x2=∑[(fo—fc)2/fc],fo表示实际所得的次数,fc表示由假设而定的理论次数,∑为加总符号 。x2检验对于定类与定类或定类与定序变量之间的相关检验应用较多 。
相关检验又称独立性检验 。进行相关检验时,要先根据交互分类表中的边缘次数分配来计算出各格中的理论次数fcij 。计算理论次数的一般公式为:fcij=Fxi·Fyi/n式中,Fxi表示x变量各类别的边缘次数分配,Fyj表示y变量各类别的边缘次数分配,n为总次数 。
χ2检验的基本公式为:χ2=∑(A-T)2/T;χ2值反映了实际频数和理论频数之间的吻合程度 。若H0成立,则A与T相差不应该很大,即χ2统计量不应该很大 。
A与T相差越大,χ2值越大,相应的P值越小 。若P≤α,则A与T相差较大,有理由认为无效假设不成立,从而拒绝H0,接受H1 。
性质:
1、X^2 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数v的增大,X^2 分布趋近于正态分布;卡方分布密度曲线下的面积都是1 。
2、X^2 分布的均值与方差可以看出,随着自由度v的增大,χ2分布向正无穷方向延伸(因为均值v越来越大),分布曲线也越来越低阔(因为方差2v越来越大) 。
3、不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜 。

    推荐阅读