白话统计学14—卡方检验

引言

前面我们探讨的方差分析和t检验都假设所涉及的数据是从正态分布总体中抽样计算所得的某一取值(如身高、体重等),并且假设研究的世界是完美的。但在违背这些假定条件下,可以选择非参数检验的方法,在本小节中我们主要学习一种最常用的非参数检验方法:卡方(chi-square, X2)独立性检验。这一检验适用于数据来自两个分类或名义尺度的变量。

一、情景引入

假设我们想探究某所大学的男生和女生是否在专业选择上有所不同。随机选取了100名男生和100名女生并询问其专业,所得数据如表1 所示。
这一数据分布是否代表了在专业选择上存在一种统计显著的性别差异?换句话说,专业选择的分布是否与性别分布有关?卡方独立性检验能够帮助我们回答这种类型的问题。

二、卡方检验详解

 卡方检验基本公式:

预期值是根据检验假设H0:π12=…=πn确定的,即认为在两个(或多个)总体中某个分类变量的比例是一致的。

卡方检验的基本原理:将观测频数(observed frequencies)与预期频数值(expected frequencies)进行比较,用于检验观测频数是否显著异于预期频数。根据公式可以看出,X2值反应的是实际频数与理论频数的吻合程度。
  • 若检验假设H0成立,那么观测值与预期值的差值会小,则X2值会小;

  • 若检验假设H0不成立,那么观测值与预期值的差值会大,则X2值会大。

由于X2值是多个预期值与观测值差值平方和除以预期值的合计,分类变量越多(自由度越大),X2值会越大,故考虑自由度v的X2值才能正确反映实际与预期的吻合程度。

三、卡方检验的步骤

以情景引入中的案例为例:

1)确定检验检验和显著性水准

H0:p1=p2=p3,即心理学、英语和生物专业的男女总体分布一致

H1:心理学、英语和生物专业的男女总体分布不全相同

α=0.05

2)计算卡方

1.计算理论频数

根据表2,计算预期值:式中ERC为第R行第C列的预期值,nR为相应行的合计,nC为相应列的合计,n为总例数。

同理,我们可以求出其他专业的男女生预期值,得到表3:

2.计算卡方值和自由度:

将观测值和预期值带入X2值计算公式得(参见表4):

X2 = 0.19 + 0.19 + 4.17 + 4.17 + 10.06 + 4.11 = 22.89

v = (3-1)x(2-1)=2

注意到X2值较大主要是因为男女生在选择英语或生物学作为专业时存在相对较大的差异。因为心理学专业的观测值与预期值之差相对较小,所以它们对整体X2值的贡献不大。.

3)查卡方界值表,确定p值

根据前面我们计算得出X2值和自由度,查阅卡方分布界值表,可以发现:当α=0.05时,v=2对应的X2值为5.99。而我们计算出来的X2值为22.89,远大于5.99,故p值<0.05,做出决策——拒绝H0假设,认为在3个专业中男女分布不全相等。

四、卡方检验分类

不同分类卡方检验的应用场景不同,使用校正公式的前提条件也略有差异。故我们需要在掌握X2检验的基本思想之后,掌握不同分类的具体应用。
  • 四格表资料的卡方检验:例如将纳入患者分为实验组和对照组,对其进行2种不同的治疗,观察治疗疗效(有效或者无效),搜集资料并汇总如下:

可对该类资料进行四格表资料卡方检验,方法同情景引入中的案例。但是对于四格表资料,通常需要根据情况进行校正:

①  当n≥40时且所有的E≥5时,用X2检验的基本公式或者四格表资料的                专用公式;

②  当n≥40,但有1≤E<5时,需要使用X2的连续型校正公式;

③  当n<40,或T<1时,需要用四个表资料的fisher确切概率法。

  • 配对四格表资料的卡方检验:如某实验室用2种不同的方法检测一批患者血清中的抗体,需要探究两种方法的结果有无差别。整理资料和汇总的格式如下:

可对该类型资料进行配对四格表资料的卡方检验,基本原理同卡方检验(在 SPSS软件中,勾选McNemar即可)。有针对该类型资料的通用公式和校正公式:

  • 行x列表资料的卡方检验:例如记录3种治疗疗法对某种疾病治疗疗效(有效或无效),用于探究3种疗法的有效率有无差别。收集资料并整理如下:

 对该种类型的资料进行行x列表资料的卡方检验,基本原理和方法同情景   引入中的案例。但是应注意,该类型资料中的各格子的理论频数不应小于1,并且1≤E<5的格子数不应大于总格子数的1/5。如果遇到这类情况,①最好增加样本含量,②其次是根据专业知识合并一些行或者列,或考虑删除一些行或者列;③采用双向无序R x C表资料的Fisher确切概率法。

五、SPSS实现卡方检验

例,某医师为了比较药A与药B治疗面神经麻痹的疗效,将78例面神经麻痹的患者随机分为2组,结果见表5。试探究两种药物治疗面神经麻痹的总体有效率是否相等。

1.  将数据准备成SPSS能处理的格式,如下:

2.  对频数进行加权处理:

3.  进行四格表卡方检验:

设置参数:

4.  SPSS主要结果输出:

统计描述部分:A药与B药疗效观察的观测值和预期值。通过查看,可知B药无效预期值为4.7<5,其余格子内的预期值>5。

统计推断部分:结果部分分为pearson卡方值连续校正卡方值Fisher精确检验结果等。

  • 该数据中,样本总量为78,B药无效预期值为4.7<5,故根据四个表资料校正的原理,我们应该查看连续型校正(continuity correction)的结果,即X2值=3.145,自由度df=1,显著性水平p=0.076。按照α=0.05的水准,不拒绝H0,还不能认为2种药物治疗面神经麻痹的有效率不相等。

  • 若该资料不进行校正,按照第一行的结果,X2值=0.037,p<0.05,结论恰好相反。

六、等级资料(秩和检验 vs 卡方检验)

如果观察的结局是等级资料,一般使用秩和检验。虽然等级资料可以用X2检验,但是这时候等级资料的信息就损失了(不含等级的意义)。也就是说,对等级资料采用X2检验,能解释的问题就不一样了。
  • 秩和检验说明的问题是,两组或者多组之间有等级或者程度上的差别;
  • 卡方检验说明的问题是,两组或者多组的构成比有无差异,构成比是没有等级或顺序的,体现不出等级资料的特点。

小结

非参数检验除了卡方检验,还有秩和检验(类似于两独立样本t检验)、符号秩和检验(类似于配对样本t检验)、Kruskal-Wallis检验(类似于单因子方差分析)等检验方法。因为有效使用参数统计需要若干假设条件,而我们所用的数据经常违背其中一个或多个假设,所以熟悉几种非参数技术是很有必要的。下一小结,将跟着作者的思路来了解社会科学研究者经常用于组织和理解数据的两种统计技术:因子分析和Cronbach’s α信度分析。拜拜啦~~
参考书籍:
1.中国人民大学出版社《白话统计学》第3版   蒂莫西.C.厄丹(Timothy C.Urdan)著,彭志文译
2.人民卫生出版社《医学统计学》第4版 孙振球,徐勇勇著
统计与绘图

Graphpad做单因素方差分析步骤详解

2019-12-13 18:17:25

统计与绘图

白话统计学15—因子分析与信度分析

2019-12-17 22:04:07

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索