玩转qPCR系列:数据分析第五关

       上一期作为背景知识补充,对一个重要的统计数据——p value做出了解释和补充说明,本期介绍qPCR数据分析的最常用的统计方法——Student‘s t test。

Student‘s t test

Student‘s t test即大家熟知的t检验,由于其首创者戈斯特以笔名“the student”发表而得名。t检验以t分布为模型,是为了更好的纠正正态检验处理小样本时的偏差(Fig 1),因此更广泛的应用于样本量受限的生物学研究中;而对于有大量人群样本支撑的社会行为学或心理学研究,往往采用正态检验。

 

Figure 1. 正态分布与不同自由度的t分布

T检验分类

根据入组形式的不同,t检验可分为成对t检验(paired t-test)和不成对t检验(unpaired t-test)。如测试药物对小鼠某基因表达的影响,有两种实验方案可选。第一种,分别检测5只小鼠用药前与用药后的基因表达量,可得到两组共10个数据,须采用成对t检验,因为前后基因表达的变化都是针对同一个体;第二种,从正常小鼠中随机挑选10只作为control,再从用药后的小鼠(与正常小鼠群体无交集)中随机挑选10只作为实验组,这样就得采用不成对t检验。一般地,成对t检验的效力(power)要大于不成对t检验,通俗的讲就是更容易拿到差异显著的结果,而不成对t检验往往需要大量的样本才能达到同样的效力。因此在qPCR实验中,成对t检验是优选方案。

根据前提条件的不同,t检验又可分为单尾检验和双尾检验。当我们对结果无任何预判时,选择更常规的双尾检验;但当有充分的证据表明基因表达结果会大概率升高或者降低时,可以采用单尾检验。比如研发了一款第三代抗肿瘤药物,通常来讲其抑制原癌基因表达的效果不会比第二代药物差,这时我们就有一定的信心采用单尾检验。单尾检验的效力(power)更高,但带来的假阳性风险也较高,因此要谨慎选择。

 

Figure 2. 单尾检验与双尾检验的区别

应用前提

所有的检验模型都有其适用条件,t检验也不例外。使用t检验应满足三点要求:

样本选取是随机独立的。这一要求说起来简单但真正做到却不容易,选材时完全不受主观因素干扰几乎是不可能的,只能做到尽量的客观;

效应因素及误差都符合正态分布。简单来讲,对照组和实验组的表达数据都要符合正态分布。是否符合正态分布我们可以用Shapiro-Wilk Test或者Kolmogorov-Smirnov Test来进行检验,前者适合小样本量(<50),后者适合更大的样本量。这两个模型在SPSS等统计软件中都提供。由于表达量数据变动较大,所以一般要先取对数后再进行检验。当发现数据不符合正态分布时,首先要检查qPCR原始数据的质量,比如Cq值是否有outlier。如只有某一生物组的数据不符合正态分布时,可将该组舍弃不参与检验,只看其他组的检验结果;

方差同质性。参与t检验的两个组数据的方差要具有同质性,而这一点是大家常常忽略的。一般采用F分布模型进行检验,如果方差不具有同质性,则要对t检验公式进行修改。

———

下一期介绍另一个常用的检验方法——ANOVA,并比较与t检验方式的不同。介绍完统计方法后会以常用的统计软件为例进行演示,方便大家理解。另外,统计方法涉及的细节较多,一期的内容不可能涉及到t检验的方方面面,如果大家对此感兴趣请查阅生物统计的专业书籍。在此给大家推荐一本外文教科书”Fundamentals of Biostatistics senventh edition” by Bernard Rosner, 我认为还是很系统专业的,而且循序渐进。

基础实验

重复实验注意事项

2020-10-21 23:30:39

基础实验

实验技术介绍:染色质免疫共沉淀ChIP

2020-10-21 23:44:22

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索