搞懂诊断试验中灵敏度、特异度、阳性预测值、阴性预测值

临床医生门诊接诊新病人时最常被问的估计是以下三个问题:我有病么?是什么病?怎么治啊?细细分析这三个问题,其中第一和第二个都是诊断问题,第三个是治疗问题。回想起多年前我临床实习的时候,带教老师说:疾病的诊断、鉴别诊断是关键,是治疗的基础。如何把有病的人和没病的人区分开,如何把患某种病的患者和其他疾病鉴别出来是临床实践中的基本问题。而在回答这些基本问题的时候需要运用诊断试验的结果。
诊断试验与病因、治疗和预后研究相比,研究设计比较特殊。主要参照流行病学横断面研究中的筛查试验设计方案。经典的诊断试验设计研究对象应包括典型和不典型的病人、疑似有病的人和没病的人。应进行至少两次检查,首先是待评价的诊断方法对所有研究对象进行疾病的诊断,然后要用金标准对所有研究对象进行诊断。通过比较待评价的诊断方法对研究对象的诊断结果和金标准的一致性来评价待评价诊断方法的优劣。
在诊断试验中涉及很多概念的评价指标,下面以二分类的诊断试验为例和大家聊一聊这些容易混淆的评价指标。在进行了两次诊断后我们可以得到下面的四格表

待评价

诊断方法

金标准
合计
有病
无病
a真阳性
b假阳性
a+b
c假阴性
d真阴性
c+d
合计
a+c
b+d
N
1. 灵敏度(sensitivity, Sen)也叫敏感度和真阳性率;是衡量待评价诊断方法发现病人的能力,话句话说,是待评价诊断方法是否能从真正的病人中发现病人的能力。结合上面的四格表就是:
Sen=a/(a+c)
灵敏度只和病例组有关,灵敏度越高,待评价的诊断方法从实际有病的人中能正确判断为患者越多。当然最为理想的情况是待评价诊断方法能把所有实际有病的人都判断为病人,那么灵敏度就是100%。
和灵敏度相对应的是漏诊率,也就是把实际有病的人错误的判断为没病的比例,漏诊率=1-灵敏度。
2.特异度(specificity, Sep)也叫真阴性率,是衡量待评价诊断方法正确判断为无病者的能力,也就是说,是将没病的人里待评价诊断方法能诊断为无病的比例。根据四格表:
Sep=d/(b+d)
特异度只和实际没病的人有关。特异度越大,待评价诊断方法能把实际没病的人正确判断为无病的越多。理想的情况也是待评价诊断方法能把所有没病的人都判断为无病,这时特异度是100%。
误诊率是和特异度相应的概念,就是将实际无病的人错误的判断为有病的人的比例,误诊率=1-特异度。
从以上两个诊断试验的基础概念可以发现,灵敏度和特异度多越高越好,而漏诊率和误诊率是越低越好。然而,单用灵敏度或特异度来评价一个待评价诊断方法好坏都是有问题的。举个极端的例子,假如只考虑灵敏度,那么我可以把每个研究对象都直接判断为有病,这时,灵敏度就是100%。可是这样判断的话特异度就只有0。反过来说,如果只考虑特异度,那么只要把所有研究对象都判断为没病就直接能让特异度等于100%,同样的,这时灵敏度也就只有0。因此,我们在评价一个诊断方法的优劣时,应该同时考虑灵敏度和特异度,得让它们都比较大。看到这儿可能就有人会问,什么叫两个都比较大呢?怎么比较两个待评价诊断方法的优劣呢?这时我们需要采用一个简单的数学方法:
3.约登指数(Youden’s index)=灵敏度+特异度-1
就是综合待评价诊断方法发现真正病人和非病人的能力减去基数“1”。如果要比较两个待评价诊断方法的优劣可以直接比较约登指数就可以了。约登指数越大,待评价诊断方法越好。
但是在临床中,由于金标准结果往往不容易得到,这时就要考虑待评价诊断试验为阳性或者阴性的人实际是有病或者无病的比例了。比如,肿瘤诊断的金标准往往是病理结果,但是在没有进行手术的情况下,病理结果是不可知的,通常只能知道患者的影像学诊断结果。那么医生常常要做的一个判断是,影像诊断是阳性或阴性时,这个病人实际上是有肿瘤还是没肿瘤。这时往往要用另外两个指标来评价待评价诊断方法(影像学诊断)。
4.阳性预测值(Positive Predictive Value,PPV)指待评价诊断方法判断为有病的人中,真正“有病”的例数(真阳性)所占的比例。反映待评价诊断方法结果为阳性者中患病的可能性。根据上面四格表:
阳性预测值= a/(a+b)
5.阴性预测值(negative predictive value, NPV)指待评价诊断方法判断为没病的人中,真正未患病的比例。反映待评价诊断方法结果为阴性者中未患病的可能性。根据上面四格表:
阴性预测值= d/(c+d)
看到这儿大家一定觉得阳性预测值和阴性预测值比灵敏度和特异度更实用,更符合临床的实际需求。但是一定要注意,阳性预测值和阴性预测值的大小不仅仅和待评价诊断方法的灵敏度和特异度相关,而且还和进行诊断试验研究中研究对象的患病率相关。灵敏度、特异度这两个指标可以综合反映待评价诊断方法诊断能力的优劣。而当灵敏度和特异度一定的时候,进行诊断研究中研究对象的患病率是会影响阳性预测值和阴性预测值的。举个例子:
假设研究对象的患病率是50%,灵敏度是80%,特异度是80%,总例数是1000可以得到以下四格表。

待评价

诊断方法

金标准
合计
有病
无病
400
100
500
100
400
500
合计
500
500
1000
这时,阳性预测值=400/500=80%,阴性预测值=400/500=80%。
但是如果研究对象患病率变成5%的时候呢?我们可以得到下面的四格表:

待评价

诊断方法

金标准
合计
有病
无病
40
190
230
10
760
770
合计
50
950
1000
这时,阳性预测值=40/230=17.39%,阴性预测值=760/770=98.70%。
但是如果研究对象患病率变成80%的时候呢?我们可以得到下面的四格表:

待评价

诊断方法

金标准
合计
有病
无病
640
40
680
160
160
320
合计
800
200
1000
这时,阳性预测值=640/680=94.12%,阴性预测值=160/320=50.00%。
从上面的例子可以发现,灵敏度和特异度不变的情况下,随着患病率的增加,阳性预测值提高而阴性预测值下降;随着患病率减少,阳性预测值下降而阴性预测值提高。也就是说从文献里看到的阳性预测值和阴性预测值不一定能用到自己接诊的病人身上,因为接诊的病人群体和文献中的研究对象的患病率不一定会相等。如果能大概衡量接诊人群的患病率会比文献中研究对象的患病率高或低,那么可以根据上述结论来大致估算接诊人群的阳性预测值和阴性预测值的大致水平。
统计与绘图

R语言统计与绘图:卡方检验

2020-6-20 23:06:34

统计与绘图

统计分析与统计制图基础知识

2020-6-21 22:14:33

声明 本网部分文章源于互联网,转载出于传递更多信息和学习之目的,并不意味着赞同其观点。
如转载稿涉及版权等问题,请立即联系管理员,我们会予以修改、删除相关文章,请留言反馈
When your legal rights are being violated, please send an email to: sci666net@qq.com
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索