【摘 要】医学论文内涉及大量的等级资料,等级资料统计方法的误用情况较多。作者列举公开发表的文章以及在编辑文章过程中所涉及等级资料的统计方法误用的多个案例,辨析了等级资料作为组别和作为效应量时的统计方法误用类型,并提出了正确的使用方法,以供医学编辑同人参考。
【关键词】医学论文;等级资料;案例辨析
医学论文中涉及大量的等级资料。等级资料即有序分类资料,具有半定量的特征。医学论文中的TNM分期、分化程度、心功能分级、美国麻醉医师协会分级( ASA分级)、疗效(如治愈、有效、无效)等即是常见的等级资料;然而,等级资料作为“效应量”或组别时,采用的统计方法是不同的,因此,对于等级资料的统计方法,绝不仅仅是简单的秩和检验就可完成的。目前,对于等级资料,有学者[1-4]进行了相关的误用辨析,但针对的基本都是单一成组设计类型的等级资料,并不全面。笔者列举公开发表或笔者编辑的涉及等级资料统计方法误用的多个案例,辨析等级资料作为组别和作为效应量时的统计方法差异,以供医学编辑同人参考。
1.单向有序资料
单向有序资料,即行和列项目中仅有1项为等级资料,此类型数据包括2种情况:仅效应量为等级资料和仅组别为等级资料。
1.1.仅效应量为等级资料
这是医学期刊中最常涉及的等级资料类型,如比较2组患者接受某种治疗后的疗效、2种组织标本中某种蛋白表达程度的差异、2组患者ASA分级程度的差异等。对于此类资料,正如其他学者[1-4]所言,最常见的方法误用即是采用成组X²检验进行分析。采用成组X²检验处理此种等级资料的缺陷在于:它只能得出组间的“分布”不同,而不能得出组间“程度”不同,而医学研究中,研究者往往想知道的是诸如何种方法更有效等关于“程度”的问题。但笔者在CNKI数据库中查阅了2019年发表的多篇文献,发现采用成组X²检验分析等级资料的情况其实已比较少见,此类资料的分析方法总体已经呈现出新的特点:文章中展示各等级数据,但在分析时进行了合并,使等级资料退化为二分类资料,再采用成组X²检验进行统计分析。
如《米曲菌酶联合伊托必利辅助治疗慢性胃炎伴反流性食管炎的疗效观察》[5]一文中,研究者探讨了中西医结合治疗重症肺炎合并呼吸功能衰竭的疗效,得到结果见表1。根据表1,该文作者的结论是“治疗组总有效率显著优于对照组(P <0.05)”。仔细观察表1数据,可发现存在2个问题:1 )作者将显效和好转定义为有效,然而数据的合并无疑会损失信息;2)比较2组的总有效率,统计量也应是X²值而非Z值(即使采用的是秩和检验,结果也不正确)。笔者采用秩和检验对该数据进行分析,得出Z=-1. 234,P=0.217,与原文结论有所不同。由此可见,对于数据的合并,可能得出完全相反的结论。
表1 治疗组和对照组患者的临床疗效对比(n=30)
组别 | 治疗效果(例) | 总有效率/例(%) | Z值 | P值 | ||
显效 | 好转 | 无效 | ||||
治疗组 | 13 | 15 | 2 | 28(93.33) | -2.007 | 0.045 |
对照组 | 10 | 14 | 6 | 24(80.00) |
1.2.仅组别为等级资料
有时研究者的研究标的不是等级资料,而是不同等级的某种效应量的差异,如《Mdm 2在ERα阳性乳腺癌组织中的表达及其siRNA对MCF-7细胞生物学行为的影响》[6]中,研究者比较了不同TNM分期ERα(雌激素受体α)阳性乳腺癌组织中Mdm 2表达阳性率的差异,此时TNM分期包括I、III、IV期,是等级资料,类似于组别,而Mdn 2的表达状态是“效应量”(表2)。作者最开始来稿时采用R×C列联表资料的犷检验进行组间总体比较、再进行组间两两比较;但多次的组间两两比较无疑会增大犯I型错误的概率,且也增加了工作量,而趋势X²检验(线性趋势检验)可完美解决这个问题,因此笔者建议作者斟酌统计分析方法,最终作者在修回稿件中采纳了笔者的建议,得出P=0. 027,可以认为Mdm 2的表达阳性率随TNM分期的增高而增加。
表2 ERα阳性乳腺癌组织中Mdm 2表达与患者临床病理特征的关系(节选)
TNM分期 | n | Mdm2表达阳性 | Mdm2表达阴性 |
例(%) | |||
I | 22 | 7(31.8) | 15(68.2) |
II | 25 | 12(48.0) | 13(52.0) |
III | 26 | 15(57.7) | 11(42.3) |
IV | 5 | 4(80.0) | 1(20.0) |
2.双向有序资料
双向有序资料,即行和列项目均为等级资料,此类型数据包括2种情况:等级资料属性不同和属性相同。
2.1.属性不同
在《PARP-1和caspase-3在胰腺癌及癌旁组织中的表达及意义》[7]一文中,研究者检测了66例胰腺癌组织中PARP-1[聚(腺昔酸二磷酸核糖)聚合酶1]和caspase-3(半胧氨酸天冬氨酸蛋白酶3)的表达,得到表3。该研究者在整理表格时未纳人PARP-1表达阴性的情况,且采用的统计分析方法也简单描述为X²检验。该处理欠妥,一是损失了阴性表达信息(表3中笔者已进行了补充),二是统计方法不明:是配对X²检验还是成组X²检验?该例中,分化程度和PARP-1表达都是等级资料,分析方法应依据研究目的而定:若研究目的为分析不同分化程度组患者PARP-1表达程度的差异,可采用Kruskal-Wallis H检验,因Kruskal-Wallis H检验可以明确表达强度高低的问题;若研究目的为分析2个有序分类变量间是否存在相关关系,宜采用等级相关分析或Pearson积差相关分析;若研究目的为分析2个有序变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验(test for linear trend)[8]。无论研究者的目的如何,X²检验都是错误的。笔者认为,该研究以有序分组资料的线性趋势检验为最佳选择,能得到随分化程度的增高,PARP-1表达是否呈现线性变化趋势的结论(增强/减弱),这无疑更符合研究实际,且得到的信息量更大(相关,且关系是线性的)。
表3 胰腺癌分化程度和PARP-1表达的关系(节选)
分化程度 | n | +++ | ++ | + | - |
高分化 | 20 | 3 | 6 | 5 | 6 |
中分化 | 32 | 18 | 6 | 1 | 7 |
低分化 | 14 | 10 | 3 | 1 | 0 |
2.2.属性相同
当配对资料2种属性相同,且均超过2类时,就是配对资料的扩展了。医学论文中的常见形式为:2种检测方法对同一样品的测定结果分级、同一组织中2种蛋白的表达(表达程度分类相同)等。在《X线、CT与MRI检查在早期强直性脊柱炎骶骼关节病变诊断中的价值探究》[9]一文中,研究者的目的是比较CT检查和X线检查对于早期强直性脊柱炎骶骼关节病变的诊断价值,也就是说比较的是2种检查方式诊断结果的差异,叙述成统计语言就是比较2种检查诊断结果的概率分布是否相同。作者采用的方法是,在不同分级下进行成组X²检验,有6个分级就进行了6次成组X²检验(表4)。此部分存在2个问题:一是并没有体现出来是配对设计,表格的呈现方式有误;二是统计方法选择有误,将本质是配对设计的资料,人为拆分成多个分类下的成组设计资料。该研究的正确统计方法应选用配对R×C列联表资料的X²检验。由于笔者无该文章的准确数据,无法列出该研究的正确表格,因此呈现了另一篇相似文章的正确表格(表5[10])。
表4 X线和CT检查对110例强直性脊柱炎的检查结果(节选)
检查方式 | 0级 | I级 | II级 | III级 | IV级 |
例(%) | |||||
X线 | 49(44.55) | 11(10.00) | 14(12.73) | 25(22.73) | 11(10.00) |
CT | 27(24.55) | 22(20.00) | 26(23.64) | 23(20.91) | 12(10.91) |
X² | 9.730 | 4.314 | 4.440 | 0.107 | 0.049 |
P | 0.001 | 0.037 | 0.035 | 0.743 | 0.824 |
表5 X线与CT诊断骶骼关节病变级别的分级情况[10]
X线分级 | CT扫描分级 | |||||
0 | I | II | III | IV | 合计 | |
0 | 17 | 6 | 7 | 0 | 0 | 30 |
I | 8 | 30 | 28 | 16 | 0 | 82 |
II | 0 | 6 | 32 | 22 | 0 | 60 |
III | 0 | 0 | 8 | 66 | 4 | 78 |
IV | 0 | 0 | 0 | 2 | 20 | 22 |
合计 | 25 | 42 | 75 | 103 | 24 | 272 |
此外,针对等级资料属性相同的资料,笔者再延伸一点。有时候研究的目的并不是分析2种检查方法的概率分布差异,而是观察2种检查方法结果的一致性(特别是有一种方法是金标准时),此时应采用一致性检验即Kappa检验。Kappa检验是一致性检验,配对R×C列联表资料的X²检验是判断概率分布,属于不同的方法,达到不同的目的;因此对于同一资料,有时2种方法的检验结论不一致,如一种方法的P值小于检验水准,而另一种方法得出的P值大于检验水准。
综上所述,单向有序资料中等级资料作为效应量、作为组别时,采用的统计分析方法不同;双向有序资料中,等级资料属性相同和不同时的统计分析方法也有所不同。在编修涉及等级资料的稿件时,编辑应根据作者的研究目的,核查统计方法是否正确。
3.参考文献
[1]韩宏志,官鑫,李欣欣,等.医学论文中X²检验的误用及案例分析[J].编辑学报,2018,30(3):257
[2]姚应水.医学科研论文中X²检验误用分析[J].皖南医学院学报,2005,24(1):80
[3]肖丽娟,孙茂民.医学论文中统计学处理常见问题及应对措施[J].编辑学报,2010,22(6):501
[4]鲁立,傅万明,李风华,等.医学论文统计学问题的编辑审查[J]编辑学报,2006,18(5):338
[5]张长青,张葵玲,王育斌,等.米曲菌酶联合伊托必利辅助治疗慢性胃炎伴反流性食管炎的疗效观察[J].中国现代应用药学,2019,36(12):1558
[6]时百,王耕,周坤,等.Mdm2在EPα阳性乳腺癌组织中的表达及其siPNA对MCF-7细胞生物学行为的影响[J].中国普外基础与临床杂志,2016,23(9):1070
[7]蒲竞,李汛,朱骏,等.PARP-1和caspase-3在胰腺癌及癌旁组织中的表达及意义[J].临床肝胆病杂志,2016,32(2):337
[8]孙振球,徐勇勇.医学统计学[M].2版.北京:人民卫生出版社,2008:153
[9]吴泽健.X线、CT与MRI检查在早期强直性脊柱炎骶骼关节病变诊断中的价值探究[J].医学理论与实践,2019,32(10):1573
[10]马丽,艾脉兴,赵孟君,等.X线和CT对强直性脊柱炎骶骼关节病变的诊断价值比较[J].中日友好医院学报,2007,21(6):337