业内信息

GraphPad Prism软件在医学论文数据审核中的应用

2021-05-11 来源:《科技传播》
  【作 者】关珠珠、李雅楠、郭锦秋:《大连医科大学学报》编辑部

  【摘 要】数据审核是医学论文审稿流程的重要环节,可以保障论文质量且有效防范学术不端。GraphPad Prism是一款既可以进行科学绘图,又能对数据进行统计分析的科研工具软件,可以帮助编辑对稿件中的统计结果进行验证,提高审核效率及准确性。文章通过3个案例,介绍GraphPad Prism软件的使用方法及技巧,期望能为编辑的数据审核工作提供一定的帮助。

  【关键词】GraphPad Prism软件;统计学;数据审核;编辑

  数据准确是医学论文具备科学价值的基础,国内外越来越多的期刊认为数据审核是审稿流程中不可或缺的环节[1]。在日常数据审核工作中,稿件出现数据差错的情况并不少见[2]。一般原因可以分为两种:一种属于非主观差错,例如作者因为不细心,造成个别数字的书写错误,或者对统计学知识了解不够,错误的使用了统计方法等[3]。对于这种情况,编辑会酌情与作者沟通,允许其进行修改。而另一种则是作者有意篡改编造数据,属于学术不端[4]。稿件一旦被认定为学术不端,应立即给予退稿[5]。数据审核可以避免这些错误的数据被发表出来,且能有效地防范学术不端[6]。

  GraphPad Prism是一款既可以进行科学绘图,又能同时对数据进行统计分析的科研工具软件,其中文官方网站(https://www.graphpad-prism.cn)及英文官方网站(https://www.graphpad.com)提供软件的购买、免费试用下载及使用教程。GraphPad Prism目前已被科研人员广泛使用,尤其在生物及医学学科。医学期刊编辑同样可以利用GraphPad Prism软件的统计分析功能对稿件中的数据进行审核。GraphPad Prism可以利用文章中的二次数据进行两独立样本均数的t检验及多样本均数的方差分析,也可以根据构成比信息进行卡方检验。本文将结合工作中的案例,介绍GraphPad Prism软件的使用,期望能为编辑的论文数据审核工作提供一定的帮助。

  1 GraphPad Prism软件在审稿工作中的应用案例分析

  1.1 两独立样本均数的t检验


  例1该文作者收集其医院收治的171例心梗患者,其中146例患者血尿酸值正常,25例为高尿酸血症。所有患者经超声检测左室舒张末内径(LVEDD),结果显示:血尿酸值正常的心a梗患者LVEDD为(49±9)mm;高尿酸血症的心梗患者LVEDD为(52±11)mm,两组比较差异有统计学意义(P<0.05)。

  在数据审核时,编辑认为两组患者LVEDD的均值相差并不大,对其是否真的具有统计学意义存疑。虽然稿件并未提供LVEDD的原始数值,应用GraphPad Prism软件,编辑仍可以利用文中提供的均数,标准差及样本量进行两样本均数的t检验,从而对统计结果进行验证。GraphPad Prism软件操作如下:打开软件,在欢迎界面New Table & Graph选框中选择Column→Enter and plot error values already calculated elsewhere→Mean,SD,N→Create,创建并进入数据表。录入数据后,在工具栏选择Analyze→Column analyses→t tests(and nonparametric tests)→OK。Parameters对话框中,可选择非配对的t检验(Unpaired t test.Assume both populations have the same SD)或方差不齐时的t’检验(Unpaired t test with Welch's correction.Do not assume equal SDs)。在不知道方差齐性的情况下,先选择t检验,点击OK,即可生成统计结果表单。如果方差齐性检验的P>0.05,说明两样本方差相等,表单中t检验有效;反之,则需返回到Parameters对话框,选择方差不齐时的t’检验。本例两组方差齐次性检验的P>0.05(F test to compare variances,P=0.1560),且t检验的P=0.1384,说明两组患者的LVEDD不具有统计学差异,文章的结果确实存在问题。之后编辑用同样的操作对文章的其他数据逐一进行检验,又发现多处P值错误。编辑部经讨论,认为此稿件数据不可靠,结论不可信,给予退稿。

  1.2 多样本均数比较的方差分析

  例2该文作者收集了医院收治的冠脉单支病变患者100例(单支组),冠脉双支病变患者143例(双支组),冠脉三支病变患者67例(三支组),同期入院的冠脉正常病例289例(正常组),检测各组患者24小时平均收缩压(24hSBP),分别为(137.75±13.08)mmHg,(143.83±9.91)mmHg,(147.58±10.02)mmHg,(127.78±16.15)mmHg。作者认为冠状病变各组的24hSBP均显著高于正常组,且随着冠状动脉狭窄支数增加,24hSBP逐渐增加(P<0.05)。

  统计学中,多样本均数比较应该使用方差分析,并要进行方差分析后的多重比较。例2文章中的统计方法部分仅描述为“两组间比较采用t检验”,而未有方差分析的描述。同时编辑注意到双支与三支病变组的均值相差较小。那么该文是统计方法描述不准确还是使用了错误的统计方法,双支与三支病变组的比较结果是否正确?编辑利用GraphPad Prism对四组总体方差分析以及之后的多重比较进行了重新验算。GraphPad Prism进行方差分析时,数据表创建及数据录入步骤与两独立样本均数的t检验一致。在Analyze对话框选择One-way ANOVA(and nonparametric tests)→OK。Parameters对话框中,Multiple Comparisons选项卡→compare the mean of each column with the mean of every other column;Options选项卡→Fisher's LSD test;Experimental Design选项卡→No matching or pairing→Yes.Use nonparametric test.→OK。生成的统计结果表单显示:四组总体方差分析具有统计学差异,P<0.0001;多重比较时,双支与三支病变组间差异没有统计学意义,P=0.0661。所以文章中“随着冠状动脉狭窄支数增加,24hSBP逐渐增加”的表述是不合适的。多样本均数比较时,不进行方差分析,直接用t检验进行多组间的两两比较是作者经常犯的统计错误之一。编辑利用GraphPad Prism,按照错误的方法进行t检验,结果显示P均<0.05。此结果与作者的结果一致,由此编辑部推断作者是使用了错误的统计方法。后期编辑与作者沟通,要求其应用正确的统计方法重新计算,并对稿件中相应的结论进行了修正。

  1.3 卡方检验

  例3该文作者收集病情相似的胃癌术后患者,按不同化疗方案分为A、B两组,每组79例。经过2年治疗后,A组患者发生肺转移、骨转移及脑转移的例数分别为2例,0例,1例;B组发生例数为6例,4例,5例。采用卡方检验,比较两组的转移情况,结果显示:肺转移、骨转移、脑转移的Χ2值分别为6.231,6.135,6.988,而P值分别为0.045,0.045,0.042。

  编辑在进行数据审核过程中对统计结果的正确性产生了质疑。例3中A、B两组患者肺转移、骨转移、脑转移情况比较实为三个独立的四格表资料。卡方界值表中,Χ²₀.₀₅,₁=3.84,Χ²₀.₀₁,₁=6.63,这是统计学习中通常会被要求记忆的临界值。四格表资料的卡方检验,自由度均为1,当Χ²>3.84时,则P<0.05,当Χ²>6.63时,则P<0.01[7]。文章脑转移项结果显示,Χ²=6.988大于临界值6.63,而对应的P=0.042,远远大于0.01,这明显是错误的。同时肺转移及骨转移项中的Χ²值接近6.63,但P值却接近0.05,也明显不符合数学规律。故编辑应用GraphPad Prism对表格中的结果依次进行了验证。以肺转移项为例,打开软件,在欢迎界面New Table & Graph选框中选择Contingency→Start with an empty data table→Create,建立并进入数据表。录入数据后,在工具栏选择Analyze→Chi-square(and Fisher's exact)test→OK。统计结果单显示,Χ²=1.185,P=0.276,这与文章中的数据相差较大且结论相反。骨转移及脑转移项的结果经验证也是同样的情况。最终编辑部以文章的数据不可信给予了退稿。

  2 讨论

  论文数据审核时,编辑会从资料表达方式是否恰当,统计学方法的选择及数值计算是否正确等方面进行审核。只有正态分布的计量资料采才能用均数±标准差表达,非正态分布的计量资料采用中位数和四分位数值表达,计数资料采用率或构成比的形式表达。医学论文中常出现的两样本及多样本的比较,应根据资料的特征,选择相应的参数或非参数检验方法,然后应用统计软件可以对统计过程进行验算,判断文中数值正确与否。

  统计方法使用不当是论文数据错误的主要原因。不同特征的数据资料适用不同的检验公式,而同一组数据使用校正与未校正的公式得到的结论可能完全相反。例3中作者就错误的使用t检验,没有进行多样本均数的方差分析。相丹风等[8]研究认为,方差不齐时没进行校正的t’检验是造成医学论文中成组t检验P值错误的原因之一。GraphPad Prism提供两独立样本均数的t检验、多样本方差分析及卡方检验的同时,也提供的相应的校正检验。如果方差不齐,例1可在t检验参数设置对话框界面选择Welch校正检验;例2则可以选择Kruskal-Wallis检验。需要说明的是,例2在进行多样本方差分析时,由于录入的数据为二次数据,非原始数据,GraphPad Prism不能进行总体方差齐性检验,其Brown-Forsythe检验一项为空白。但因多样本均数的方差分析结论较稳定,只要各组样本的最大比最小方差<3,仍可使用方差分析[9]。如果出现最大比最小方差≥3的情况,编辑可以与作者确认其使用的统计学方法,必要时要求作者提供原始数据。针对方差分析后的多重比较,GraphPad Prism在Options选项卡中,除了LSD-t检验法,还提供了其他多重比较的方法,如Turkey法,Bonferroni法等,编辑可以根据稿件的实验设计及数据特点进行选择。针对四格表资料,GraphPad Prism提供了卡方检验、Yates校正检验及Fisher确切检验。通常来说,卡方检验需要满足样本量(n)≥40且理论频数(T)≥5的条件;若n≥40但1≤T<5,使用Yates校正公式;若n<40或T<1,使用Fisher确切概率法[10]。例3肺转移项四格表中n=158,其中两个格子的T=4,则应选择Yates连续校正检验。

  医学论文方法及结果部分的数据较多,审核工作量大,若编辑能先筛选出稿件中疑似有误的数据,再进行统计软件的复核,可以大大的提高工作效率。本文的3个案例均为编辑先对结果的合理性产生了质疑,进而进行软件验证,最终发现了错误。统计学结果存在一定的规律,稿件中数据不合常理或违背数学原则,则可能存在问题[11]。类似的统计规律还有很多:优势比分析时,若95%可信区间包含1,则P一定大于或者等于0.05,如果文章结果的P<0.05,则一定存在错误。在样本量及组别相同,进行同种统计学方法比较不同指标时,统计检验量增加,则P值相应变小[11],若文章中统计检验量值与P值没有遵循此规律,则结果存在错误。编辑在工作中发现、总结、应用这些规律可以达到事半功倍的效果。但如果编辑凭感觉怀疑数据有误时,务必要使用统计软件进行后续的验证,以防误判。比如在均数间比较时,均值接近会让人产生没有统计学意义的质疑。虽然以此为线索,有时会发现问题数据。但它不能称之为统计学规律,不能作为否定存在统计学差异的确凿证据。本文例1及例2中,均有均值接近的2样本比较,经GraphPad Prism验证,例1中两组不存在统计学差异;例2中两组进行LSD-t检验时,也不存在统计学差异,而t检验则存在统计学差异。

  在数据审核过程中,应用统计软件,为编辑的工作带来了极大的便利。除了本文介绍的GraphPad Prism,SPSS[12]、SAS[12]、R语言[13]及EpiCalc2000[14-15]是以往被编辑们熟知并经常使用的统计软件。由于这些软件并非专门为编辑统计审核工作而设计,所以在实际工作中,总会有所不及。比如在不知道原始数据的情况下,编辑仍然不能应用软件对正态分布情况,配对的t检验等问题进行审核。但无论如何,GraphPad Prism的统计方法相对齐全,操作界面直观,在编辑数据审核工作中使用具有一定的优势。当然软件只能起到辅助作用,编辑只有具备全面的统计学知识背景,才能正确且灵活的使用软件,使其发挥最大效能。因此,具备较高统计素养仍是编辑胜任数据审核工作的必要条件[16-17],医学期刊编辑部以及编辑应当重视统计方面的培训与自我提高。同时希望不久的未来,专业人员可以开发针对编辑使用的统计审核软件。

  参考文献

  [1]姜春霞.论医学期刊编辑的统计学审核[J].中国科技期刊研究,2014,25(6):782-784.

  [2]韩磊.医学期刊编辑提升统计学素养的难点及策略[J].科技与出版,2016(1):50-53.

  [3]尚永刚.编辑应重视医学期刊中数据的审查与检验[J].编辑学报,2016,28(1):26-28.

  [4]刘胜利,潘云涛,赵筱媛.科研数据造假判定实用情报策略与技术的宏观考量[J].现代情报,2017,37(12):3-9.

  [5]李伟,陈新石,游苏宁.医学期刊编辑在预防学术不端中的辅助作用[J].编辑学报,2012,24(3):253-255.

  [6]郜书锴.《科学》杂志怎么应对数据造假[J].现代出版,2016(4):76-78.

  [7]徐勇勇,孙振球,颜虹,等.医学统计学[M].北京:高等教育出版社,2004:335.

  [8]相丹风,高永,周英智.医学论文中成组t检验P值错误及其原因分析[J].中国科技期刊研究,2018,29(12):224-1228.

  [9]周登远,崔壮,焦振山.临床医学研究中的统计分析和图形表达实例详解[M].北京:军事医学科学出版社,2011:42.

  [10]颜虹,徐勇勇,赵耐青,等.医学统计学[M].北京:人民卫生出版社,2006:153.

  [11]刘清海.利用统计方法与规律发现论文数据造假[J].编辑学报,2018,30(6):617-620.

  [12]李小萍,武建虎.利用流行病学计算器EpiCalc软件审核科技论文中的流行病学数据[J].中华医学图书情报杂志,2015,24(7):59-62.

  [13]易延华,胡桂洁.应用R软件和Epicalc程序包进行医学Logistic回归分析[J].中国病案,2015,16(3):33-37.

  [14]刘菲,高雪莲.EpiCalc2000软件在医学论文统计结果审核中的作用[J].编辑学报,2012,24(2):165-166.

  [15]葛芳君,蔡华波.编辑工作中EpiCalc2000软件应用[J].科技传播,2015,7(3):109-110.

  [16]张媛,刘雪松,霍永丰,等.医学研究论文中构成比与率错误混用的典型案例分析[J].编辑学报,2019,31(3):271-273.

  [17]郭瑞,宋国营,张媛,等.医学期刊编辑应重点审核的统计学问题分析及建议[J].编辑学报,2019,31(6):623-625.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号