【作 者】王影:南方医科大学南方医院《护理学报》编辑部
【摘 要】通过实例从已得到公认的调查工具和自行编制的调查工具2方面,探讨医学期刊编辑在稿件审理、稿件退修及编辑加工过程中对论文调查工具的审核要点,分析其存在问题的原因,并提出对策。对于调查研究类稿件,医学期刊编辑应对调查工具可能存在的问题进行全面审核,重点包括调查工具的研究主题和目标人群是否与本研究一致,调查工具是否进行了信度和效度评价及其结果是否理想,调查工具如何赋分及其评价标准,调查工具编制过程是否规范,信度和效度评价时样本量等,以保证研究的真实性和结果的科学性。选择调查工具是医学期刊横断面调查类稿件审核的关键点之一,需要引起作者和医学期刊编辑的高度重视。
【关键词】调查工具;信度;效度;横断面研究;医学期刊;审核要点
选择合适的调查工具是医学研究横断面调查中的关键环节,对研究结果的实用性和外推性有很大的影响。采用不恰当的调查工具,得出的调查结果,往往失之毫厘谬以千里。此类文章发表后,其结果和相应的对策可能会误导读者、科研人员和医院管理者,严重影响其科学性和实用性。因此,医学期刊编辑在调查研究类论文的审核和把关中起着重要的作用。笔者在稿件编辑、与审稿专家沟通、查阅作者提供的参考文献及浏览其调查工具相关文献中发现,调查工具的选择存在较多问题。目前,对数据描述[1]、统计学方法的审核[2-3]已经得到了医学期刊编辑的高度重视,但对调查工具的审核报道较少。选择合适的调查工具,对提高作者的研究质量,提升医学期刊的学术质量都至关重要。《护理学报》在此类稿件审理过程中积累了一定的经验,笔者结合编辑工作特点,总结横断面研究论文中调查工具存在的问题,提出审核要点,以期为医学期刊编辑同行更好地审核此类稿件提供一定的借鉴和参考。
1 常用的调查工具来源
1.1 已得到公认的问卷或量表
问卷和量表是为了搜集人们对某个特定问题的态度、价值观、观点或信念等信息而设计的一系列问题,均为医学研究中经常使用的资料收集工具叫。已有学者编制了与研究主题相同的问卷或量表,并在某些相同文化人群中使用,验证了其可靠性和稳定性,已得到广泛公认。再研究同样主题时,作者可直接引用此类问卷或量表。若没有此类工具,可查询其他文化背景下是否有相同研究概念的问卷或量表;如果有,可以进行翻译、跨文化调适及对其信度和效度进行评价,然后再应用于本研究人群。
1.2 自行编制
研究主题没有公认的问卷或量表,其他文化背景下也无相同研究概念的工具,则需要作者或课题组成员根据调查问卷或量表编制原则自行编制,一般包括人口学资料(医学论文可能涉及疾病相关资料)和与主题相关的调查问卷或量表2部分[4]。其中与主题相关的调查问卷或量表,编制完成后需要进行信度和效度的检验。
2 审读要点
2.1 已得到公认的问卷或量表
在审读论文中的调查工具时,首先要判断引用的问卷或量表是否适用。常见的情况有以下4种。
2.1.1 引用的问卷或量表无应用于调查人群的报道或信度低
1)案例1。有作者采用慢性疾病治疗功能评估-灵性量表-12评估维持性血液透析患者的灵性健康情况。文献回顾发现,英文版源作者采用该量表评估慢性病患者的灵性健康状况[5],后来国外有作者采用英文版量表用于血液透析患者灵性健康的研究[6]。跨文化调适后的中文版量表用于评估的是癌症人群[7],尚未有用于评估我国维持性血液透析患者研究。
2)解析1。无论中文版还是英文版慢性疾病治疗功能评估-灵性量表-12,均可应用于评估灵性健康。该英文版量表针对的是慢性病患者,也有应用于血液透析人群的报道,但中文版量表的适应性评价中调查人群为癌症患者,并无应用于血液透析人群的先例,并不知晓经过翻译、跨文化调适的量表是否适用。故有必要先评估其效度和信度,然后再决定是否用其进行大样本的调查。类似情况,在正式调查前,一般先评估内容效度[8]。邀请相关专业副高及以上职称的3-10名专家(最好为5名),对中文版研究工具的各条目与所测量概念的相关程度做出评价,若均符合则不必修改;如有不符,需根据专家意见对研究工具进行修订,然后再次请所有专家予以测评。符合研究目的的调查工具,在实施预调查或正式调查后,需评价其内部一致性信度。效度和信度均在接受范围内,这样的调查工具才比较适合进行大样本的研究。
3)案例2。有作者评估中文版Tilburg衰弱量表应用于肾移植患者的信度和效度。该量表包括生理(8个条目)、心理衰弱(4个条目)和社会衰弱(3个条目),共3个维度15个条目。源量表作者应用该量表评估老年人,量表总Cronbach's α系数为0.73,各维度的Cronbach's α系数为0.34-0.70,1年后重测信度为0. 79[9]。中文版Tilburg衰弱量表测评老年慢性病患者,其Cronbach's α系数为0.686[10]。
4)解析2。从描述来看,无论源量表还是中文版量表,其内部一致性并不理想。一般要求Cronbach's α系数>0.7,有文献报道Cronbach's α系数受条目和样本数目的影响,条目越多,样本含量越大,Cronbach's α系数越好[11-12]。该量表还有待于扩大样本量进一步验证其信度和效度。
2.1.2 特有疾病人群的调查引用普适性量表
1)案例3。有作者采用社会影响量表调查2型糖尿病患者的病耻感现状,并分析其影响因素。文献回顾发现,2007年社会影响量表由Pan等翻译为中文版[13],2011年管晓萌[14]修订并应用于女性尿失禁患者。而2015年Browne等[15]研发了专门用于评价2型糖尿病患者病耻感量表,2017年李玉峰等[16]将其汉化并用于评估我国2型糖尿病患者。
2)解析3。普适性工具不针对某种疾病或某种治疗方式,可用于患者群体和普通人群。也有报道认为,普适性工具被设计用于覆盖不同的疾病、不同的人口统计学和文化亚群[17],其缺点是包含某些关于疾病不相关的内容,错过某些关于疾病很重要的内容。特异性工具针对某种疾病或某类特定人群编制,因其特定的内容对健康状况的特殊变化有更好的反应[18],缺点是不能进行不同人群或研究之间的比较。由此可见,针对特定疾病人群某项主题的研究,应优先选择特异性调查工具。
2.1.3 作者引用问卷或量表时的计分方式是否与源作者一致
1)案例4。有作者采用中文版死亡态度描绘量表(修订版)调查ICU护士的死亡态度情况,该量表包括死亡恐惧(7个条目)、死亡逃避(5个条目)、自然接受(5个条目)、趋近接受(10个条目)和逃避接受(5个条目),共5个维度32个条目。每个维度都采用Likert 5级评分法,从“非常不同意”至“非常同意”分别赋值1-5分。
2)解析4。作者计算死亡态度总分,并分析不同特征ICU护士的死亡态度总分差别。但调查工具却描述为总分为32-160分,各维度得分越高则表示受试对象趋向该维度的死亡态度。到底是计算总分还是维度得分?作者并不明确。查阅文献发现,该中文版量表描述以各维度因子分的高低来判断被试的死亡态度[19],较模糊。查阅英文源文献,明确源作者计算的是各维度条目均分,维度得分越高,则表示受试对象趋向该维度的死亡态度[20]。
2.1.4 引用的问卷或量表是否获得源作者或中文版作者的授权
1)案例5。有作者采用良心压力量表调查三级甲等医院护士的良心压力情况。源量表由Glasberg等[21]于2006年研制,2019年黄柳等[22]翻译为中文版,用于测量护理人员良心压力水平。
2)解析5。《护理学报》的外审专家、北京协和医学院护理学院李峥教授和北京大学护理学院路潜教授均认为,有些经典的公开的量表可以不受限使用,但新发展的或新汉化的工具,使用时应征得工具发展者的授权和同意,否则容易引起纠纷或涉及科研伦理、科研诚信相关问题。获得授权再使用,确实是未曾被作者和编辑重视的问题。调查工具编制或汉化的文献已公开发表,很多作者从文献中摘取工具相关内容,并注明参考文献,但未征得工具源作者同意,可能是作者缺乏知识产权方面的知识,也可能与源作者邮件联系得不到回复有关。因此,调查工具授权问题须引起编辑的重视,并提醒作者取得相关授权。
2.2 自行编制的问卷或量表
人口学资料(含疾病相关资料)问卷,一般由作者根据自己的专业、经验及查阅文献情况自行编制,只需注意有无漏掉与调查目的相关的重要信息即可,如工作年限、性别等。审读要点需针对自行编制的与研究主题相关的工具,常见问题有以下2种。
2.2.1 新编制问卷或量表的信度和效度评价是否科学
1)案例6。有作者采用临床护士糖尿病知识评估量表对某二级医院的临床护士进行调查。该量表由丁飙等[23]于2017年编制,包括7个维度,共100个条目。每个条目答对计1分,答错或者不清楚均不计分。总分越高,则代表受试对象的糖尿病知识掌握越好。
2)解析6。经查阅文献,该量表编制后分析了内容效度,抽取50名临床护士填写量表后计算其Cronbach's α系数,并于2周后进行了重测,评估重测信度。一般来说,量表性能评价时样本含量应该为条目数目的10倍[24]。引用量表的源文献,其条目数为100个,信度和效度评价的样本量仅为50个,不符合条目数10倍的标准。结构效度反映的是工具与其所依据理论或框架的相合程度,而源量表作者没有分析结构效度就划分了7个维度,其解释为本研究研制的量表为事实性的量表。对此,笔者与外审专家沟通后,均认为引用该量表进行大样本调查前需补充相关信度和效度评价内容。
2.2.2 新编制问卷或量表的编制过程是否规范,条目设置及赋分是否合理
1)案例7。有作者采用赵孟利于2019年编制的冠心病患者康复运动知信行调查问卷[25-26]进行调查。该问卷包括康复运动知识(12个条目)、运动态度(5个条目)和运动行为(6个条目),共3个维度23个条目。其中运动维度为多项选择,回答错误得0分,部分正确得1分,全部答对得2分;运动态度和运动行为2个维度均采用Likert 5级评分,从“完全不同意”至“非常同意”分别赋值1-5分。问卷总分为各维度得分之和,得分范围为11-79分。
2)解析7。经查阅源作者的文献,发现该问卷存在如下问题:①态度维度各条目,回答“非常同意”“同意”“不确定”“不同意”和“完全不同意”,赋分依次为5分、4分、3分、2分、1分;行为维度的6个条目,回答“一定会”“会”“不确定”“不会”“一定不会”,依次赋值为5分、4分、3分、2分、1分[25-26]。同意和非常同意、不同意和完全不同意、会和一定会、不会和一定不会,没有区分出程度上的差别,但赋分却不同。②知信行理论将人类行为改变分为获取知识、产生信念和形成行为3个步骤,且知识、信念和行为之间呈递进关系,即知识是行为改变的基础,信念和态度是行为改变的动力[27]。由此可见,知识、信念、行为是3个不同的内容,应分别计算其得分。但源作者及其发表的文献中指出,计算康复运动知信行总分[25-26]。③源作者在进行探索性因子分析时提取了7个公因子[26],但不知为何最后变为3个,源文献中并未对此进行说明。因此,可以认为作者选择的调查工具,尽管已公开发表论文,但其质量一般,不宜引用。
3 医学期刊横断面研究论文调查工具存在问题的原因
3.1 对调查工具审查重视程度不够
医学期刊审稿专家和编辑关注的重点是选题是否有新颖性,纳入的影响因素是否全面,统计学方法是否准确,研究结果的实用性和外推性等,可能忽视了高质量的调查研究应重视严谨的科研设计和选择合适的调查工具。若调查工具存在偏颇,那么得出的调查结果也会“失之毫厘谬以千里”。
3.2 医学期刊外审专家无法审核所有关键点
医学期刊调查研究类论文,经常使用比较复杂的统计学方法,例如倾向性匹配分析、Ordinal Logistic 回归分析、多重中介效应分析及列线性模型等,送审统计学专家更多考虑的是采用的统计学方法是否准确,呈现的结果是否规范。而送审临床专家考虑的则是选题是否是临床工作中有待解决的问题,研究结果对临床是否具有指导意义。这2方面专家都不会考虑调查工具适用性问题。
4 对策及建议
4.1 重视医学期刊稿件审核关键环节,加强业务方面的学习
医学期刊编辑在审核调查研究类稿件时,要鉴必穷源,根据作者著录的参考文献查阅关于调查工具的详细内容,审核其适用性和科学性,必要时可查阅英文原始文献。此外,还需自行在中国知网、万方数据库查询中文版调查工具相关文献,尤其是新编制的调查工具和硕博士论文附件中摘录的工具,评估作者是否认真阅读了文献,询问是否获得了授权。医学期刊编辑的业务学习,除了参加培训班外,还可以通过科技期刊学会的编辑QQ群、微信群等与同行交流审稿心得,同时向研究方向为工具编制、评估方面的专家请教,自行研读流行病学、护理研究、心理测量方面的教材,从而不断提高自身知识水平。
4.2 医学期刊稿件选择审稿专家时应通盘考虑,严格把关
选择医学期刊稿件的审稿专家时,尽量选择同时兼顾选题、统计学方法及调查工具的专家。若审稿专家库中没有符合条件的专家,可通过查阅相关主题文献的方法,寻找国内或国外知名专家对稿件进行评阅,不断积累和充实审稿专家的队伍。对于审稿专家要求修改后再审的稿件,要求作者根据审稿专家意见修改,并逐一回复相关问题,修改后再送专家复审。若确实无法寻找到一位合适的审稿专家,可同时送多位专家外审。
5 结束语
选择调查工具是医学期刊横断面调查类稿件审核的关键点之一,需要引起作者和编辑的高度重视。医学期刊编辑应熟悉量表编制过程,熟悉外文版量表汉化、跨文化调适以及科学性评价的程序,掌握信度和效度评价结果的判断。在审理和退修此类稿件时,要全面审核调查工具可能存在的问题,审核重点包括:调查工具的研究主题和目标人群是否与本研究一致,调查工具是否进行了信度和效度评价及其结果是否理想,调查工具如何赋分及其评价标准,调查工具编制过程是否规范,信度和效度评价时样本量等,以保证研究的真实性和结果的科学性。
6 参考文献
[1]周英智.医学论文“统计学处理”常见问题分析及建议[J].中国科技期刊研究,2016,27(5):480
[2]王曼.医学论文中常用回归分析方法的审核要点及对策[J].编辑学报,2018,30(5):475
[3]郭瑞,宋国营,张媛,等.医学期刊编辑应重点审核的统计学问题分析及建议[J].编辑学报,2019,31(6):623
[4]胡雁,王志稳.护理研究[M].5版.北京:人民卫生出版社,2017
[5]PETERMAN A H,FITCHETT G,BRADY M J,et al.Measuring spiritual well-being in people with cancer:the functional assessment of chronic illness therapy-spiritual well-being scale (FACIT-Sp)[J].Annals of Behavioral Medicine,2002,24(1):49
[6]LOUREIRO A C T,DE REZENDE COELHO M C,COUTINHO F B,et al.The influence of spirituality and religiousness on suicide risk and mental health of patients undergoing hemodialysis[J].Comprehensive Psychiatry,2018(80):39
[7]刘翔宇,韦迪,谌永毅,等.中文版慢性疾病治疗功能评估:灵性量表在癌症患者中的信效度评定[J].中华护理杂志,2016,51(9):1085
[8]张洁,郑一宁.护士长诚信领导行为对护士工作投入的影响[J].中国护理管理,2015,15(5):556
[9]GOBBENS R J,VAN ASSEN M A,LUIJKX K G, et al.The tilburg frailty indicator:psychometric properties[J].Journal of The American Medical Directors Association,2010,11(5):344
[10]奚兴,郭桂芳,孙静.中文版Tilburg衰弱评估量表的信效度研究[J].护理学报,2013,20(16):3
[11]蒋小花,沈卓之,张楠楠,等.问卷的信度和效度分析[J].现代预防医学,2010,37(3):430
[12]陈平雁,黄浙明.IBMSPSS19.0统计软件应用教程[M].2版.北京:人民卫生出版社,2012
[13]PAN A W,CHUNG L,FIFE B L,et al.Evaluation of the psychometrics of the social impact scale:a measure of stigmatization[J].International Journal of Rehabilitation Research,2007,30(3):235
[14]管晓萌.社区女性尿失禁患者病耻感及其与生活质量的相关性[D].济南:山东大学,2012
[15]BROWNE J L,VENTURA A D,MOSELY K,et al.Measuring the stigma surrounding type 2 diabetes:development and validation of the type 2 diabetes stigma assessment scale (DSAS-2)[J].Diabetes Care,2016,39(12):2141
[16]李玉峰,马宏文,侯若楠,等.2型糖尿病病耻感评估量表的汉化及信效度研究[J].中国实用护理杂志,2017,33(30):2343
[17]MCSWEENY A J,CREER T L.Health-related quality-of-life assessment in medical care[J].Disease-a-Month,1995(41):71
[18]吕宏梅,张宏波.患者报告结局(PRO)在临床疗效评价体系中的应用与思考[J].医学与哲学(临床决策论坛版),2011,32(12):1
[19]唐鲁,张玲,李玉香,等.中文版死亡态度描绘量表用于护士群体的信效度分析[J].护理学杂志,2014,29(14):64
[20]WONG P T,REKER G T,GESSER G.Death attitude profile-revised:a multidimensional measure of attitudes toward death[M].Washington D C:Taylor & Francis,1994
[21]GLASBERG A L,ERIKSSON S,DAHLQVIST V,et al.Development and initial validation of the stress of conscience questionnaire[J].Nursing Ethics,2006,13(6):633
[22]黄柳,蔡春凤,余立平,等.中文版良心压力问卷在护理人员中应用的信效度检验[J].护士进修杂志,2019,34(1):12
[23]丁飚,许燕玲,张妮娜,等.临床护士糖尿病知识评估量表的研制及信效度检验[J].护理研究,2017,31(17):2093
[24]VALMI D S,WILAIPORN R.Translation,adaptation and validation of instruments or scales for use in cross-cultural health care research:a clear and user-friendly guideline[J].Journal of Evaluation in Clinical Practice,2011,17(2):268
[25]赵孟利,黄惠桥,陶品月.冠心病患者康复运动知信行的现状及其影响因素分析[J].海南医学,2019,30(1):95
[26]赵孟利.冠心病患者康复运动知信行问卷的编制及其影响因素分析[D].南宁:广西医科大学,2019
[27]CLEARY A,DOWLING M.Knowledge and attitudes of mental health professionals in Ireland to the concept of recovery in mental health:a questionnaire survey[J].Journal of Psychiatric and Mental Health Nursing,2009,16(2):539