加急见刊

医学论文中统计设计的聚类浅析

周迟  2012-12-09

摘要:本文应用系统聚类方法,对医学中常用的统计设计方案按其使用情况进行分类,通过对类间的分析与比较,找出存在的问题,综合评价三年医学统计设计方案的不足与可取之处,通过对医学常用的统计设计方案进行聚类,以便引起有关人员应该对哪些统计设计方案更加重视,从而为提高期刊中医学论文的质量提供一点建议,对如何改进并提高医学论文统计设计方案提供一点参考价值。

关键词:医学论文;统计设计方案;聚类分析

1前言

在医学科研中,设计主要包括专业设计和统计学设计两个方面。近年来,统计设计方案存在着很大的问题[1],如统计设计方案过于简单,没有充分体现处理因素间的效应;统计设计方案使用不当,与目的和处理因素的水平数不符。在定量资料的假设检验中,误用统计方法最常见的原因是忽视资料所对应的设计类型[2]。医学统计设计是进行临床医学实验的重要前提,只有一个好的统计设计,才能使实验用比较经济的人力、物力和时间得到一个准确、可靠、重现性好的结果。而要得到一个好的统计设计,必须严格遵循统计设计的4个原则:对照、均衡、随机化、重复的原则,然后制定一个合理的统计设计方案[3],它直接影响到医学期刊质量高低,目前国内外对医学统计设计方案的研究只是针对某个设计类型应用方法进行分析,而对医学中统计设计方案的使用质量并未系统地进行分析。为此,本文采用样品聚类方法,对医学中常用的9种统计设计方案进行分析,通过类内与类间的比较,找出其中存在的问题,对改进研究设计提供一点参考价值。

2材料与方法

从河北省图书馆和河北医科大学图书馆藏书中,用单纯随机抽样的方法抽取2000年、2001年和2002年期刊刊登的需要进行统计设计的临床医学研究、基础医学研究文章657篇,其样本量用率的抽样方法进行计算,公式如下[4]:

n--所需样本量大小。

本次调查α=0.05,则μ0.05=1.96;δ为容许误差(即所希望检出的差值)。本次调查根据以往的经验δ取0.04;预调查了100篇文章,其中48篇文章的统计设计方案存在不足之处,故本次调查p取值为0.5;为了剔除与本研究无关的文章,本文抽取了1000篇基础研究与临床研究中的医学论文,最后剔除了非本文研究的设计类型343篇,剩余657篇,所以有效样本量为657篇,满足了本文需要的601篇文章。

3统计方法

2.1指标的确定及其赋值

本次调查的样品为医学中常用的统计设计类型(成组设计、配对设计、随机区组设计、交叉设计、拉丁方设计、析因设计、正交设计、重复测量设计和序贯设计),统计设计方案的指标依次为无、不正确、不明确和正确[5-7],其数据结果用百分比表示[8],本次调查的统计设计方案主要从以下几方面进行判断:与实验目的是否相符;处理因素的水平数;区组因素的个数;处理因素间有无交互作用;非处理因素的均衡情况。无:指文章中没有统计设计过程,没有遵循统计设计的四个原则;不正确:指论文中写明了统计设计方案但与上述任一方面不符者;不明确:指论文中没有写明具体的统计设计方案名称,仅是对受试对象进行了随机分配并分组,无法判断的;正确:指论文中写明了统计设计方案的具体名称,且全部条件都符合的。无、不正确、不明确和正确分别赋值为1、2、3和4。

2.2 Q型系统聚类

本次调查采用系统聚类法,聚类统计量用欧氏距离,类与类的距离定义为类平均法,数据处理用SAS8.0,在样本聚类分析中,两个样本之间的距离越小,说明两个样本的性质越相似。类间距离是用来度量一个类(一组样本)与另一个类(另一组样本)之间距离的统计量。令类A中有a个样本,类B中有b个样本,D(i,j)为A中的第i个样本与类B中的第j个样本之间的距离,则称D(i,j)为类A和类B中一对样本之间的距离,i=1,2,…,a;j=1,2,…,b。假设D(A,B)为类A和类B之间的距离,本次调查的类平均法,其类间距离等于两类中所有样本对之间距离的平均值,即D(A,B)={sumD(i,j)}/(ab),在样本聚类分析中两个类的类间距离越大,则两个类的类内所有样本的性质越不相似;反之,两个类的类间距离越小,则两个类的类内所有样本的性质越相似。系统聚类的基本思想是先把n个聚类样本看成n类,然后按类间距离将相似程度最大的两个类合并为一类,再将所有的类(包括新类)中相似程度最大的两个类合并为一类,重复此过程,直至所有类间距离达到一定的要求为止,或直至所有n个样本被合并成一类为止,然后根据类间距离的要求以及实际意义选择一个适当的分类。把医学常用的统计设计方案进行聚类后,可以进一步对类间及类内进行系统分析,以便找出问题所在,提醒有关人员应该对哪些统计设计方案更加重视。

2.3三年之间的比较

三年的论文使用情况在3类的构成比的比较用χ2检验,两两比较的检验水准用校正的α′,其计算公式如上,统计处理用CS2000统计软件。

4一致性检验

一致性的检验或盲评法复审是质量控制的重要方法,本次调查采用一致检验,它可以评价本次样品分析结果的可靠性。其评价指标用kappa值来表示,其公式如下:

所有被评阅的文章均由作者按统一的评价标准进行评阅,并经另一专业人士复查,如遇意见不一致之处,由两人共同讨论分析,以求获得一致的结论。两人对657篇文章的设计方案的评阅一致率为95.74%(结果见Table 1),Kappa值=0.9227,两人对657篇论文的判断存在一致性(u=35.1507,p<0.05),可见本次所调查的657篇文章结果是可靠的,数据处理过程使用CS2000统计软件。 4结果与讨论

4.1统计设计方案的聚类过程及样品聚类结果的解释

本次研究也对各种方法进行尝试,其中以平均距离法的分类结果最为理想。统计设计方案的聚类过程及样品聚类结果的解释(见表1和表2)如下:

有2个特征值大于1,因此至少应分成2类。列出了聚类过程:第一步,将第5号样本和第6号样本合并成一类,称为类8,记为CL8;第二步,将第1号样本和第4号样本合并成一类,称为类7,记为CL7;第三步,将第7号样本和第9号样本合并成一类,称为类6,记为CL6,可见CL6含有2个样本,它们是7、9;第四步,将第3号样本和CL8合并成一类,称为类5,记为CL5;第五步,将CL5和第8号样本合并成一类,称为类4,记为CL4,可以看出,CL4含有4个样本,它们是3、5、6、8;第六步,将CL7和第2号样本合并成一类,称为类3,记为CL3,此时CL3含有个样本,它们是1、4、2;第七步,CL3和CL4合并居一类,称为类2,记为CL2;第八步,CL2和CL6合并成一类,记为CL1。这样所有9个样本合并为一类。其中SPRSQ是半偏统计量,表明此次合并类对信息的损失程度,半偏值越小,说明此次合并的效果越好;RSQ是统计量,用来评价聚类的累计效果,值越大,聚类效果越好。在这个分类结果中,根据判别指标值,可以清楚地看到,在倒数第3行,即聚类到第6步时,SPRSQ值急剧增加,从0.0967增加到0.3111,而RSQ值急剧减少,从0.759减少到0.447,因为此时SPRSQ和RSQ值突然波动,所以可以决定,样本分成3类比较合适。

聚类树状图结果(见Fig.1)。从直观上看,将这9个统计设计方案分为3类是比较合适的,这时类间平均距离不小于2.2164。总体变异的75.9%被类成分所解释。从树状图中还可以直接得到分类的结果,这就是:第Ⅰ类包含1、4、2三个样本,即重复测量设计、拉丁方设计、序贯设计;第Ⅱ类包含3、5、6、8四个样本,即交叉设计、析因设计、正交设计、配对设计;第Ⅲ类包含7、9两个样本,即成组设计、随机区组设计。

4.2三年的统计设计方案的使用情况及在3类中构成比的比较结果

657篇论文中,2000年、2001年和2002年的文章各占293篇、183篇、181篇。2000年、2001年和2002年在3类中的构成比比较差别显著(χ2=44.0895,p=0.0000),说明3年在3类中的总体分布是不同的(见Table 11),进一步两两比较的校正α′=0.0125,经χ2检验,2000年与2001年的构成比比较差异无显著性(χ2=3.0721,p=0.2154);2000年与2002年比较差异有显著性(χ2=41.8902,p=0.0000);2001年与2002年比较差异有显著性(χ2=18.2208,p=0.0000)。对每一类中年的两两比较,其检验水准用校正α′=0.0125。2000年与2002年相比,Ⅰ类和Ⅱ类的构成比差别显著(p<0.0125),Ⅲ类差别不显著(p>0.0125)。2001年与2002年相比,Ⅰ类和Ⅱ类的构成比差别显著(p<0.0125),Ⅲ类差别不显著(p>0.0125)。其中,2002年在第Ⅰ类的有46篇,占25.41%,2000年和2001年在第Ⅰ类中的各为7.51%、11.42%,所以2002年医学论文的使用情况要好于2000年和2001年,说明医学论文在这三年中的使用质量是有所提高的。

第Ⅰ类,即析因设计、正交设计和交叉设计存在的问题较少,但不明确的论文占的比例最高,为30.30%,所以这三种设计方案应在以后的论文发表中将设计类型的名称标明。配对统计设计、拉丁方统计设计、重复测量统计设计存在的问题应用正确的程度较高,但不明确的比例也相对较高,应注意这方面的问题,成组统计设计和随机区组设计的应用情况最差,出现的问题也最多,无的占11.55%,不正确的占17.94%,不明确的占20.35%,在三类中占的比例较高,应该引起有关人员的注意。统计设计方案的使用情况不同,较好的为第Ⅰ类和第Ⅱ类,最差的为第Ⅲ类,但三类文章中均存在一定的问题。所以重视并加强科研人员的统计学培训是一个任重而道远的过程,提醒有关人员引起足够的重视。

我国医药卫生期刊论著中统计学误用率高达80%左右,其根源在于论文作者统计学水平低、期刊编辑部把关不严和期刊管理部门严重失职。发表论文只是科研工作的一种表现形式,关键是与论文相对应的科研工作本身是否具有很高的科学性。然而,很多科研工作者从一开始就忽视统计学的指导作用,始终抱着单因素设计的思想去研究多因素多指标并带有随机性的课题,在这样的基础上撰写出来的论文,出错似乎已是必然。

下载