利用数理统计方法筛选健康档案指标
吴静 饶克勤 刘远立 2011-01-17
【摘要】 目的:定量筛选健康档案指标。方法:综合利用数理统计方法,主要包括变异系数法、相关矩阵法以及因子分析。结果:根据三种统计方法的综合结果筛选出健康档案指标。结论:采用数理统计方法筛选健康档案指标可以弥补单纯采用定性方法的不足,从而使筛选出来的指标更具有科学性。
【关键词】 统计方法;健康档案;指标
Abstract Objective: To select indicators for health record using quantitative methods. Methods: Multi-method has was used, mainly including CV methods, correlation matrix methods, and factorial analysis. Results: A set of indicators were selected. Conclusion: The use of mathematic statistical methods can be taken to make up for the deficiency of qualitative methods and thus to make the selected indicators more scientific and reasonable.
Key words Statistical methods; Health record; Indicators
健康档案不但是开展和提高社区卫生服务的重要工具,也是满足不同层级卫生服务提供者及管理者信息需求的有力保障[1-2]。在新近出台的《医改方案》[3]中明确提出,要“以建立居民健康档案为重点,构建乡村和社区卫生信息网络平台”,而目前我国居民健康档案内容还无法满足相关要求,因此必须加快进行相关研究。
在确定健康档案内容及指标时,通常要求所筛选的指标既方便可得,又要尽量满足科学性,即具有一定的灵敏度、代表性与独立性。本文将探讨如何利用数理统计方法来帮助落实这些筛选原则。
1 资料与方法
整个研究按照:提出指标→获得数据→筛选指标→确定指标的步骤来进行。
1.1 提出指标 利用文献检索法和专家咨询法提出健康档案指标并进行充分讨论,在取得比较一致意见的基础上,初步确定需要进行进一步筛选的指标体系。
1.2 获得数据 本研究采用现场调查获得的数据进行分析,所遵循的步骤是:设计调查表→现场预调查→培训与正式调查。调查表设计:主要围绕所提出的基本指标体系展开集中讨论并设计出调查表用于现场调查;现场预调查:分别在江苏省苏州市和河北省香河县进行现场预调查,根据入户预调查结果,对调查表进行了调整;培训与正式调查:为了更好地筛选指标,研究遵循城乡兼顾、东中西地区全有的原则,选定10个地区作为调查地区:江苏省苏州市、山西省太原市、广东省深圳市、四川省宜宾市、河北省香河县、浙江省桐乡市、广东省南海市、湖北省孝感市、陕西省岚皋县、甘肃省榆中县。在各地区按照等容量多阶段分层随机抽样方法进行三阶段抽样,共抽取5 402户家庭进行调查,整个调查工作于2003年1月结束。
1.3 筛选指标 (1)建立基础数据库并清理数据,描述各指标分布特征,将偏态数据正态化,为数据分析做准备;(2)利用变异系数法从灵敏度的角度筛选指标;(3)建立指标之间的相关矩阵,从代表性和独立性的角度根据相关系数的大小筛选指标;(4)利用标准化数据进行因子分析,从代表性的角度筛选指标;(5)根据上述三种数理统计方法结果对指标进行综合筛选。结合指标的专业意义,如果某指标在三种方法中至少有两种方法筛选的结果排序都很高,则该指标入选。
1.4 确定指标 (1)汇总筛选后的指标;(2)根据指标特性确定是否纳入健康档案。
2 结果
2.1 基本指标体系分类 利用系统法的原理和方法,将通过文献检索法和专家咨询法所得的指标进行汇总和整理。可将健康档案基本指标体系分为以下五大类:社会经济特征指标、健康状况指标、健康相关危险因素指标、卫生服务利用指标以及健康所造成的社会经济后果指标。在这五大类指标中,对于社会经济特征指标和记录卫生服务利用指标的意见比较统一,因此主要对其他三类指标进行筛选。
2.2 指标筛选 以调查得到的10个试点地区5 402户家庭18 774人的健康及其相关信息为基础,通过数理统计方法对备选指标进行系统筛选。因篇幅所限,仅以失能指标为例说明筛选过程。
2.2.1 描述指标分布特征 指标基本特征见表1。表1 指标基本特征汇总表为行走情况,B2为自我照顾,B3为日常活动,B4为疼痛或不适,B5为焦虑或抑郁
2.2.2 偏态指标正态化 对偏态指标相关数据分别进行平方根或对数处理。
2.2.3 相关矩阵及相关系数 指标筛选相关矩阵结果见表2。以r0.01(90)= 0.267为界值,判断任一指标与其他指标的相关性。根据相关系数的大小进行选择,以相关系数大于0.330 0为判断标准。表2 指标筛选相关矩阵结果
2.2.4 因子分析 指标筛选因子分析结果见表3。表3 指标筛选因子分析结果
2.2.5 综合筛选 指标综合筛选结果见表4。表4 指标综合筛选结果
2.3 确定指标 综合以上分析结果集体讨论确定指标。确定后的指标体系中的具体指标可以分为两大类型:第一类指标客观性强、比较稳定、需要连续获得并及时更新,适于通过健康档案记录方式来获得;而第二类指标则主观性比较强、更多涉及个人意愿、内容灵活,更适合于发挥调查手段的优势来获得。因此,在确定指标时也按这两大类分别汇总,详细结果见表5。本次研究中主要以第一类指标为主,并据此形成健康档案常规记录的基本指标体系。
3 讨论
健康档案是社区卫生服务人员全面了解和掌握社区卫生信息资源的工具。系统、全面的健康档案不但有助于分析居民健康状况、筛选高危人群和重点服务人群、作出社区诊断、开出社区处方并制定干预计划、采取针对性措施提高社区居民健康水平,而且可以为卫生决策部门制定政策提供信息和依据[4]。为了实现这些功能,必然要求科学合理地设计健康档案内容及其指标。
在提出和选择健康档案内容及其指标的时候通常采用的是定性方法,比如小组讨论和专家咨询法等。这些方法具有一定的灵活性,提出的指标范围比较广,而且往往更注重可得性和可操作性,但是缺乏定量证据的支持。为了弥补定性方法的不足,同时也为了满足指标筛选标准中的灵敏性、代表性和独立性要求,本研究综合采用了变异系数法、相关矩阵法以及因子分析方法。
变异系数法主要分析指标的离散趋势,考虑的是指标的灵敏性。如果指标的离散趋势小,则用于评价和区别的能力就弱[5-6];因此,将各指标按照变异系数进行排序,根据变异系数的大小来进行指标选择,就可以较好地保证所选指标具有灵敏度高的特性。
为了使所选择的指标具有较好的代表性和独立性,利用指标间相关矩阵作为挑选指标的依据是一种简便有效的方法[6-7];选择同类指标中与其他指标相关个数多的指标可以使其能够较强地代表其他指标,而选择同类指标中与其他指标相关个数最少的指标,可以使该指标的独立性得到保障。
此外,我们还利用因子分析作为确保所选指标具有代表性的另一个方法[8-10]。通过因子分析,我们可以提取对因子贡献率最大的指标,从而保证所选择的指标可以提供同类指标中的最大信息量。
根据各种方法独立筛选指标之后,我们主要结合专业知识和指标的实际意义来进行综合分析并加以取舍,最终确定指标并组成基本指标体系。
值得注意的是,基本指标体系中的所有指标的特征并不完全相同。第一类指标比较稳定、客观性强、需要连续获得并及时更新,诸如人体测量指标、对卫生服务的利用等指标,适合常规记录;而第二类指标则范围广且灵活、主观性比较强、经常涉及个人主观感受和意愿,诸如对医疗服务的满意度以及未就诊的病伤情况等,适合用断面调查的方法来收集[11]。因此,第一类指标就成为入选健康档案的最终指标。此外,还可以看出,所有指标并非在同一层面上,而是可以分成个人特征指标、家庭特征指标以及社区特征指标三个层次,因此这就提示我们,在设计健康档案时也必然要分成三种,即个人健康档案、家庭健康档案及社区健康档案。表5 健康公平性基本指标列表(按特征分)
指标分类第一类指标第二类指标指标特征客观性强、稳定、适于连续收集和及时更新主观性较强、多涉及主观意愿和感受、灵活适宜获取途径常规记录断面调查具家庭年收入;家庭年生活消费支出;家庭年食品支出;家庭年衣着日用支出;家庭年交通及通讯支出;家庭年住房、水电燃料支出;家庭年文化教育娱乐支出;家庭年医疗支出;2.健康状况指标2.1人体测量指标(3):身高;体重;BMI2.2发病(2):两周发病率;特殊疾病发病率2.3患病(3):两周患病率;半年患病率;特殊疾病患病率2.4失能(2):失能率;重度失能率2.5死亡(6):新生儿死亡率;婴儿死亡率;5岁以下儿童死亡率;孕产妇死亡率;年龄别死亡率;死因别死亡率主观健康(1):主观健康评分;未就诊的失能与病伤情况(7)3.健康危险因素指标3.1遗传/生理因素(2):遗传病史;体检结果3.2环境因素指标:3.2.1家庭环境(5):家庭类型;家庭人口数;人均住房面积;饮水类型;厕所类型3.2.2社区环境(5):社区类型;社区自然环境;社区人口;社区医疗机构数;社区医务人员数;3.2.3工作环境(4):是否接触毒物;是否工作条件差;是否工作时间无规律;是否交通不便3.3生活方式(13):吸烟率;平均吸烟量;饮酒率;平均饮酒量;母乳喂养率;饮食是否规律;早餐是否规律;坚持锻炼率;平均锻炼时间;是否从事有益业余爱好;平均睡眠时间;卫生习惯是否良好;是否定期体检3.4社会心理因素:3.4.1家庭因素(2):家庭负担人口比;家庭支持度3.4.2社会资本(2):人均社会团体成员数;社会交往度心理因素(6):安全感;社会信任感;生活满意度;紧张感;疲惫感;失望感4.卫生服务利用指标4.1保健(5):免疫接种率;产前检查率;平均产前检查次数;住院分娩率;产后访视率4.2医疗(5):平均门诊次数;门诊率;住院率;平均住院次数;手术率服务满意度(2):门诊满意度;住院满意度5、健康造成的社会经济后果指标5.1其他后果(4):影响就业率;造成被辞率;影响结婚率;影响生育率直接经济损失(2):医疗费用;附加费用间接经济损失(3):误工损失费用;他人误工损失;照顾他人误工费用 注:括号内数字为核心指标个数。