加急见刊

独立成分浅析挖掘技术在农村合作医疗中的应用

白高波 郑应文  2011-05-25

【摘要】 为揭示新型农村合作医疗基金支出的影响因素和规律,运用独立成分分析方法(ICA)对某市20个乡镇及办事处的住院基金支出数据进行了分析研究,找到了几个主要影响因素,并对这些因素作出了合理解释。然后提出了利用ICA分析结果预测短期基金支出的方法 。研究结果表明,ICA是农村合作医疗基金支出分析和预测的有效手段。

【关键词】 独立成分分析; 农村合作医疗; 影响因素

1 引言

自从在我国广大农村地区实施新型农村合作医疗(以下简称新农合)制度以来,农民健康问题得到了巨大保障。而新农合基金的合理使用是实施新农合制度过程中的主要难点问题之一。为了保证新农合制度的正常运行和保障农民的切身利益,合作医疗管理机构必须对新农合基金的使用进行监督和控制。新农合制度的实施牵涉面广,运行复杂,使得影响新农合基金支出的因素众多,常常导致基金透支或者过度结余,不利于基金的安全和效益的最大化,影响新农合制度运行的稳定性。

对某一地区而言,由于相关制度和政策的一致性,常常存在一些影响该地区基金支出的共同基本因素和规律,而这些共同因素和规律隐藏在表明现象背后,不易直观看出或不易量化。找到这些影响因素和规律,并分析它们对该地区任何特定医疗机构基金支出的影响,对该地区的新农合基金的合理使用、监管以及相关政策制度的制定具有一定参考价值。新农合制度已实施多年,积累了丰富的历史数据,本研究利用独立成分分析的方法对这些历史数据进行了分析,并在此基础上结合时间序列方法对基金支出作出预测。

2 独立成分分析原理和算法

独立成分分析(ICA)是信号处理领域在20世纪90年代后期发展起来的一项新处理方法,它是一种统计和计算技术,用于揭示随机变量、测量数据或信号中的隐藏成分。ICA可视为主成分分析(PCA)和因子分析(FA)的扩展,但它是一项更强有力的技术,当经典方法完全失效时,它仍然能够找出支撑观测数据的内在因子或源[1]。该方法的基本思想是,若观测信号由若干个独立信号源线性混合而成,在一定条件下,独立成分分析能从多路观测信号中分离出这些隐藏的独立源信号。其基本模型为线性瞬时混合模型,混合过程如图1所示。图1 混合过程图1中,s1(t),s2(t),…sn(t)为n个源信号,一般不能被直接观测到。t为时间采样点,x1(t),x2(t)…xm(t)为m个观测信号。观测信号xi(t)与源信号sj(t)的关系可表示成:xi=njaijsj(t)将上式写成向量形式为x(t)=As(t),其中A为混合矩阵,由混合系数组成,t时刻的各观测数据xi(t)是由t时刻各独立源信号sj(t)的值经不同的aij线性加权而得到的。独立成分分析的任务是在仅能测到xi(t)的情况下,估计出混合矩阵A和源信号sj(t)。

ICA算法有很多,本研究采用比较常用的经典算法FastICA,具体算法如下[1]:① 对观测数据进行中心化使其均值为0;② 然后对数据进行白化而得到z;③ 选择要估计的独立成分个数m;④ 初始化所有的wi,i=1,…m,其中每一个wi都具有单位范数。用下面第6步的方法对矩阵W进行正交化;⑤ 对每个i=1,…m,更新wi:wi←E{zg(wTiz)}-E{g′(wTiz)}wi 。其中g从下列式子中选取一个:g1(y)=tanh(a1y)g2(y)=yexp(y2/ 2)g2(y)=y3⑥ 对矩阵W=(w1,w2…wm)T进行对称正交化:W←(WWT)-1/2 W;⑦ 如果尚未收敛,则返回步骤⑤。

3 ICA在新农合补偿基金支出分析中的应用

在新农合运行过程中,影响基金支出的因素是很多的。疾病发生的不确定性和不可预测性、医疗机构的医疗行为、管理机构对基金的监管力度、政策制定的合理性等造成了基金支出的不确定性。因而,基金支出的变化是多种因素综合作用的结果。而同一地区在相同的制度和政策下必定存在一些共同的基本因素和规律。本文以某市为例,选取了该市管辖范围内的20个乡镇及办事处从2008年元月至2010年5月的住院补偿基金支出数据(该数据来自湖北省新型农村合作医疗网站),对其进行独立成分分析以及在此基础上对基金支出进行预测。部分乡镇住院补偿基金支出变化如图2所示,每个序列代表一个乡镇。 图2 乡镇住院补偿基金支出变化图3 处理后的独立成分矩阵

3.1 新农合基金支出数据的独立成分分析

20个乡镇及办事处从2008年1月~2010年5月共29个月的住院补偿基金支出数据构成20个时间序列,将这20个时间序列数据输入ICA分析程序,经过零均值化、白化处理及ICA分析,估计出4个独立成分,并得到混合矩阵A和4×29的独立成分矩阵。独立成分矩阵处理后如图3所示。A20×4=4.9460124.30967782.58955000.69033946.12190381.75366620.030366197.6419965.40186526.06876191.3661190112.209256.85873433.00069320.7657384810.9453556.59072605.5474871-0.097790451.3930630.66971650.6020909-0.05338535

第一独立成分(图3中IC1)代表了实际的住院费用对补偿基金支出的影响。从图中看出,实际住院费用对住院补偿基金支出的影响呈现明显的季节性,在2008年1月和2009年1月、2月以及2010年1月处均出现较低的波谷,说明住院费用明显受到春节因素的影响时,继而也影响到补偿基金的支出。春季期间,住院人数较少,因而基金支出也较少。在其他月份,住院补偿基金支出虽出现不可避免的较大波动,但一直处于较高水平。通过和住院费用趋势图对比发现,此图几乎与住院费用趋势图完全一致,这更说明了独立成分分析方法用于寻找基金支出的影响因素的有效性。另外,根据ICA分析得到的混合矩阵A可看出,在20个乡镇及办事处,第一独立成分所占权重最大,占了绝大部分比例,表示住院实际发生的费用对基金支出的影响最大。这提示合作医疗管理机构要把基金支出控制的重点放在住院费用上。

第二独立成分(图3中IC2)反映了报销比例对费用支出的影响。2008年6月20日之前,住院费用报销比例未作调整,基金支出维持在相对稳定的较低水平。住院费用报销比例从6月20日开始向上调整后,对费用支出产生了显著影响。图中可看出,从2008年7月开始,支出基金上升到一个较高水平。

第三独立成分(图3中IC3)可认为是起付线调整引起的费用支出变化。2008年9月住院人数增加很多,但住院平均费用在一年之中最低,由于该月补偿比例很高,超过60%,所以引起费用支出也较高。从中可看出,在补偿基金有限的情况下,若要扩大新农合受益面,提高补偿比例,就必须降低人均住院费用。

第四独立成分(图3中IC4)可能是医疗机构的医疗行为引起的费用支出变化,当然也存在其他解释。由混合矩阵可知,该成分在四个独立成分中的权重最低,也就是在支出费用中所占份额最小,对整个基金支出的影响较小。

3.2 利用ICA对住院补偿基金支出的预测

新农合管理机构为便于对今后的补偿基金支出进行控制,使基金被有效合理地使用,常常需要对后期的基金支出进行估算和预测。以上面介绍的某市为例,如果需要预测其所辖范围内的20个乡镇及办事处的后期基金支出,则需要对20个时间序列进行预测。由以上分析发现,20个时间序列分别由4个共同的时间序列线性混合而成。这就促使我们尝试先分别预测各个独立成分时间序列,然后转换成原始序列。这样就只需预测4个时间序列,大大减少预测工作量。

基本方法是:首先分别对上节估计出的各独立成分进行平滑处理,以降低数据噪声,然后根据各独立成分的时间序列特征选取AR(Auto Regressive)、ARMA(Auto Regressive Moving Average)或者ARIMA(Auto Regressive Integrated Moving Average Model)等模型,对平滑后的各独立成分时间序列分别进行短期预测[2,3]:spj(t+1)=gj[ssj(t), ssj(t-1),…,ssj(t-q)]最后用上节求得的混合矩阵A对预测的各独立成分进行还原:xp(t+1)=ASp(t+1),xp(t+1)即为预测的补偿基金支出。

通过以上方法同样可预测各乡镇及办事处t+1,t+2时期的补偿基金支出。另外,新农合管理机构如果对全市总体基金支出作出预测,只需在上述各独立成分预测结果基础上,按下式进行计算:x(t+1)=nj=1 mi=1aijsj(t+1)其中n为独立成分个数,m为医疗机构数,x(t+1) 为全市总体基金支出预测结果。

4 结束语

在新农合运行过程中,基金使用的监督和控制是既是重点又是难点。多种因素的综合作用导致了基金支出的不确定性,这些因素中,有的可以直观看出,有的则隐藏在现象背后,ICA正是揭示这些因素的有效手段。通过ICA揭示新农合运行中的影响因素和共同规律,以及这些因素对基金支出的影响大小,可以对后期基金的监管起到参考作用。另外,通过建立在ICA基础上的基金支出预测,为政策的调整、基金的合理使用提供一定的依据。

【参考文献】 1 Hyvarinen A,Karhunen J.Oja 独立成分分析.周宗潭,董国华,徐昕,等译.北京:电子工业出版社,2007. 2 Theodor D,Popescu . Time Series Forecasting Using Independent Component Analysis.World Academy of Science,Engineering and Technology ,2009,49:666~672. 3 S.Malaroiu,K.Kiviluoto,and E.Oja.Time series prediction with independent component analysis.In Proc.Int.Conf.on Advanced Investment Technology,Gold Coast,Australia,2000.

下载