中国出生人口性别比研究(上)
马瀛通 冯立天 陈友 2003-04-25
早在1993年4月19日,当"人民日报"首次报道了中国第三次人口普查1981年全国29个省、自治区、直辖市全年出生婴儿性别比为108.47之后,出生性别比的问题就引起了中国政府的高度重视。有关出生性别比偏高问题的研究,也成了国内人口研究最为关注的一个课题。
1986年,在国家计划生育委员会的提议与倡导下,在各省、自治区、直辖市计划生育委员会经过充分的调查与研究的基础上,与人口研究单位联合召开了全国出生性别比专题研讨会,广泛、深入地分析与探讨了全国及各地区出生性别比偏高成因及其相关问题,当时在国内这是前所未有,在国际上也实属罕见。
迄今为止,有关出生性别比问题的研究成果,大多数都未突破1986年全国出生性别比专题研讨会对1981年出生性别比升高进行归因分析的思维定势。
近期,一些西文学者及宣传媒体,对始于80年代初的中国出生人口性别比逐年升高成因,所作出的种种猜测、质疑与分析基本是老调重弹。之所以如此,主要因为至今仍未有令人置信的相关成果可以诠释,使尚存疑点得以消除、尚存问题得以圆满答复所致。
美国密西根大学人口研究中心主任巴巴拉。安德森(Babara A.Anderson )教授和布赖恩。西尔弗(Brian D.Silver)教授,针对有关中国80年代来出生性别比变动研究的近期成果与结论,在1994年关于中国的生育与出生性别比专题研究报告中,明确而坦率地指出:虽然我们对中国的出生性别比升高进行了一些可能性解释的探索,但要肯定地回答这一问题,只能期盼于今后的研究。
重新认识出生性别比的概念、理论及其值域问题
所谓出生性别比,通常是为了便于观察与比较所定义的每出生百名女婴相对的出生男婴数。出生性别比对某一人口一定时期内出生的婴儿总数而言,可有人口出生性别比;出生性别比对分孩次而言,可有分孩次出生性别比。所谓某人口出生性别比,是指该人口某一时期(通常为一年)内出生的男婴总数与女婴总数的比值,用每百名出生女婴数相对应的出生男婴数表示。例如,某人口1975年的出生性别比为105,则表明在1975年出生总人口中,每出生100名女婴相对应的男婴出生数为105.
20世纪50年代中期(1955年10月),联合国在其出版的《用于总体估计的基本数据质量鉴定方法》(手册Ⅱ)(Methods of Appraisal of Quality of Basic Data for PopulationEstimates ,Manual Ⅱ)认为:"出生性别比偏向于男性。一般来说,每出生100名女婴,其男婴出生数置于102~107之间。"此分析明确认定了出生性别比的通常值域为102~107之间。从此,出生性别比值下限不低于102、上限不超过107的值域一直被国际社会公认为通常理论值,其他值域则被视为异常。
1967年美国优生协会出版的《优生季刊》第14卷第2期,刊登了印度孟买大学经济系普拉文。维萨里亚(Pravin M.Visaria)的"登记相对完整的国家及地区出生性别比"一文。在该文给出的80个国家及地区出生性别比中,有50个置于104.0~107.0,低于104.0,而置于90.2~103.9的有23个,高于107.0而置于1072.~117.0的有7个。1969年美国的唐纳德·博格(Donald J Bogue)在《人口统计原理》一书中指出,出生性别比约为105或106;1971年肯尼恩。坎梅耶(Kenneth C.W.Kammeyer)在《人口入门》一书中指出,出生性别比高102,但常为105,而生活条件差及艰难的地方,出生性别比低102;1976年亨利。赖奥克(Henry S.Shryock )等在《人口统计方法与材料》一书中指出,多数国家出生性别比为104~107;1981年罗伯特。加德纳(Robert Gardner)在《人口统计分析技术》一书中指出,出生性别比为105~107;1982年,雪莉。福期特。哈特利(Shirley Foster Hartley)在《人口比较》一书中指出,出生性别比为103~106.总之,众说不一。
由于出生性别比值域在102~107之间,涵盖了全球多数人口的出生性别比囊括了绝大多数国家和地区,因而便成为对调查与登记数据进行质量评估的重要参考以及出生性别比是否"正常"的判别标准。然而,如果出生性别比低于102或高于107,是否就可以断定其统计质量低或出生性别比异常呢?仅凭此就武断地认定其统计质量低,并不可取;仅凭此而不管其高出107多少或低于102多少就武断地认定其出生性别比异常,也不可取。因为影响出生性别比高于107或低于102的因素中,有些至今仍未被人们所认识。无论是从定性看还是从定量看,也无论是从定性与定量结合看,不少矛盾现象的矛盾解释所导致的矛盾性结论,在客观上已说明了这一点。
绝大多数学者普遍认为,无论是从一定时空条件上的出生婴儿总数看,还是从其分孩次出生看,男婴与女婴的出生概率虽有差异,但各自的出生概率上基本相对稳定或略有微小波动的,其出生性别比通常波动在102~107之间。1984年瑞典人口学者斯滕。约翰逊(StenJohanson)认为:"如果只有那些生过第一孩是女孩的家庭才去再生育第二孩的话,这种决定所生子女数量的做法是否会影响出生性别比?统计上的回答是:不会。这是因为第一孩的性别不会影响第二孩的出生性别"。此话断定了第二孩及其以上分孩次、分性别次序的母亲再育,完全与再育前母亲生过的孩次、性别次序史无关,其实质是坚持男婴或女婴的出生概率都是一个相对稳定的不变值,既不认为分孩次出生性别比随孩次升高而升高为政党,也不认为分孩次出生性别比随孩次升高而降低为正常。
若"母亲生下第一个孩子的性别与再生第二个孩子的性别完全指的是母亲"(马瀛通1993,1994),即以母亲再育前所历经的出生子女性别次序为条件,这就形成了统计学上的条件概率,回答就不会是否定而是肯定。
本文作者认为,分孩次出生性别比升高的一个不可忽视的因素是与分孩次、分性别次序的母亲再育或控制再育所占比重不同密切相关,男婴与女婴的出生概率分别与曾生子女先后出生性别次序不同的母亲再育所占比重相关。
在论述出生性别比问题时,学者朴柴冰(Chai Bin Pak)和楚兰湖(Num-Hoon Cho)在1995年第1期的《人口与发展论坛》(Population and development Review ,Vol.21,No.1,1995)中提出了三种水平的出生性别比失衡:其一是人口总体出生性别比水平;其二是分孩次出生性别比水平;其三是家庭规模出生性别比水平。对于前两种提法,无疑是正确的,而对于后一种提法,则值得商榷。因为他们所指的家庭规模是家庭的现存活子女数,而现存活子女年龄差异大,其出生的时间明显不同,不属于同期的时间范畴,因而不能直接用来表征出生性别比的要领。具体来说,若是在生有一个孩子的家庭中,多数生有一个女孩的家庭因生了第二个孩子而变成了生有两个孩子的家庭,必然会导致生有一个男孩的家庭所占一个孩子家庭的比重过大,其性别比无可置疑地要极端偏高。可见,以不同家庭孩子数划分的家庭规模性别比的高低,绝不能用来表征出生性别比的水平。
重新认识出生性别比与出生数量间的关系问题
近年来,在全国性会议材料、报刊、研究报告甚至学术刊物中,仅凭为数极其有限的一村、一乡或一县的一年的出生婴儿数,就对所计算出的出生性别比冠以"正常"或"失调"的结论,已是屡见不鲜,这是问题其一。
从统计学讲,若观测的样本大到近1000万人,其误差趋近于零,这也是无可质疑的。1990年中国第四次人口普查的1%与10%抽样,其样本人口都超过1000万,分别为1100万和11000万。以1%的普查样本获得的出生婴儿性别比为111.4,以10%的普查样本获得的出生婴儿性别比为111.5.北京大学人口所的学者对这种差异提出了质疑,认为这是在研究出生性别比问题中出现的一个百思不得其解的问题。这是问题其二。
在无极端因素直接干扰的条件下,出生性别比值的变动规律呈明显的大数定律牲。所谓大数定律,是指对大量随机现象中普遍存在的必然性与规律性的抽象化总结。其核心内容:一是明确指出,小量的观察很难从统计指标数值中得出必然的规律性的结论;二是十分肯定地认为,只有对所研究对象的随机现象进行充分而大量的观察,才能得出反映研究对象在一定条件下的必然性与规律性结论。随着研究对象的观察单位数增加到足够量时,研究对象的规律才通过误差很小的稳定性统计指标值反映出来。
出生性别比指标具有大数定律性质的这一显著特征,明确地说明了不同的出生婴儿观察量所得出的出生性别比,在一定置信度上必有其相应的置信区间观察出生性别比如同观察简单随机抽样结果一样,要保证计算出的出生性别比在95%置信度上的置信区间范围很小,就必须保证有足够的相应观察样本规模,否则误差相当可观。例如,检测一个人口某年的出生性别比为110.0的95%的置信度上,该值的上下限误差不超过0.4,若要保证在95%的置信度上,该出生性别比准确度要置于109.60~110.4之间,那么此需的出生样本观察量高达成300万人;若要保证在95%的置信度上,该值上下限误差不超过1.8即保证该出生性别比准确度要置于108.6~111.4之间所需观察的出生样本量也要高达10万人。
上述涉及到的"足够量",通常是指在95%置信度上,要保证所检测的一个以随机原则获取的统计值,在其上下误差不超过一定的数值所需要的观察样量。若所观察的样本量越大,其检测的统计值的误差就越小;若所观察的样量越小,其检测的统计值的误差就越大。
根据计算,1%普查抽样的样本出生性别比为115.362,其95%置信度上的出生性别比置区间为114.603~116.127,即样本出生性别比115.362的上限误差为0.759,下限误差为0.765;10%普查抽样的样本出生性别比为111.649,上限与下限的误差均为0.233.
比1%与10%普查抽样计算的样本出生性别比及其在95%置信度上置信区间的范围,显而易见的是:1%普查抽样的样本出生性别比在95%置信度上置信区间的上限值111.649排除在外。因此,出现了一定意义上的矛盾现象。如果没有意外的特殊情况,凭借抽样的一般理论,便可以断定:以1%普查抽样计算的样本出生性别比对总体的代表性较差,其产生原因不外乎有三种:要么是抽样技术问题:要么是质量控制问题;要么是抽样技术问题与控制问题兼而有之。需强调指出的是:1%普查抽样的基本单位是村与居委会而不是户。根据抽样的基本常识可知,整群抽样本分布均匀性,其样本代表性较差也较大。这就是说,1%普查抽样的样本出生性别比较实际误差更大。
这一结论从某种意义上说,也是对1%普查抽样资料用于出生性别比问题研究的一种可靠性评估。其结果表明:使用1%普查抽样资料进行出生性别比分析,因受制于抽样资料可靠性的影响,必然要对其分析产生一定程度的偏差。
重新认识中国近期出生性别比异常升高主要是统计不实问题
对于中国80年代以来出生性别比升高的归因分析,国内外学术界虽在成因的主次排序上不同,在成因的确认上不同、在出生性别比升高是否反映客观事实上也不同,但有一点是共同的,即出生性别比大大高出107是一种反常现象。造成这种反常现象的原因可大致归结为:若干数量的已出生女婴被瞒报;若干数量的女性胎儿在性别鉴定后被人工流产;若干数量的女婴被溺害;其他。
有的学者(徐毅等1991)认为,距调查时间较近的年份出生性别比较高,距调查时间较远的年份又"恢复正常"。为此,中国出生性别比升高的主要原因,吸能是瞒报漏报女婴所致。
有的学者(曾毅等1993)认为,中国出生性别比升高的第一位原因是女婴漏报;第二位原因是日益严重的孕期非法性别鉴定;另外,加上溺弃女婴的陋习在少数地区仍然存在。
有的学者(乔晓春1992)认为,"我国人口普查得到的出生婴儿性别比,反映的只是统计事实,对此问题的分析必然慎重,不能随意对其产生的原因进行解释。因为从数据本身还不足以发现原因"。在对近期中国出生性别比趋偏高的多种成因估计中,"更倾向于这样一种判断:我国1982年普查有漏报,而本次普查(1990年普查)漏报更为严重。我国实际的出生婴儿性别比在近十几年来可能有所提高,但估计不大可能超过107.现实出生婴儿性别比偏高是’真实的提高’和’虚假的提高’二者共同作用的结果"。
有的学者(李伯华1994)认为,1989年全国城镇出生性别比;实际上最高也不会超过107.7;同期的全国农村最高也不会超过110.2.根据这一推论,女婴的漏报、瞒报,至少使普查获得的1989年城镇与农村的出生性别比分别提高了3.6和4.2.进而得出:城镇的出生性别比上升是种"假性上升",而农村的出生性别比是"真性"与"假性"影响大致持平。
国家计生委在,《关于防止出生婴儿性别比升高的意见》(1994)中指出:"一些专家和有关部门认为,,80年代以来出生婴儿性别比的统计数字偏高的主要原因是瞒报、漏报出生女婴,在高出正常值的统计数字中大约有二分之一至四分之三是瞒报、漏报女婴引起的"。
综上所述,如果把中国近期出生性别比升高的主要原因归咎于统计不实,实际上中国近期出生性别比并非像统计结果所表征的那样,或者说客观上中国近期出生性别比并非像统计结果所示的那么高。如果统计不实是第一位原因,在扣除所谓"在高出正常值的统计数字中,大约有1/2~3/4是瞒报、漏报女婴引起的"这部分统计不实之后,中国近期出生性别比的升幅肯定会大幅度降低。
众所周知,由于抽样调查的目的与资料的来源、样本的大小、方法的选择以及调查登记的时间跨度长短不同,往往使各次抽样调查的结果不尽一致。因此,国家计生委1988年2‰人口生育节育抽样调查中的性别比,与其之前的1987年1%人口抽样调查,以及与人之后的1990人口普查相比,差异都很大。鉴于从70年代起的男性死亡概率通常略高于女性死亡概率,虽然0~4岁各个年龄在其出生时的实际出生性别比理应略高于登记所得的0~4岁各个分年龄性别比,但是,登记所得的分年龄性别比通常仍可间接反映相应年度人口出生性别比的大体水平。
如果把0~4岁各个分年龄性别比看作是历年出生性别比的大体水平,1982年人口普查的0~4岁各个分年龄性别比高出107的有0岁的107.63,1岁的107.83和2岁的107.35.这表明中国人口出生性别比从1980年0~2岁各个年龄出生队列在1987年和1990年分别为5岁、6岁、7岁和8岁、9岁、10随,其相应的性别比为107.97、107.22、108.78、107.77、107.43.根据此间男性死亡概率略高于女姓死亡概率推断,其性别比理应呈一致性的下降趋势;但事实并非如此,且都高于107.这说明中国进入80年代以来,出生性别比升高是不可否认的客观事实。1987年0~4岁的各个分年龄性别比分别为109.60、111.56、110.02、109.90和108.72,这表明自1983年起,中国人口出生性别比在继续升高,其相应出生队列在1990年人口普查时分别为3岁、4岁、5岁、6岁和7岁,性别比分别为109.12、108.47、108.65、108.64和108.69.虽然1987~1990年该队列的分年龄性别比都有所降低,但1989年的1岁和蔼岁两个出生队列的性别比下降3个百分点左右也是令人难以置信的。然而,其对应的个年龄出生队列性别比都在108.5及以上,这进一步说明,1983~1987年比1980~1982年的出生性别比又有了明显的升高。
出生性别比升高的趋势并没有在1987年止步,1990年人口普查给出的1988~1990年0~2岁的各个分年龄性别比分别为111.75、111.59和110.11,说明出生性别比在1987年之后仍继续攀升。
为此,可以认为3次调查用于性别比资料分析的数据质量是可靠的。这就是说,3次调查资料所得的有关反映中国近期出生性别比升高及升高所达到的程度,基本上反映了客观的出生性别比,并将之归因为统计不实及女婴瞒报、漏报则另当别论,因为那些零散的报道很难反映或不能反映中国人口出生性别比的总体水平。当然,认定这3次调查资料用来作出生性别比总体水平分析,其数据质量是可靠的,但并不意味着这3次调查资料的数据不存在少量的分性别出生瞒报、漏报、误报问题。确切地说,该数据质量可靠是相对的而不是绝对的。所谓"相对"指的是其数据质量中的问题,对分析研究出生性别比总体水平变动及其变动幅度的影响是次要的。
至于"距调查时间较近的年份出生性别比较高,距调查时间较远的年代又恢复正常"之说,则纯属在队列分析中,既没有对使用资料进行质量评估,也没有对两次不同时期调查资料的初始年代数据差异进行比较,因此完全是误用资料之果。详细分析请参见马瀛通著《出生性别比新理论与应用》一书。
重新认识出生性别比随孩次升高而升高等相关问题
1983年在分析中国1‰人口生育抽样调查的1981年全国出生婴儿性别比时,有的学者(柳春美,李竹)就指出:"以往的研究认为,一般情况下,妇女生育年龄越大,产次越高,婴儿的出生性别比反而越低":"随着胎次的升高,出生性别比反而呈现上升的趋势,这个总是有待进一步深入调查研究"。
中外学者普遍认定以美国等若干西方国家的分孩次出生性别比随孩次升高而下降为准则,来判别其他人口的分孩次出生性别比变动是否正常。美国著名学者安斯雷。寇尔(A.Coale)据此在1990年提出:"中国的分孩次出生性别比随孩次升高而升高这一特征很难代表真实现象",进而提出两种可能性的归因:一种是"溺婴的传统做法重新出现,致使高孩女婴遗失比重升高";另一种是"超生的婴儿中抱养所占比重甚高,抱养他人孩子的妇女在其生育史不申报抱养的孩子"。
有的学者(高凌1993)认为,出生性别比随孩次的升高而升高的现象并不是它的自然属性。在分析中国近期总人口出生性别比与分孩次出生性别比随孩次升高而升高时,不少学者认为这是由出生的第一、二孩比例上升、多孩比例下降所引发。不少学者还认为,中国近期分孩次出生性别比升高是随孩次与母亲生育年龄增高而上升,据此推断中国近期总体出生性别比升高是第二孩及其以上的出生性别比上升与母亲生育年龄推迟所致。
中国近期的第一孩出生性别比属正常范围,对此国内外学者都没有异议。二孩及以上出生性别比"异常"升高导致了中国总体出生性别比异常升高,而二孩及以上出生性别比"异常"升高的原因,美国学者艾尔德(Aird 1990)却认为,"中国强制性计划生育造成的溺杀女婴的结果"。与之观点近似的美国学者班久蒂(Banister 1992)认为,中国的人口普查与抽样调查中报的存活男婴与女婴精神基本相同。出生性别比升高的主要原因,是女婴死亡率不断升高。澳大利亚学者赫尔(Hull 1990)认为,中国出生性别比升高的可能性解释有三种:其一是溺杀女婴;其二是产前鉴定;其三是漏报女婴。
中国城乡普遍实施计划生育始于70年代初,无论是从总人口出生性别比还是从分孩次出生性别比看,70年代出生人口性别比较60年代都略有下降(最高孩次除外),且70年代呈随孩次升高相应出生性别比也随之有所升高的态势。80年代与70年代相比,除第一孩外,分孩次出生性别比都有大幅度升高,而且总人口出生性别比也显著升高。尤其是第二孩出生性别比较第一孩出生性别比竟高出5个百分点。
70年代的中国出生人口性别比,可以排除现代最先进又便捷的B 超仪鉴定胎儿性别产生的影响。至于其它胎儿性别鉴定方法,因技术原因与多方面的严格限定,则完全可以忽略不计。由于70年代的二孩次出生性别比受有女无儿家庭的再育比重升高的影响,而只生有女孩子无男孩子的家庭再育,其相应出生性别比也升高。因此,导致分孩次出生性别随孩次升高而升高。