加急见刊

试析信息处理与现代汉语轻声

佚名  2011-11-28

论文关键词:信息处理现代汉语轻声

论文摘 要:轻声是现代汉语中很有特点的一种语音现象,同一个词有可能读原调,也有可能读轻声,但读原调和轻声,词性和意思都不一样。这些现象通过表意体系的汉字无法显示出来,这给信息处理带来了很大的麻烦,也是信息处理过程中面临的一大难题。

轻声是现代汉语中很有特点的语音现象。它有独特的性质和功能,但在信息处理的过程中又有一定的缺陷。

一、轻声的性质

关于轻声学术界有三种不同的观点:一种观点认为轻声是一个独立的调位;另一种认为轻声是一种特殊的变调;再一种观点认为轻声属于轻重音。

徐世荣等认为轻声是一个独立的调位。徐世荣在《试论北京语音的“声调音位”》一文中指出:“北京语音若按实际调值来说,有两大类,一类是正常音节里的‘正常声调’;一类是弱化音节里的‘短弱声调’,就是一般所说的‘轻声’。”

罗常培、王均等认为轻声是一种变调。许多现代汉语教科书采纳了这一观点;“变调说”在国内比较有影响。罗常培、王均指出“如果联系汉语所有的方言来看,应该认为轻声也是变调的一种。”

厉为民等认为轻声属于轻重音系统。指出“汉语存在词重音,情形与英、俄两种有词重音的语言相类似。”“重音念得不对,有时会引起误会——一部分同形词因重音位置不同具有不同的意义。例如: ′dui tou (对头,名词):dui ′tóu(对头,形容词),′tiao li (调理):tiao ′lǐ(条理)”。

我们认为轻声不是四种声调以外的第五种声调。这是因为轻声的音高不起主要作用:首先,所有的轻声字都失去了其固有声调的音高调值,也正是由于这个原因,才被视为轻声。其次,轻声字的音高不固定,往往随着一个音节的音高而变化。这就使得轻声字本身没有稳定的音高值,因此,轻声字的时长很短,音量很弱,音高往往带有模糊性。由此可见,轻声的音高不起主要作用,轻声不是一个独立的调位。

轻声也不是一种变调现象,例如:“党委”中的“党”由原来的上声变为阳平,“一样”中的“一”由阴平变为阳平,变调一般是受后一个音节的声调影响,前一个音节声调变化,但变化后的声调仍然保持四声的区别特征,而轻声往往是受前音节的影响,后一音节的声调变得既短又轻,轻声的声调则失去了四声的区别特征。

轻声应当被看作是轻重音系统中的轻音。赵元任先生把普通话轻重音分为三级:对比重音、正常重音和弱重音,认为轻声属于弱重音。林焘先生也认为“音高在听辨北京话轻音音节时所起的作用远没有音长重要” “音长在听辨北京话轻重音时起了非常重要的作用。”林茂灿等的声学实验也证明“在普通话轻声字音中,介音和主要元音都以较大幅度离开其在四声字音中的位置,并向央元音方向移动,而元音尾,[n]尾和一些[η]尾有丢失的倾向”这种变化,与英语、法语、德语、西班牙和瑞典语的弱读音的“元音缩短”很相似。可以认为,普通话轻声也具有“元音缩短”现象,它自然属于轻音现象。由此可见,把轻声看为轻重音系统中的轻音是较为合理的。

二、轻声的作用

轻声有区别词性和词义的作用。有两种情况:

1.读轻声和原调,同形的词,词性和词义都不同。例如:

大意:dàyì 名词,表示大概的意思。例如:“文章大意是这样。”

大意:dàyi 形容词,形容粗心,不细心。例如:“你太大意了。”

精神:jīngshén 名词, 指人的意识、思维活动和一般心理状态。例如:“精神可贵”。

精神:jīngshen 形容词,形容表现出来的活力。例如:“老人很有精神。”

运气:yùn qì 动词,把力气贯穿到身体某一部分。例如:“一运气能感觉到疼痛”。

运气:yùn qi 名词, 指命运。例如:“他的运气很好。”

2.读轻声和原调可以区分字形不同的词。例如:

莲子:liánzǐ 指莲的种子,例如:“我爱喝莲子粥”。

帘子:liánzi 用布或竹子等做的有遮蔽作用的器物。例如:“门上挂了一个帘子。”

蛇头:shétóu 蛇的头部。例如:“这只蛇头是黑的。”

舌头:shétou 指辨味、帮助咀嚼和发音的器官。例如:“他把舌头咬了一下。”

三、普通话常见的轻声词语

普通话中常见的轻声词语一般有一定的规律,主要有以下几种:

1.助词“的、地、得、着、了、过”和语气词“吧、嘛、呢、啊”等。 例如:

我的、迅速地、热得很、拿着、看了、去过、好吧、好嘛、你呢、是啊。

2.部分单纯词中的叠音词和合成词中的重叠式的后一个音节。例如:

猩猩、饽饽、妈妈、星星、坐坐、劝劝、催催、讲讲。

3.构词后缀“子、头”和表示群体的“们”等。例如:

桌子、辫子、木头、石头、我们、他们。

4.名词、代词后面表示方位的语素或词。例如:

桌子上、脸上、山下、前面、前边、教室里、箱子里。

5.动词、形容词后面表示趋向的词“来、去、起来、下去”等。例如:

起来、过去、出去、上去、热起来、拿出来、跑过去、走回去。

6.下面词语里加着重号的字一律读轻声。例如:

来来去去、打打闹闹、黑不溜秋、胡里糊涂、傻不楞登。

7.有一批常用的双音节词,第二个音节习惯上要读轻声。例如:

巴结、巴掌、包袱、本事、编辑、扁担、别扭、玻璃、薄荷、簸箕、不是、裁缝。

苍蝇、柴火、称呼、出息、畜生、刺激、聪明、凑合、耷拉、大方、大爷、大意。

大夫、耽搁、灯笼、嘀咕、地道、地方、地下、东西、动弹、豆腐、对头、多少。

哆嗦、耳朵、翻腾、分析、风筝、高粱、胳膊、疙瘩、工夫、功夫、姑娘、故事。

棺材、官司、规矩、闺女、哈欠、含糊、核桃、合同、狐狸、葫芦、胡同、糊涂。

四、信息处理与轻声

由于轻声能区别词性和词义,再加上汉字是表意性的文字,不直接表音,所以,轻声现象通过表意性的汉字表现不出来,这给人们朗读带来了很大的麻烦。特别是习惯轻声,由于人们把握不准的话,不知道该不该读轻声,有的读不读轻声,意思不一样,例如: 1.他这种助人为乐的精神值得我们学习。

2.老张年龄那么大了,但显得很有精神。

3.这篇文章的大意我明白。

4.你太大意了,以后可要小心哪!

这两组句子,分别都有两个“精神”和“大意”,但在每一个句子中只有一种读法,前一个读原调,后一个读轻声。联系“精神”和“大意”前后的词语,就可以理解句子意思。

但是,像下面的句子:

5.到一个新的地方分不清东西。

6.这是你的不是?

7.他们一直打冷战。

8.那两个是小王的兄弟。

9.他实在不会说那种话。

10.那个人很像大爷。

这些句子例5中的“东西”里的“西”读阴平,“东西”表示方位,指东边和西边。当“西”读轻声时,“东西”指的是物品。例6中的“不是”里的“是”读去声时,“是”为动词,“不是”表示否定。当“是”读轻声时,“不是”表示错处、过失。例7中的“冷战”中的“战”读去声时,“冷战”指他们双方之间进行的无声较量。当“战”读轻声时,表示因寒冷或害怕浑身突然发抖。例8中的“兄弟”里的“弟”读去声时,“兄弟”指的是哥哥和弟弟,当“弟”读轻声时,指的是弟弟。例9中的“实在”里的“在”读去声时,“实在”是形容词,表示很老实、本分,当“在”读轻声时,“实在”是副词,表示的确的意思。例10中的“大爷”,当“爷”读阳平时,“大爷”指的是不好好劳动、傲慢任性的男子,当“爷”读轻声时,表示是伯父或尊称年长的男子。

这些词语在句子里会有两种读法,两种理解,而且单独就一个句子而言,两种读法、两种理解都成立。我们人工阅读或说话时,要准确地理解其中的意思,只有联系上下文去理解。那么,这种现象在计算机信息处理时,就遇到了困难。在一个句子里,读原调和轻声,所表示的意思都成立,这是由于轻声的缘故构成的歧义句。这种现象给人工阅读带来了麻烦,需要再联系上下文去理解意思,当然,计算机要理解这些句子的意思就更困难了。也正如亢世勇说的“尽管信息处理专家运用了规则排歧、统计概率排歧或者两者结合起来等多种方法进行排歧,但到目前为止,还没有一种方法、一种系统能够彻底解决这个问题。”

因为,目前,计算机完成了“字处理”,在“词处理”和“句处理”的过程中,遇到的问题比较多。例如:词的切分问题,词性的标记问题,也就是说让计算机面对真实文本自动进行词的切分和词性标记。其中词的切分这一项,是字处理突破后中文信息处理所必须突破的又一个核心问题,是必须要闯过的第二道难关。从20世纪80年代以来,计算机学界和汉语言学界联手攻克词的切分这一难关,20多年来,都取得了可喜的成果,研制了一些相应的软件。到目前为止,计算机自动分词,正确率可达到90%到95%,剩下的5——10%的词的切分问题,难度也比较大。其中就包括歧义句的词的切分问题,当然也包括由于轻声引起的歧义现象。对于歧义句的理解,我们运用增加、替换词语,或联系上下文理解意思。这又涉及到“句处理”的问题。句处理的主要内容是,怎样使计算机理解自然语言(现代汉语)的句子的意思,又怎样使计算机生成符合自然语言规则的句子。由此可见,“句处理”所需要的语言知识,将是一种涉及到语音、语义、语法、语用等多方面的综合性知识。而且,“句处理”要解决的核心问题是排除歧义的问题。科学家们正在努力攻克这一难关,争取早日突破信息处理中的一大瓶颈问题。

参考文献:

[1]徐世荣:《试论北京语音的“声调音位”》,《中国语文》,1957.7。

罗常培、王 均:《普通语音学纲要》,商务印书馆,2002。

厉为民:《试论轻声和重音》,《中国语文》,1981.1。

林 焘、王理嘉:《语音学教程》,北京大学出版社,1992。

林茂灿、颜景助:《普通话轻声与轻重音》,《语言教学与研究》,1990.3。

亢世勇:《面向信息处理的现代汉语语法研究》,上海辞书出版社,2004。

下载