英语语料库语言学在我国的发展
王 三 2008-11-11
【摘 要】本文介绍了英语语料库在我国的发展状况,对我国英语语料库基础上的研究进行了概括介绍,并对其应用进行了探讨,期望进一步对展开英语语料库研究有所帮助。
【关键词】语料库语言学;英语语料库
Abstract: This paper reviews the development of English Corpus Linguistics in China, and introduces the studies based on English corpora in China, which is helpful for future research。
Key words: Corpus Linguistics English corpus
一、引 言
在欧洲,语料库语言学已经成为语言学的主流分支。语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。它是一个由大量的语言实际使用的信息组成的、专供语言研究、分析和描述的语言资料库。语料库语言学是在语料库的基础上对语言进行分析和研究的科学。它是随着计算机和网络技术发展应运而生的新的语言学研究领域和研究手段。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。
语料库语言学为语言研究与教学提供了一种全新的方法和思路。它以真实的语言数据为研究对象,对大量的语言事实进行系统分析。它研究的是语言行为(language performance),而不是语言能力(language competence),也就是说它通过考察语言的实际运用来寻找语言使用的规律。
本文介绍了我国英语语料库的发展状况,对我国英语语料库基础上的研究进行了概括介绍,并探讨了它在语言研究、词典编纂和教学领域中的作用。期望对进一步展开英语语料库研究有所帮助。
二、英语语料库在我国的发展
近年来,英语语料库语言学在我国取得了巨大进展,出现了众多各种类型的英语语料库,我国目前已有不少规模较大的语料库。如:早在1982年,上海交通大学的黄人杰、杨惠中教授就主持建立了一百万词次的专门用途英语语料库(JDEST)。2003年,桂诗春和杨惠中两位教授主持完成了中国英语学习者语料库(Chinese Learner English Corpus,简称CLEC),这是国际上第一部公开发布的学习者语料库,它对研究中国学生的语言应用和使用失误等特征,以及它们与外语学习之间的关系等都具有十分重要的指导作用。除了书面语语料库之外,研究者们也开始建立口语语料库。如南京大学创建的中国学习者英语口语语料库(Spoken English Corpus of Chinese Learners,简称SECCL)。上海交通大学也建立了大学英语学习者英语口语语料库。与此同时,随着个人电脑的普及,许多研究者个人也开始建立适合自己的小型语料库,许多英语语料库应运而生。这些英语语料库大部分是中国英语学习者的中介语语料库。
随着英语语料库数量的增多,我国语料库基础上的研究也越来越多。在计算机技术的支持下,语料库方法被应用于语言研究的许多领域,如:词汇、语法、语义、语用、语体研究、社会语言学研究、口语研究、词典编纂、语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。
对中国学生英语的分析目前主要从两方面进行:一是对比其他以英语为母语的语料库来分析学习者的语料特征;二是对失误特征进行分析。但是我国目前在语料库基础上的研究还处于起步阶段,多使用语料的检索和频率统计结果。
三、英语语料库在我国的应用
随着计算机技术空前迅速的发展,英语语料库也在我国迅速发展。语料库方法在词典编纂、语言研究和语言教学等方面也得到了越来越多的应用。语料库是语言研究与教学的重要基础,是编写词典、语法书和教材的重要源泉。
语料库和语料库语言学在当今语言研究由高度抽象转向语言的实际使用这个过渡中起着十分重要的作用:一是提供真实语料;二是提供统计数据;三是验证现行的理论;四是构建新的理论。提供真实语料是词典编纂的生命线。现在流行的英语词典几乎全部是基于大规模语料库编纂而成的。基于大规模语料库的英语语法书也已经问世。在理论建设上,基于英国国家语料库英语口语库的研究表明,基于真实英语口语语料的英语口语语法跟基于书面语的语法有很大不同。
在应用语言学领域,词典编纂和语言教学同是语料库的最大受益者。目前已有多部词典在编纂或修订过程中,不同程度地使用语料库或电子文档收集词语数据,用于收词、释义、例句、属性标注等。南京大学近年来开发了NULEXID语料库暨双语词典编纂系统,涉及英汉两种语言,在《新时代英汉大词典》的编纂过程中起了重要作用。
语料库用于语言教学的一个例子是上海交通大学的JDEST英语语料库,利用这个语料库,通过语料比较、统计、筛选等方法为中国大学英语教学提供通用词汇和技术词汇的应用信息,为确定大学英语教学大纲的词表提供了可靠的量化依据。这个语料库也在英语语言研究中发挥了作用,支持基于语料库的英语语法的频率特征、语料库驱动的词语搭配等项研究。
中国学习英语者(CLEC)涵盖我国中学生、大学英语4级和6级、英语专业低年级和高年级的学习内容,并对所有的语料作了语法标注和言语失误标注。根据这个语料库得到了词频排列表、拼写失误表、词目表、词频分布表、语法标注频数表、言语失误表等,还把这些数据与一些英语本族语语料库(如BROWN,LOB,FROWN,FLOB)进行了某些比较。这个语料库为词典编纂、教材编写和语言测试提供了必要的资源。
语料库是一个庞大的语言素材的集合体,主要用于观察、分析和研究目的语的各种特征。它能快速准确地提供诸如构词、搭配、语境等多方面的语料及信息。词汇教学是语料库资源和研究手段用于外语教学时间最早和成果最多的一个领域。语料库在外语学习中缩小课堂语言与真实语言的差距、培养学习者的语感和学习能力及研究能力等方面也正在发挥越来越大的作用。
利用语料库对语言的特征以及学习者的语言使用特征等方面作出分析,其分析结果可应用于指导语言教学的实践,改进课堂教学。比如,语言现象的分布和频率等信息可以用来指导教师确定哪些是教学的重点和难点等;学习者语言应用和使用失误等信息可以帮助教师诊断学生在语言学习过程中可能存在的问题,并为学生进行有针对性的训练。语料库还可以应用于教材编写和教学大纲设计等。语料库为确定教材或教学大纲中的词汇表、语法结构以及它们的编排顺序等提供了科学的依据。应用语料库开展计算机辅助语言教学也开始引起广泛的兴趣。
在英语教学与研究方面,语料库和语料库语言学一直发挥着非常重要的作用,从理论、内容和方法等方面对语言教学与研究都有重要影响,比如英语教学方面,经典性的词典和语法书等就是在英语语料库的基础上编写而成的。语料库的应用将从传统领域,如词典编篡,扩展到新兴领域,如编写教学大纲和教材、开展机助语言学习、机器翻译等;以语料库为基础的研究方法将逐渐受到重视和广泛应用;英语语料库及语料库语言学将在今后的英语教学和研究领域发挥更大的作用。
对于词汇学、语法学、语言理论、历史语言学等研究来说,语料库的作用目前大多还是通过语料检索和频率统计,帮助人们观察和把握语言事实,分析和研究语言的规律。语料库方法的发展会使这种仅起辅助作用的手段逐步变成必备的应用资源和工具。利用语料库,人们可以把指定的语法现象加以量化,并且检测和验证语言理论、规则或假设。
结束语
我国目前已建成大量的英语语料库,在规模、设计和研究目的等方面各具特色,已经被证明是对英语语言进行广泛研究的最佳信息源,极大地促进了对英语词汇、句法和语篇等的研究和描述,同时也推动了对英语不同变体的比较研究和英语定量的探索研究。英语语料库所蕴含的巨大的研究潜力使得以语料库为基础的研究快速发展壮大起来,英语语料库及语料库语言学研究有着广阔的发展前景。英语语料库及语料库语言学将在英语教学与研究方面发挥更大的作用。但是我国在语料库的发展和应用上还处于起步阶段,需要更多的探索。
参考文献:
[1] Thomas, J. and Short, M. (eds) Using Corpora for Language Research, London: Longman, 1996.
[2] McEnery T&Wilson A. Corpus Linguistics Edinburgh University Press, 1996.
[3] Kennedy, Graeme. An Introduction to Corpus Linguistics. Addison Wesley Longman, 1998.
[4] 杨惠中. 语料库语言学导论. 上海:上海外语教育出版社,2002
[5] 卫乃兴. 基于语料库和语料库驱动的词语搭配研究. 当代语言学. 2002年第2期