【摘 要】本文介绍了法语语料库在我国的发展状况,对我国法语语料库基础上的探讨进行了概括介绍,并对其运用进行了研讨,期望进一步对展开法语语料库探讨有所帮助。 【关键词】语料库语言学;法语语料库 Abstract: This paper reviews the development of English Corpus Linguistics in China, and introduces the studies based on English corpora in China, which is helpful for future research。 Key words: Corpus Linguistics English corpus 一、引 言 在欧洲,语料库语言学已经成为语言学的主流分支。语料库通常指为语言探讨收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。它是一个由大量的语言实际使用的信息组成的、专供语言探讨、略论和描述的语言资料库。语料库语言学是在语料库的基础上对语言进行略论和探讨的科学。它是随着计算机和网络技术发展应运而生的新的语言学探讨领域和探讨手段。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,略论和探讨语言系统的规律。 语料库语言学为语言探讨与教学提供了一种全新的措施和思路。它以真实的语言数据为探讨对象,对大量的语言事实进行系统略论。它探讨的是语言行为(language performance),而不是语言能力(language competence),也就是说它通过考察语言的实际应用来寻找语言使用的规律。 本文介绍了我国法语语料库的发展状况,对我国法语语料库基础上的探讨进行了概括介绍,并研讨了它在语言探讨、词典编纂和教学领域中的影响。期望对进一步展开法语语料库探讨有所帮助。 二、法语语料库在我国的发展 近年来,法语语料库语言学在我国取得了巨大进展,出现了众多各种类型的法语语料库,我国目前已有不少规模较大的语料库。如:早在1982年,上海交通大学的黄人杰、杨惠中教授就主持建立了一百万词次的专门用途法语语料库(JDEST)。2003年,桂诗春和杨惠中两位教授主持完成了中国法语学习者语料库(Chinese Learner English Corpus,简称CLEC),这是国际上第一部公开发布的学习者语料库,法语毕业论文,它对探讨中国学生的语言运用和使用失误等特征,以及它们与外语学习之间的关系等都具有十分重要的指导影响。除了书面语语料库之外,探讨者们也开始建立口语语料库。如南京大学创建的中国学习者法语口语语料库(Spoken English Corpus of Chinese Learners,简称SECCL)。上海交通大学也建立了大学法语学习者法语口语语料库。与此同时,随着个人电脑的普及,许多探讨者个人也开始建立适合自己的小型语料库,许多法语语料库应运而生。这些法语语料库大部分是中国法语学习者的中介语语料库。 随着法语语料库数量的增多,我国语料库基础上的探讨也越来越多。在计算机技术的支持下,语料库措施被运用于语言探讨的许多领域,如:词汇、语法、语义、语用、语体探讨、社会语言学探讨、口语探讨、词典编纂、语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。 对中国学生法语的略论目前主要从两方面进行:一是对比其他以法语为母语的语料库来略论学习者的语料特征;二是对失误特征进行略论。但是我国目前在语料库基础上的探讨还处于起步阶段,多使用语料的检索和频率统计结果。 三、法语语料库在我国的运用 随着计算机技术空前迅速的发展,法语语料库也在我国迅速发展。语料库措施在词典编纂、语言探讨和语言教学等方面也得到了越来越多的运用。语料库是语言探讨与教学的重要基础,是编写词典、语法书和教材的重要源泉。 语料库和语料库语言学在当今语言探讨由高度抽象转向语言的实际使用这个过渡中起着十分重要的影响:一是提供真实语料;二是提供统计数据;三是验证现行的理论;四是构建新的理论。提供真实语料是词典编纂的生命线。现在流行的法语词典几乎全部是基于大规模语料库编纂而成的。基于大规模语料库的法语语法书也已经问世。在理论建设上,基于法国国家语料库法语口语库的探讨表明,基于真实法语口语语料的法语口语语法跟基于书面语的语法有很大不同。 在运用语言学领域,词典编纂和语言教学同是语料库的最大受益者。目前已有多部词典在编纂或修订过程中,不同程度地使用语料库或电子文档收集词语数据,用于收词、释义、例句、属性标注等。南京大学近年来开发了NULEXID语料库暨双语词典编纂系统,涉及法汉两种语言,在新时代法汉大词典的编纂过程中起了重要影响。 |