3. 语料未经处理或处理不全
Granger 曾指出,基于学习者语料库可以开展中介语对比略论和计算机辅助错误略论。前者是在本族语与学习者,或者不同母语背景的学习者之间,展开其输出语言的多元对比略论。后者是以学习者语言中出现的各种错误为对象,利用计算机技术对其进行标注、检索,略论错误产生的根源及对策。但两种探讨的前提条件是需要对学习者语料进行词性赋码与错误标注。
很多日语学习者语料库为生语料库,既没有对语料进行词性标注,也没有对错误进行分类标注,如果要使用这些语料进行探讨,必然需要探讨者各自进行加工处理,届时就会产生不必要的重复作业,极大地作用探讨效率。即使有些语料库对语料进行了处理,对学习者的语言错误进行了标注,但由于错误标注无统一标准,开发者基本只能根据主观判断进行分类和标注。此外,虽然当前日语自动词性赋码技术已经日趋成熟,但对语料中的错误进行标注主要还是依赖人工方式,标注质量不一,错标与漏标现象都存在,无法保证以此为基础的探讨的准确性。
4. 检索与统计功能不完备
建设语料库的最终目的是服务于使用者。如果只是收集了语料,而不能方便用户使用,将会大大降低其价值。成熟的语料库应具备检索与统计功能。观察现有的日语学习者语料库,只有最近开发的个别语料库实现了检索功能,可以上网直接检索,但检索功能有限,不能满足探讨需要。比如,我们想调查助动词“ようだ”在学习者语料库中的使用情况,因为有些语料库没有进行分词处理,输入关键词进行检索后就出现诸如“さようなら”这样的垃圾信息。如果能在检索系统中对词性进行限制,就会避免无用信息的出现。而统计功能的添加则有助于语料的定量略论,提高探讨效率。但当前语料库的统计功能或是根本没有,或只是简单的数量合计,不方便使用。
四、结语
学习者语料库的建成为二语习得探讨开辟了新途径,为发现学习者中介语形成的规律和特征提供了大量真实、自然的语料。近年来,日语学习者语料库得到了较大发展,但多数都存在一些不足。
我们希望通过以上问题的略论,为今后的语料库建设提供有益的参考,同时也希望有更多的探讨者参与到学习者语料库本体的探讨当中,对语料库建设的标准、规范等展开广泛、深入的研讨,这样,才能开发出更为实用的学习者语料库,满足教师及探讨者的多方面需求。
[参考文献]
[1]文秋芳,王立非. 二语习得探讨措施 35 年: 回顾与思考[J].外国语,2017( 4) .
[2]谭晶华,毛文伟. 中国日语学习者语料库的构建及运用[M]. 上海: 上海外语教学出版社,2017.
[3]何安平. 语料库在外语教学中的运用: 理论与实践[M]. 广州: 广东高等教学出版社,2017.
[4]望月通子. 日本语教学における学习者コーパスの构筑とICLEAJ [C]. 関西学院外国语学部纪要,2017( 7) .
[5]李在镐. タグ付き日本语学习者コーパスの开発[J]. 计量国语学,日语论文,2017( 2) . |