( 一) 发展及概况 在这种背景下,建设日语学习者语料库在客观上也存在困难。20 世纪 80 年代末开始起步,90 年代停滞不前,从 2017 年开始才逐渐得到发展,而近两年语料库建设已初具规模,在日语语言教育及二语习得探讨领域发挥了一定的推动影响,但总体来看仍然存在很多问题。 2. 日语学习者语料库简介 书面语语料库主要有四个: ( 1) “外国人学习者の日本语误用例の収集·整理と略论”,由寺村秀夫主持建设,资料报告书于 1990 年公开,数据库版本在 2017 年公开。语料采集自 20 多个国家、339名学习者的约 21 万字的书面语材料,包括自由作文、会话作文、看图作文等多种形式,并对语言素材中的错误进行了分类标注,但没有修正。( 2) “作文対訳 DB( 日本语学习者による日本语作文とその母国语訳の対訳データベース) ”,日语论文,是国立国语探讨所启动的项目,第一版公开时间为 2017 年,此后进行了几番修订,2017 年版本中共收录了 20 个国家的学习者及日语母语话者的作文共 1500 多篇,对部分作文进行了类似于纸面批改式的标注。( 3) “日本语学习者言语コーパス”,由东京外国语学院海野多枝主持建立,2017 年新版本包含 1756 篇作文,267442 词,其中,有台湾、英国等学习者语料,也有日语母语话者语料。( 4) “JLPTUFS 作文コーパス”,由东京外国语学院留学生别科建成,并于 2017年公开,收入来源于 55 个国家的 1515 篇作文。 以上介绍的是日语学界比较有代表性的学习者语料库。除此之外,最近,在日本,相继出现了网络开放式的学习者语料库检索系统,如东京工业学院仁科喜久子探讨室开发的“学习者コーパスなたね”( 2017 年 12 月公开) ,筑波学院李在镐主持开发的“日本语学习者作文コーパス”( 2017 年 3 月公开) 。 两者均对语料进行了错误赋码处理,分别收录 310 篇与 540 篇( 2017 年网上公开的仅有 205篇) 作文。另外,中国国内探讨者也积极开展了学习者语料库的建设,上海外国语学院的“中国日语学习者语料库( CJLC) ”项目于 2017 年启动,2017年建成,收录 2017 ~ 2017 年全国日语系四、八级考试的命题作文 2400 篇,单词数共计 18. 8 万左右,开发者已将该语料库的设计与运用的相关内容着书并出版。 ( 二) 日语学习者语料库的问题略论 1. 语料库规模小 2. 语料不均衡 语料内容有些是平时的作业、练习,有些则是考试资料。另一方面,有些语料库仅收集了初中级学习者的作文,无法对高级程度学习者的习得情况进行考察。而且,纵观现有的日语学习者语料库,几乎都是收集某一特定阶段的学习者语料,没有针对特定学习者进行长时间的连续性语料收集,日语,也就是说,只能开展横向考察,无法实现纵向探讨。 |