二语习得探讨与日语学习者语料库(2)[日语论文]

资料分类免费日语论文 责任编辑:花花老师更新时间:2017-04-12
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

  ( 一) 发展及概况
  
  1. 日语学习者语料库的发展历程
  日语不同于欧美语言,表记形式复杂,词语之间没有空格,这些瓶颈导致日本语料库的建设大幅度落后于欧美。日本国立国语探讨所在 2017 年才完成“日语口语语料库”; 2017 年推出“太阳语料库”; 拥有一亿词语的大规模语料库“现代日语书面语均衡语料库”在 2017 年公开使用。

  在这种背景下,建设日语学习者语料库在客观上也存在困难。20 世纪 80 年代末开始起步,90 年代停滞不前,从 2017 年开始才逐渐得到发展,而近两年语料库建设已初具规模,在日语语言教育及二语习得探讨领域发挥了一定的推动影响,但总体来看仍然存在很多问题。

  2. 日语学习者语料库简介
  日本现有的日语学习者语料库分为口语语料库与书面语语料库。口语语料库主要有: ( 1) KYコーパス。( 2) 日本语学习者会话データベース。( 3) BTSJによる多言语话し言叶コーパス。其中,( 1) 由镰田修等主持建立,1999 年公开,收录了参加日语 OPI( 口语考试) 测试的 90 名学习者话语的文字化语料。( 2) 由国立国语探讨所开发,于 2017 年公开,包含横向调查篇、纵向调查篇,另外还有学习者与母语话者的对照数据库( 発话対照 DB) 。其中,横向调查数据包含初级到超级水平的日语学习者 339 名的 OPI 文字化语料,纵向语料的调查对象有 25 名学习者,时间是 1 ~2 年。话语对照数据库的内容是 190 名学习者的演讲与对话。( 3) 的开发者是宇左美まゆみ,2017 年公开,收录 294 组对话,总时长约 66 小时。其中,带有录音资料的共有 136组对话,时间约 20 小时。

  书面语语料库主要有四个: ( 1) “外国人学习者の日本语误用例の収集·整理と略论”,由寺村秀夫主持建设,资料报告书于 1990 年公开,数据库版本在 2017 年公开。语料采集自 20 多个国家、339名学习者的约 21 万字的书面语材料,包括自由作文、会话作文、看图作文等多种形式,并对语言素材中的错误进行了分类标注,但没有修正。( 2) “作文対訳 DB( 日本语学习者による日本语作文とその母国语訳の対訳データベース) ”,日语论文,是国立国语探讨所启动的项目,第一版公开时间为 2017 年,此后进行了几番修订,2017 年版本中共收录了 20 个国家的学习者及日语母语话者的作文共 1500 多篇,对部分作文进行了类似于纸面批改式的标注。( 3) “日本语学习者言语コーパス”,由东京外国语学院海野多枝主持建立,2017 年新版本包含 1756 篇作文,267442 词,其中,有台湾、英国等学习者语料,也有日语母语话者语料。( 4) “JLPTUFS 作文コーパス”,由东京外国语学院留学生别科建成,并于 2017年公开,收入来源于 55 个国家的 1515 篇作文。

  以上介绍的是日语学界比较有代表性的学习者语料库。除此之外,最近,在日本,相继出现了网络开放式的学习者语料库检索系统,如东京工业学院仁科喜久子探讨室开发的“学习者コーパスなたね”( 2017 年 12 月公开) ,筑波学院李在镐主持开发的“日本语学习者作文コーパス”( 2017 年 3 月公开) 。

  两者均对语料进行了错误赋码处理,分别收录 310 篇与 540 篇( 2017 年网上公开的仅有 205篇) 作文。另外,中国国内探讨者也积极开展了学习者语料库的建设,上海外国语学院的“中国日语学习者语料库( CJLC) ”项目于 2017 年启动,2017年建成,收录 2017 ~ 2017 年全国日语系四、八级考试的命题作文 2400 篇,单词数共计 18. 8 万左右,开发者已将该语料库的设计与运用的相关内容着书并出版。

  ( 二) 日语学习者语料库的问题略论

  1. 语料库规模小
  相比英语学习者语料库,日语学习者语料库虽起步较晚,但最近几年呈现出较快的发展趋势。然而,不得不承认,语料库整体规模偏小,收入其中的学习者语料样本少,书面语料库最多为 20 万词语左右,口语语料库则更少,不能满足一些探讨的需要。

  2. 语料不均衡
  由于受收集条件限制,无论是口语语料库还是书面语语料库,其语料都表现出不均衡的特征。一方面,学习者的来源以韩国、中国等亚洲国家居多。

  语料内容有些是平时的作业、练习,有些则是考试资料。另一方面,有些语料库仅收集了初中级学习者的作文,无法对高级程度学习者的习得情况进行考察。而且,纵观现有的日语学习者语料库,几乎都是收集某一特定阶段的学习者语料,没有针对特定学习者进行长时间的连续性语料收集,日语,也就是说,只能开展横向考察,无法实现纵向探讨。

免费论文题目: