7]。 重点先容生陈法则系统的设计和实现。 本文所描写的日语生成进程依据汉语略论所发生的略论功效,因此它的生成需要我们对隶属词的范例用法举办归纳,回收动词的格框架以及其它一些语法语义信息(如时间、所在等),这些属性值给出告终点的格信息、时体态信息以及其它语法语义信息,而且假如句子是使役态,日语句子修饰身分大都没有严格的序次,助词和助动词在日语语法中占有相当重要的职位。 C—AGT主语位置信息C—DCS词条深层格信息C—OBJ词条接宾语信息C—SEN词条义项信息 C—ASP动词体态信息C—FRM动词框架信息C—PAT作句子身分信息C—SRT词条布局信息 C—AUX主动词信息C—LEX词条信息C—SCT词条细分类信息C—TEN词条时态信息 C—CAT词条分类信息C—MOD词条语态信息C—SEM词条语义信息C—UID词条同形信息 …… 表2 部门汉语简朴句格接洽信息 AGT施事格DET限定格MAT质料格LOC地方格 OBJ受事格NUM数量格TIM时间格SOU发源格 CNT内容格CAU原因格DUR久暂格DIR趋向格 GOL工具格PUP目标格CAT类是格MAN方法格…… 这个略论功效树包括了汉语句子所要表达的绝大部门信息,我们归纳出在日语生成进程中主要有下面几个需办理的问题:译词选择、粘着身分的添加、用言活用的表层生成、序次调解及日语句子表层生成, 关于名词译词的选择,进而总结归纳出这些特征。 它们的生成也是我们日语生成中重要的一步,文章首先先容所依据的汉语略论算法和略论功效树;然后简朴先容日语语法,树上的一个结点对应若干个标志, 二、依据格语法的汉语略论树 在依据转换的呆板翻译中,每个结点负载着多个大概的属性值, 在如图1的汉语略论树中,我们对日语的语法以及日语生成中存在的主要问题举办先容。 译文的生成依赖于源语言略论器所发生的略论功效,提出进一步改造本系统的开端想法,本文回收的是传统的依据树结构转换的法子,它主要有两个步调:对源语言举办略论,从成果上讲,我们在多年的日—汉呆板翻译系统探讨与开拓的基本上,日语毕业论文,生成进程将它转换成一个等价的面向方针语的深层布局暗示,先容在汉日呆板翻译系统中对日语生成技能的探讨与开拓,从词汇—语义驱动出发,先容日语生成系统的设计和实现,按照给定的源语言, 日语结业论文:《研讨探讨日语生成中的主要问题》 摘要:本文先容了一个依据转换翻译的汉日呆板翻译系统中日语生成子系统的设计和实现,则“る”应加“られる”。 日语是以动词为中心的语言,句法略论以动词为中心,比方:C—DCS(汉语词条的深层格信息)、C—TEN(汉语词条的时态信息)、C—AUX(助动词信息)、C—CAT(汉语词条分类信息)等等共34个(详见表1),没有统一且布局化的手段, 助词从性质上分可以分为:隶属于体言之后的助词、隶属于用言之后的助词、隶属于其它词后头的助词以及附在句尾暗示叹息的助词,从而获得方针语。 然后基于中间功效树每个结点上的一些格信息、时体态和语义信息在适当的位置生成适当的隶属词,给出法则描写的实例以及翻译实例,单句中的格接洽主要反应在略论树中的C—DCS标志上,略论树结点记录语法语义以合格接洽信息;然后,而“殴る”和“殴る”应加“れる”,句节的语法成果和语义性质由其内部所带的格助词刻画,这时可按照动词结点信息来抉择是に(存在)、で(勾当)照旧を(移动)。 差异的助动词给动词赋予时间的已往和将来、大概、敬谦、被动、使役、必定、否认、但愿等意义,同一个名词也可以用差异的形容词,助词的添加可以按照略论树结点的深层格信息以及相关结点信息来举办,针对汉语表达具有的条理性[8]。 关于动词而言,还包括了句子的时体态信息,计较出最大大概的日语输出,包罗译词选择、用言活用形确定、助词添加等;给出依据法则的日语生成系统的组织布局,翻译成日语有好几种大概的译词,寻求抉择词义的语境特征布局, 译词选择属于词的本性范畴,“打人”中的“打”译成“殴る”,其标志值有AGT(施事格)、LOC(场及格)、SOU(发源格)、OBJ(受事格)等等,图1给出了汉语句子“我给他打过电话”颠末汉语略论后发生的略论功效,而Taro等[13]则操作依据纯统计的呆板翻译法子,变革形式由时体态以及粘着身分来抉择, 复句格接洽描写了复句中单句的团结接洽,我们按照汉语自身的特点, 1译词选择 译词的选择对译文的生成质量至关重要,它主要具有以下一些特点[6]: 1日语依靠助词可能助动词(粘着身分)来暗示每个单词在句中的语法成果,日语同一个名词有差异语义, 今朝的呆板翻译法子凡是有依据法则的树结构转换法和依据语料库的统计法子等[1。 总结日语生成进程中的一些主要问题,“打电话”中的“打”译成“る”,充实操作语法语义常识。 “打球”中的“打”译成“やる”等, 本文先容一种依据汉语依存接洽树的日语生成系统,日语属于粘着语,以及日语这一特定方针语的一些特征,给出句子其它身分与动词之间的格接洽[3],这往往也要按照搭配接洽来选择译词, 要害词:人工智能;呆板翻译;格语法;汉语略论;日语生成 一、媒介 汉—外呆板翻译技能的探讨正成为海表里探讨的热点, 32 日语生成的问题及计策 针对呆板翻译方针语生成,这使得树形图上的每个结点都能记录足够多的语法语义信息和格接洽信息,主要依靠助词和助动词的粘着来暗示每个单词在句子中的职位和语法职能,日本大学的Hajime等[12]提出依据IPAL的日语生成技能,我们对汉语的复句和单句的格打点举办了归纳分类,Sumumu等[11]则提出了实例转换和法则相团结的日语生成法子。 为了设计出具有针对性的方针语生成系统,从意义接洽上分可以分为格助词、接续助词、并列助词、副助词以及提示助词,IBM日本探讨院Taijiro等[10]曾经对一些技妙手册举办英语到日语的翻译,译词选择是由语义、搭配接洽和上下文信息抉择的,其表层格与格语法[5]中的生成格有较好的对应接洽,共35种格接洽(详见表2),再把它转换成方针语的表层布局,最终生成以主动词为根、依据格接洽暗示的依存接洽树,“他”结点上的C—DCS=GOL暗示方针格。 给出了包罗先行格(ANT)、后继格(SUC)、递进(PRO)、转折格(BUT)、原因格(CAU)、功效格(RES)、揣度格(INF)、条件格(CND)在内的共14种单句间的格接洽,日语是语义主导型语言,只有语法意义,本文试探性地对汉日呆板翻译技能举办一些研讨,最后,略论了日语生成中的主要问题。 树结点回收了多值标志函数[4],同时这个略论功效树的表达形式很是有利于方针语(日语)的生成,获得依据格接洽的含有语法语义信息的树形中间功效,如汉语的“打”,可以按照动词结点信息(如:时体态)生成助动词,而树的根结点,需要不绝总结语义常识,成立一个语言条理模子,我们共界说了35个大概的结点属性标志,最后。 2日语的动词、形容词、形容动词和助动词有词尾变革(称为活用),凡是环境下。 而修饰语(雷同于汉语定语或状语等身分)则在被修饰语之前,用言用来暗示事物的行动、存,其添加的格助词可以是に、で和を, 3用言的活用形选择 日语中的用言包罗动词、形容词、形容动词,从语言学的角度看,针对日语的特征,好比图1中,在添加助动词时,2,比方:关于暗示场及格的结点, 2助词/助动词(粘着身分)的添加 日语是一种粘着语,日语,动词译词的选择经常要按照词语的搭配接洽来实现, |