의미 역 결정(Semantic Role Labeling)은 문장의 술어와 논항의 의미 관계를 결정하는 것으로, 정보추출(Information Extraction)과 기계번역(Machine Translation)과 같은 여러 자연어 처리 응용분야에서 의미 ... 의미 역 결정(Semantic Role Labeling)은 문장의 술어와 논항의 의미 관계를 결정하는 것으로, 정보추출(Information Extraction)과 기계번역(Machine Translation)과 같은 여러 자연어 처리 응용분야에서 의미 역 결정의 필요성은 널리 알려져 있다. 의미 역 결정은 격틀 사전 기반 방법과 말뭉치 기반 방법으로 나눌 수 있다. 하지만 한국어의 경우 한국어 격틀 사전 및 의미 역 부착 말뭉치와 같은 언어 자원이 부족하며, 영어와 비교했을 때 매우 다른 언어 구조를 가지고 있기 때문에 지금까지 개발된 방법들을 사용하여 좋은 성능을 얻기 힘들다. 이러한 문제를 해결하기 위해, 본 논문에서는 추가적으로 조사나 어미와 같은 접미사 정보를 이용하였다. 한국어는 일본어와 같은 교착언어 중 하나이며, 단어에 접사를 부착하여 문법적 기능을 나타낸다. 본 논문에서는 격틀 사전방법과 접미사 구조를 이용한 구조 기반 방법과 데이터 기반 방법을 통합하여 의미 역 결정을 하였고, 데이터 기반 방법으로는 CRF와 SVM을 사용하였다. 데이터 기반 방법은 불확실하며 부정확하기 때문에, 본 논문은 데이터 기반 방법이 적용되는 경우를 줄이고 구조 기반 방법의 적용 범위를 늘리고자 하였다. 실험에서는 15,224개의 논항을 이용하였으며, 데이터 기반 방법만 사용한 경우보다 4.85% 개선된 83.24%의 f1-score를 얻을 수 있었다. 이로써 본 논문은 접미사 정보를 이용한 방법이 한국어 의미 역 결정의 성능을 향상시킬 수 있음을 보여주었다.
Semantic Role Labeling (SRL) is to determine the semantic relation of a predicate and its arguments in a sentence. SRL is wide known for its necessity in many natural language processing applications such as Information Extraction (IE) and Machine Tra... Semantic Role Labeling (SRL) is to determine the semantic relation of a predicate and its arguments in a sentence. SRL is wide known for its necessity in many natural language processing applications such as Information Extraction (IE) and Machine Transition (MT). SRL can be divided into the case frame-based method and the corpus-based method. But Korean has the lack of linguis-tic resources like Korean case frame dictionaries and semantically annotated corpora. Also Korean semantic role labeling has faced to difficulty due to its different language structure compared to English, which makes it very hard to use appropriate approaches developed so far. That means that the case frame-based method and machine learning based methods could not show a satisfied per-formance, compared to English and Chinese. To complement these problems, we focus on suffix information analysis, such as josa (case suffix) and eomi (verbal ending) analysis. Korean language is one of the agglutinative languages, such as Japanese, which have well defined suffix structure in their words. In this , we label the semantic roles by integrating data driven method and struc-ture driven method using a case-frame and suffix analysis. Data driven method was used as the CRF, and we also test SVM to compare its performance to CRF’s. Our method is intended to in-crease the scope of structure driven method at the same time reduce the cases to which data driven methods should apply, because data driven method is uncertain and inaccurate. In experiments, we used 15,224 arguments and we are able to obtain 83.24% f1-score, it is more improved results than using only the machine learning based method. We demonstrated that suffix structure can improve the performance of Korean semantic role labeling. ,免费韩语论文,韩语毕业论文 |