U-WIN을 이용한 한국어 복합명사 분해 및 의미태깅 시스템 [韩语论文]-外语论文网

본 논문에서는 통계기반의 복합명사 분해 방법과 어휘의미망(U-WIN)와 사전 뜻풀이에서 추출한 의미관계 정보를 이용하는 한국어 복합명사 의미 태깅 시스템을 제안한다. 본 시스템은 크게...

본 논문에서는 통계기반의 복합명사 분해 방법과 어휘의미망(U-WIN)와 사전 뜻풀이에서 추출한 의미관계 정보를 이용하는 한국어 복합명사 의미 태깅 시스템을 제안한다.

본 시스템은 크게 복합명사 분해, 의미제약, 그리고 의미태깅의 세 가지 부분으로 이루어진다. 분해과정은 세종말뭉치에서 추출한 위치별 명사 빈도를 사용하여 최적의 구성명사 분해 후보를 선정하고 의미제약을 위한 구성명사 재분해와 외래어 복원의 과정을 수행한다. 의미범위 제약과정은 유사도 비교의 계산량을 줄이고 정확도를 높이기 위해 원어정보와 Naive Bayes Classifier를 이용해 가능한 경우 구성명사의 의미를 선제약한다. 의미분석 및 태깅과정에서는 bigram 구성명사의 각 의미 유사도를 구하고 하나의 체인을 만들어가며 태깅을 수행한다.

본 시스템의 성능 평가를 위해 표준국어대사전에서 추출한 3음절 이상의 40,717개의 복합명사를 대상으로 의미태깅된 테스트 세트를 구축하였다. 이를 이용한 실험에서 99.26%의 분해 정확도를 보였으며, 95.38%의 의미 분석 정확도를 보였다.

，韩语论文网站，韩语论文题目

韩国电影剧本中会话含义的略论探讨	모야모야 환아의 수술 후 자기효능감,	중국인 학습자를 위한 한국어 거절 화행
도시지역 여성결혼이민자의 재사회화	汉韩常用颜色词对比探讨	한국과 독일의 중등교육단계에서의 진로
韩国跆拳道运动的文化价值观探讨	영어권 학습자를 위한 한국어 교재 구성	형태 초점 접근법을 활용한 한국어 대조
항공사의 지각된 서비스품질이 실용적	한·중 사동 표현의 대조 연구	깔뱅의 기도론 연구
TV 포맷의 새로운 유형화 : 이야기, 놀이	영어 문장구조에 대한 이해가 읽기와 듣	高职院校韩语系建设的几点思考