U-WIN을 이용한 한국어 복합명사 분해 및 의미태깅 시스템 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-26
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

본 논문에서는 통계기반의 복합명사 분해 방법과 어휘의미망(U-WIN)와 사전 뜻풀이에서 추출한 의미관계 정보를 이용하는 한국어 복합명사 의미 태깅 시스템을 제안한다. 본 시스템은 크게...

본 논문에서는 통계기반의 복합명사 분해 방법과 어휘의미망(U-WIN)와 사전 뜻풀이에서 추출한 의미관계 정보를 이용하는 한국어 복합명사 의미 태깅 시스템을 제안한다.

본 시스템은 크게 복합명사 분해, 의미제약, 그리고 의미태깅의 세 가지 부분으로 이루어진다. 분해과정은 세종말뭉치에서 추출한 위치별 명사 빈도를 사용하여 최적의 구성명사 분해 후보를 선정하고 의미제약을 위한 구성명사 재분해와 외래어 복원의 과정을 수행한다. 의미범위 제약과정은 유사도 비교의 계산량을 줄이고 정확도를 높이기 위해 원어정보와 Naive Bayes Classifier를 이용해 가능한 경우 구성명사의 의미를 선제약한다. 의미분석 및 태깅과정에서는 bigram 구성명사의 각 의미 유사도를 구하고 하나의 체인을 만들어가며 태깅을 수행한다.

본 시스템의 성능 평가를 위해 표준국어대사전에서 추출한 3음절 이상의 40,717개의 복합명사를 대상으로 의미태깅된 테스트 세트를 구축하였다. 이를 이용한 실험에서 99.26%의 분해 정확도를 보였으며, 95.38%의 의미 분석 정확도를 보였다.

韩语论文网站韩语论文题目
免费论文题目: