대규모 사용자 어휘지능망 구축과 활용 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-28
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

자연언어를 대상으로 한 전산학적 처리에서 가장 중요한 것이 바로 언어자원이다. 자연언어처리에서 다루는 언어자원이란 인간의 모든 언어 행위의 결과물을 다양한 형태로 가공․저장...

자연언어를 대상으로 한 전산학적 처리에서 가장 중요한 것이 바로 언어자원이다. 자연언어처리에서 다루는 언어자원이란 인간의 모든 언어 행위의 결과물을 다양한 형태로 가공․저장하여 개발한 음성언어, 문자언어, 원시 및 분석 말뭉치, 전자사전, 어휘망, 온톨로지 등 전산적으로 사용하기 편리한 형태로 가공한 언어 관련 자원을 총칭한다. 최근 들어서는 이러한 언어자원 중 자연언어의 기본적인 어휘적 의미, 구문적 의미, 담화적 의미를 바탕으로 행위나 현상, 상태 등에 담긴 의미론적․개념론적 특성을 포함하고 있는 의미적 언어자원에 대한 연구가 활발하다. 사전(dictionary)을 비롯하여 의미 주석 말뭉치(sense tagged corpus), 어휘 데이터베이스(lexical database), 어휘 분류(lexical classification), 시소러스(thesaurus), 어휘망(lexical network or word network), 온톨로지(ontology) 등이 대표적인 의미적 언어 자원이라 할 수 있으며, 특히 시소러스, 어휘망, 온톨로지에 대한 연구는 최근 많은 분야에서 집중적으로 연구되고 있는 대상이다.
특히 어휘들을 긴밀하게 연결시켜 자연언어의 의미적․개념적 양상을 체계적으로 정리하려는 Word, EuroWord 등과 같은 어휘망 연구 개발은 자연언어처리에서 해결하고자 하는 의미 처리(semantic processing)와 밀접한 관계를 가질 뿐만 아니라 정보검색, 기계번역, 국어학, 문헌정보학 등과 같은 관련 분야에서도 그 필요성이 증대되고 있는 실정이다. 즉 단순한 어휘 나열이 아니라, 어휘들 간의 긴밀한 연결 상태를 하나의 망(network)처럼 구성하고 그것을 데이터베이스화하는 어휘망은 학문적․기술적으로 매우 활용도가 높은 필수적인 언어자원으로 급부상하고 있다고 할 수 있다.
본 연구는 이러한 어휘망의 한 실례로서 어휘의미론, 의미망 구축 원리, 자연언어처리 기술 등을 기초로 함과 동시에 기구축된 시소러스, 의미망, 온톨로지 등의 구축 방법을 비판․수용․수정하여, 대규모 한국어 어휘를 대상으로 한 어휘 데이터베이스이자 어휘망의 확장적 형태인 사용자 어휘지능망(User-Word Intelligent work; U-WIN)의 구축 원리와 실제를 제시한다. 이를 통해 일반적인 어휘망이 의미 관계에 의한 연결 구조를 중심으로 연구 개발된 것과는 달리, 의미 관계를 비롯하여 개념 관계, 형태 관계, 구문 관계 등과 같이 의미 관계의 범위를 확장한 어휘 관계를 적용하고, 의미 정보와 확장 정보 등 어휘와 관련된 다양한 정보를 포함하고 있는 U-WIN를 제시하여 어휘망의 확장적 형태를 모색한다. 나아가 한국어 어휘에 대한 대규모 의미적․개념적 연결 구조의 실제에 대한 타당성을 검토하여 한국어 어휘망의 한 모형을 밝히고자 하며, 또한 U-WIN 구축 및 관리에 필요한 구축관리도구를 비롯하여, U-WIN을 활용한 몇몇 응용 기술 개발 사례 등을 통해 U-WIN의 활용성을 제시한다.
본 연구의 핵심적 사항이 기술된 2장에서 5장까지의 내용을 아래와 같이 정리할 수 있다.
2장에서는 본 연구와 관련된 국내외 어휘망 관련 연구를 살펴본 뒤, 현재의 어휘망 관련 연구에서 사용되고 있는 용어와 개념을 정립하고, 기존 연구와 구축 사례의 문제점과 이를 통한 어휘망 구축에서의 고려사항을 기술한다.
3장에서는 U-WIN의 구축 원리와 실제를 전반적으로 기술한다.
먼저 U-WIN을 소개하고 전체 연구 개발 단계를 설명한 다음, U-WIN 구축과 관련된 어휘장이론, 틀의미론과 같은 이론적 배경 및 한국어 어휘의 특징 등을 분석한다. 그리고 이를 바탕으로 한국어 어휘를 대상으로 한 U-WIN의 구축 원칙과 내부 구조를 설명한다.
다음으로 U-WIN의 핵심적인 구조인 어휘 관계와 각종 정보에 대해 기술한다. U-WIN에서의 어휘 관계는 어휘들 간에 가질 수 있는 관계를 의미 관계뿐만 아니라 개념 관계, 형태 관계, 구문 관계까지 확장하여 기존 어휘망과 다른 형태를 가지고 있음을 설명한다. 또한 U-WIN에서는 의미 정보, 확장 정보에 대해서도 설명한다. 이를 통해 U-WIN만이 가지고 있는 의미 관계에 대한 차별성, 내부 구조에 대한 차별성, 한국어만의 개념화와 인지 체계에 대한 차별성 등 국내외 다른 어휘망과의 차별성을 제시한다. 덧붙여 일부 어휘를 중심으로 Word과 U-WIN을 비교하여 영어와 한국어어휘망의 차이점을 살펴본다.
4장에서는 U-WIN 구축․관리에 필요한 도구를 기술한다. 이 장에서는 다른 어휘망 구축․관리에서도 사용할 수 있도록 설계․구현된 U-WIN 구축관리도구를 기능별로 설명한다. 나아가 U-WIN을 효과적으로 브라우징할 수 있는 터치그래프 방식의 TBrowser와 평면적 분포 방식의 MBrowser를 소개한다.
5장에서는 U-WIN을 활용한 몇몇 응용 기술을 기술한다. U-WIN을 활용한 복합명사 분석 및 생성 기술, 한국어사전과 U-WIN을 활용한 한국어 어휘학습시스템, U-WIN을 활용한 과학기술정보 검색서비스 등 실제 구현된 몇몇 응용 기술을 통해, U-WIN의 실제 활용 사례와 그 응용 방법을 설명한다.

免费论文题目: