웹 IR을 위한 영어 - 외래어 정합방법과 적용 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-27

나날이 발전하는 웹의 빠른 증가와 국제화사회로의 변화에 따른 다양한 웹 정보의 사용은 사용자에게 웹에서의 언어교차 정보 검색을 필요로 하고 있다. 이러한 상황에서 언어교차 정보 검...

나날이 발전하는 웹의 빠른 증가와 국제화사회로의 변화에 따른 다양한 웹 정보의 사용은 사용자에게 웹에서의 언어교차 정보 검색을 필요로 하고 있다. 이러한 상황에서 언어교차 정보 검색의 근간이 되는 단어간 유사단어의 자동 확인 방법의 개발이 필요하며, 이것은 기존의 번역단어를 통한 유사도 비교와 외래어의 음차표기에 대한 유사도의 비교로 해결할 수 있다.
본 논문에서는 한글단어와 영어단어 사이의 유사도 결정을 위하여 기존의 번역단어 비교방법외래어의 음차표기에 관한 한-영단어의 관련성 평가를 하는 3가지 방법인 외래어 표기규칙을 기반으로 영어의 발음기호 사전을 사용한 독음과 한글의 비교, 알파벳의 일반적인 발음가능형태를 조합하여 한글과 비교, 그리고 마지막으로 확장된 마코브 윈도우를 통한 통계적 모델을 재구현하였으며, 실제 컴퓨터 관련영역과 특허문서 관련영역에서 각각의 특정영역의 중요정보를 위주로 단어 비교방법들을 적용하여 그 타당성을 검증하였다.
본 연구에서의 실험과 구현은 Windows XP, 펜티엄4 - 1.4 환경에서 Visual C// 6.0으로 제작되었다.

The rapid growth of the Web and its various usage corresponding to the society change of internationalization on the Web requires more study on CLIR(Cross Language Information Retrieval). For successful CLIR on the Web, we need to compare Korean words...

The rapid growth of the Web and its various usage corresponding to the society change of internationalization on the Web requires more study on CLIR(Cross Language Information Retrieval). For successful CLIR on the Web, we need to compare Korean words with their English origins to evaluate the relevance of Web pages in Korean and those in English.
We study in this three methods evaluating the relevance of Korean-English crosswords. In the first, we use standard rules of translating English words to Koreans based on pronunciation symbols in a dictionary, get two preprocessed sets of Korean and English Web pages, and compare them. General pronunciation rules along with heuristic knowledge are used in the second, and a probabilistic model using the extended Markov window method is used in the third. We show the results of experiment in two domains, computer related web pages and technical patent related web pages, and those methods are promising in CLIR.
We use Visual C// 6.0 on Windows XP and Pentium 4 - 1.4 for the system.
