이 연구는 대규모 말뭉치로부터 한국어 정형표현을 추출하여 그 분포와 특징을 살펴보고, 추출된 정형표현의 응용을 고찰하는 것을 목적으로 한다.이를 위하여 먼저 학술 서적, 소설, 신문, ... 이 연구는 대규모 말뭉치로부터 한국어 정형표현을 추출하여 그 분포와 특징을 살펴보고, 추출된 정형표현의 응용을 고찰하는 것을 목적으로 한다.이를 위하여 먼저 학술 서적, 소설, 신문, 구어 각 250만 어절씩, 총 1,000만 어절 말뭉치를 구성하고, 이 말뭉치로부터 N-gram 언어 모델을 사용하여 정형표현을 추출하였다. 정형표현 연구에서 기본적으로 고려해야 하는 추출의 단위 및 기준, 추출 방법 등에 대한 논의를 통해 교착어인 한국어의 형태통어적 특성을 고려할 때 형태 N-gram 추출 방법이 한국어 정형표현 연구에 적합하다는 것을 밝혔다. 또한 말뭉치로부터 정제된 정형표현 목록과 다양한 통계 정보를 효과적으로 추출하기 위한 처리 과정에 대해 상세히 설명하고, 문맥 정보와 통계 정보와 함께 제시하는 방법에 대한 연구를 통해 본 논문의 결과를 효율적으로 분석하고 이용할 수 있는 모델을 제시하고자 하였다.한국어 정형표현의 전반적인 출현 양상과 분포를 살펴보기 위해 특정한 길이에 집중하기 보다는 2-gram부터 9-gram까지의 자료를 추출하였다. 전체적인 분포뿐 아니라 각 장르별 분포와 특성까지 고찰함으로써 한국어에서는 영어와 달리 특정한 길이에서 정형표현의 수가 급격히 감소하는 구간을 찾기 어렵다는 점을 밝혔다. 그리고 앞선 연구의 결론들과는 달리 한국어에도 상당한 양의 정형표현이 존재하며 영어와 대등한 수준의 정형성을 지니고 있음을 보였고, 한국어에는 구어보다 문어에서 정형표현이 더 많이 나타난다는 것을 증명하고 짧은 길이의 정형표현은 장르에 구별 없이 고르게 사용되나, 정형표현의 길이가 길어질수록 문어적 특성이 강한 말뭉치에서 더 많이 반복적으로 사용된다는 것을 확인하였다. 아울러 각 정형표현의 장르별 특성을 비교·분석함으로써 이를 응용하여 정형표현의 활용도를 더 높일 수 있는 가능성을 제시하였다.그리고 한국어교육을 중심으로 정형표현의 응용 방안에 대해 논하였다. 한국어 교수에 사용되는 표현문형들의 선정 기준이 불명확하고 목록의 일관성이 결여되어 있다는 점을 지적하고, 정형표현 연구가 이 문제를 해결하는 방안이 될 수 있을 것임을 보였다. 아울러 정형표현 연구가 장르별, 상황별 말하기, 글쓰기 교육과 평가에도 활용될 수 있을 것이라 제안하였다.끝으로 관련 연구 분야에서의 활용을 위해 전체 1,000만 어절로부터 추출한 2-gram에서 9-gram까지의 정형표현 목록을 4개의 장르별 말뭉치의 빈도와 함께 빈도와 함께 부록에 붙였다.본 연구에서 제시된 정형표현 목록과 통계 정보들은 지금까지의 한국어 정형표현 연구로는 가장 큰 규모의 말뭉치를 대상으로 가장 넓은 범위를 살펴본 결과물이다. 따라서 한국어 교재 개발 및 사전 편찬 등과 같은 인접 분야의 연구에서 유용하게 사용될 수 있을 것이며, 나아가 국어학, 말뭉치 언어학, 전산언어학 등에서도 활용될 수 있을 것이다. ,韩语论文,韩语论文题目 |