이 논문의 목적은 현대 한국어 부사의 개별적 속성과 관계적 속성에 대한 계량적 연구를 위해서 확률 통계 모형을 이용한 분석과 네트워크 분석을 수행하는 것이다. 이를 위해서 2011년 12월...
이 논문의 목적은 현대 한국어 부사의 개별적 속성과 관계적 속성에 대한 계량적 연구를 위해서 확률 통계 모형을 이용한 분석과 네트워크 분석을 수행하는 것이다. 이를 위해서 2011년 12월에 배포된 ‘21세기 세종계획’의 현대 한국어 구어 형태분석 말뭉치와 현대 한국어 문어 형태의미분석 말뭉치에 나타난 접속부사와 일반부사를 추출하여 기초 자료를 구축하였다. 우선 말뭉치에 나타난 부사들을 구어와 문어로 나누어 개별 현대 한국어 부사의 빈도와 분포를 계산하였으며, 이를 토대로 말뭉치에 나타난 현대 한국어 부사의 확률 통계 모형을 제시하였다. 구어에서는 1,697개 부사 유형, 121,779개의 부사를 추출하였고, 문어에서는 6,032개 부사 유형, 646,880개의 부사를 추출하였다. 구어와 문어에서 나타나는 부사의 유형과 빈도는 큰 차이를 보였으나, 두 자료에서 모두 부사의 빈도순위와 빈도가 반비례하는 것이 관찰되었고, 멱함수의 법칙을 따르는 것을 확인하였다. 또한 구어와 문어에서 관찰한 부사의 빈도를 토대로 구어성을 측정하였는데 부사 ‘제일, 되게, 진짜, 막’ 등은 구어성이 높은 부사였고, 부사 ‘제법, 무척, 더욱, 몹시’ 등은 문어성이 높은 부사였다. 한편 위의 결과를 바탕으로 말뭉치에 나타난 현대 한국어 부사의 빈도 스펙트럼과 어휘 성장 곡선을 계산하였고, 지프-만델브로트의 확률 통계 모형과 LNRE 모형을 적용하여 일반 말뭉치에 나타날 수 있는 부사의 빈도와 분포를 예측하는 모형도 제시하였다.
다음으로 말뭉치에 나타난 부사와 용언의 공기관계를 이용하여 부사 네트워크 분석도 수행하였다. 부사 네트워크 분석은 부사와 공기하는 용언의 의미와 공기빈도를 토대로 여러 중심성을 측정하여 부사들이 어떤 구조로 관계를 맺고 있고, 서로 어떤 영향을 주고받는지를 계량화한 분석이다. 구어와 문어로 나누고 고빈도 부사 75개를 대상으로 네트워크 분석을 수행하였는데 구어에서는 75개 부사 중 용언과 ‘유의미한’ 공기관계에 있는 부사는 50개, 용언은 303개, 이들의 공기유형은 882개였다. 문어에서는 75개 부사 중 용언과 ‘유의미한’ 공기관계에 있는 부사가 66개, 용언은 1,527개, 이들의 공기유형은 4,639개였다. 구어 부사 네트워크에서 여러 중심성을 측정하였는데 중심성이 높은 부사는 ‘많이, 다, 좀, 되게, ...’ 등이었고, 문어 부사 네트워크에서는 ‘더, 잘, 다시, 다, ...’ 등이었다. 구어와 문어 부사 네트워크는 모두 크게 2개의 군집으로 나누어졌는데 구어 부사 네트워크는 ‘거의, 가장, 너무, 되게’ 등의 정도부사류 군집과 ‘많이, 딱, 다, 잘, 덜’ 등의 상태/양태부사류 군집으로 분류되었다. 문어 부사 네트워크도 크게 ‘너무, 되게, 좀, 더, 진짜’ 등의 정도부사류 군집과 ‘많이, 딱, 다, 잘, 막’ 등의 상태/양태부사류 군집으로 분류되었다.
이 논문은 단순히 말뭉치에 나타나는 부사의 유형과 빈도만을 기술하는 것에서 더 나아가, 부사 빈도 분포를 계량적으로 분석하였으며, 확률 통계 모형을 이용하여 부사의 유형과 빈도를 추정하는 모형을 제안하였다. 이 방법은 말뭉치를 이용하여 부사를 연구하는 하나의 방법론이 될 수 있을 것이라고 생각되며, 말뭉치를 바탕으로 한 다른 품사의 유형과 빈도 분포 연구에도 적용할 수 있을 것으로 보인다. 또한 부사 네트워크 분석은 부사와 용언의 관계적 속성을 계량적으로 이해할 수 있고, 부사 연구에서 그 동안 언어 직관으로 해석하기 어려운 문제에 대한 실마리를 제공해 줄 수 있다는 점에서 그 의의를 지닌다.
,韩语论文题目,韩语论文网站 |