본 연구는 2013년1월부터 2015년 12월까지 3년 동안 국내여행을 한 외래 관광객을 조사대상으로 한국문화체육관광부에서 발표한 ‘외래 관광객 실태조사’ 설문지 데이터를 활용하여 외래 관... 본 연구는 2013년1월부터 2015년 12월까지 3년 동안 국내여행을 한 외래 관광객을 조사대상으로 한국문화체육관광부에서 발표한 ‘외래 관광객 실태조사’ 설문지 데이터를 활용하여 외래 관광객의 만족도를 확인하고 매우 만족한 집단의 특징을 파악하고자 한다. 분석모형은 의사결정나무의 CART, CHAID, CTree 알고리즘 중 가장 높게 분류되는 모델을 사용하였다. 그 결과 CART 알고리즘이 가장 잘 분류되었다. 목표변수는 만족도로 지정하였고, 만족도가 매우 높은 외국인 관광객들의 특징을 잡아내기 위해 의사결정나무의 CART 모델을 사용하였다. 과적합을 막기 위해 변수들을 선택하는 방법은 데이터 마이닝 기법 중 로지스틱 회귀모형, 의사결정나무(C4.5), 랜덤포레스트, 인공신경망, 로지스틱 회귀모형과 랜덤포레스트를 혼합한 모델을 사용하여, 정확도와 민감도가 가장 높은 방법을 사용하였다. 그 결과 로지스틱 회귀모형과 랜덤포레스트를 혼합하여 사용하면 조사연도, 연령, 거주국, 활동내역의 변수를 선택하게 되고, 이 선택 된 변수들로 더 높은 민감도를 보였다. 기존에 주로 사용되고 있는 변수선택 방법들을 혼합하여 변수선택을 하였고 외래 관광객 데이터를 분석할 때에는 이 혼합방법을 이용하는 변수를 선택하는 것이 좋은 성능을 나타낸다. 본 연구로 빅데이터를 연구함에 있어 좋은 예측력과 분류 특징을 잡아내는 분류 모델을 만들었고, 연구의 결과는 향후 외국인 관광객 유치를 위한 효과적인 마케팅전략 수립 시 기초 자료로 활용이 가능할 것이라고 사료 된다. ,韩语论文范文,韩语毕业论文 |