20대 국회의원 선거의 정당 지지율 예측을 위한 머신러닝 기법 적용과 문제점 고찰 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-28
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

소셜 미디어(Social Media)를 통해 대규모의 데이터가 생성되고 공유되면서 데이터를 효율적으로 저장하고 분석할 수 있는 빅데이터(Big Data) 기술에 대한 관심이 점점 높아지고 있다. 또한 소셜 ...

소셜 미디어(Social Media)를 통해 대규모의 데이터가 생성되고 공유되면서 데이터를 효율적으로 저장하고 분석할 수 있는 빅데이터(Big Data) 기술에 대한 관심이 점점 높아지고 있다. 또한 소셜 미디어는 단순한 정보의 공유를 넘어 현실정치와 선거에서 강력한 영향력을 미치는 또 하나의 미디어로서 관심을 받고 있다. 빅데이터 분석 기술의 발달과 소셜 미디어의 영향력이 커짐에 따라 소셜 미디어에서 실시간으로 생성되는 대량의 테이터를 통해 사람들의 감정, 태도, 평가, 의견 등을 분석하는 감성분석(Sentiment Analysis)에 대한 연구가 활발하게 이루어지고 있다. 본 연구에서는 20대 국회의원 선거 관련 트위터(Twitter) 데이터의 머신러닝(Machine Learning) 기법을 이용한 감성분석을 실시하여 정당 지지율을 예측하고 예측모형의 극성분석 정확도를 측정하고자 한다. 또한 예측모형의 예측모형의 정확도에 문제점이 있다면 문제점을 파악하고 향후 예측 모형의 방향에 대해서 제안하고자 한다. 본 연구를 위하여 사용된 실험 데이터는 20대 국회의원 선거의 공식 선거운동 기간인 2016년 3월 31일부터 2016년 4월 12일까지 "총선", "국회의원", "선거", "413", "새누리당", "더불어민주당", "더민주", "새누리", "국민의당", "공천" 등 10개의 키워드로 총 1,048,574건의 트위터 데이터를 수집하여 구축하였다. 이 연구를 통하여 Lasso 및 Ridge 회귀 모형의 클래스 불균형 문제(Class Imbalance Problem)와 우리나라의 정치문화 여건 상 예측의 부정확성과 트위터의 제한적인 연령대 주된 사용과 정당이나 지지하는 후보를 홍보하는 용도로 사용하는 경우가 많음으로 인한 예측의 부정확성이 나타난 것을 확인하였다. 이러한 예측의 부정확성을 해소하기 위하여 트위터의 특성과 우리나라 정치문화 여건에 맞는 정교한 트위터 감성분석 모델에 대한 연구가 필요하다고 판단된다. 본 연구에서 제안된 방법이 정치 여론의 감성분석 외에 정책 제안이나 회사 제품에 대한 소비자 반응과 같은 감성분석이 요구하는 다양한 다른 영역에서 적용될 수 있기를 기대한다.

As a large amount of data has been created and shared through the social media, big data technology that is able to effectively store and analyze data, has received great attention. Social media is more highlighted than other traditional media because...

As a large amount of data has been created and shared through the social media, big data technology that is able to effectively store and analyze data, has received great attention. Social media is more highlighted than other traditional media because of the strong impact to politics and election as well as information sharing among people. As the technology of analyzing big data has been increasingly developed and the influence degree of the social media becomes larger, the sentiment analysis that analyzes human emotions, attitude, assessment, and opinions with massive data collected from the social media in real-time mode is being actively studied. In this study, a machine learning-based automatic sentiment analysis method for the Twitter data related to the election of the 20th National Assembly is proposed to predict the approval rate of political parties. Two regression models, Lasso and Ridge, were employed to predict the polarity of tweets. Based on the analysis result, we suggest future research area for the machine learning-based sentiment analysis. I collected 1,048,574 experimental tweets from Twitter through ten keywords - 'election of National Assembly', 'member of National Assembly', 'election', '413 - the date of the 20th election', 'saenuri party', the minjoo Party', 'theminjoo', ' aenuri', ‘the people's Party’, 'official nomination'. The experiment verified that the class imbalance problem of Lasso and ridge regression, environment of politics in Korea, the limited-age Twitter user group, and the promotion of specific candidates via Twitter leaded to the low performance of the two regression models. From the result, I concluded that sentiment analysis methods pertinent to the characteristic of Twitter and Korean political environment should be further developed. I expect that this study can be applied to other fields which need the analysis of public opinion such as policy decision-making and the consumers’ responses to new products.

참고문헌 (Reference)

활용도 분석

View

Usage

Share

免费论文题目: