비정형 텍스트 데이터가 증가함에 따라 감성 분석 기술에 대한 관심이 높아지고 있다. 감성 분석 기술은 특정 문서나 문장의 어조와 감성을 파악해 내는 것이다. 감성 분석의 결과에 중요한 ...
비정형 텍스트 데이터가 증가함에 따라 감성 분석 기술에 대한 관심이 높아지고 있다. 감성 분석 기술은 특정 문서나 문장의 어조와 감성을 파악해 내는 것이다. 감성 분석의 결과에 중요한 영향을 미치는 것은 감성 사전이다. 감성 사전을 구축하기 위해서는 단어의 감성 카테고리를 분류하고 단어의 감성 극성 강도를 정량화하는 연구가 필요하다. 영어권 연구에서는 단어의 감성 극성 강도를 정량화하는 연구가 활발하여 영어 감성 사전을 쉽게 구축할 수 있지만, 이는 한글 텍스트에 대한 감성 분석에는 부적합하다는 문제점이 있다. 국내 연구에서는 대부분 제한된 수의 단어에 대하여 설문을 통하여 감성 극성 강도를 설정 구축한 한국어 감성 사전을 이용하고 있으므로, 한글 문서에 대한 정확한 감성 분석에 어려움이 있다. 따라서 기존 감성 사전에는 존재하지 않지만 한국어 사전에 존재하는 새로운 단어에 대한 감성 극성 강도를 자동으로 추정하는 기술이 필요하다.
With the increase of unstructured data, sentiment analysis on unstructured data has become popular. Sentiment analysis is a technique to identify the tone and sentiment of a document or a sentence. In sentiment analysis, sentiment dictionary is import...
With the increase of unstructured data, sentiment analysis on unstructured data has become popular. Sentiment analysis is a technique to identify the tone and sentiment of a document or a sentence. In sentiment analysis, sentiment dictionary is important because it affects the results of sentiment analysis. To build a sentiment dictionary, it is needed to classify the sentiment category of a word and to quantify its sentiment polarity strength. In English-based studies, it is easy to build an English sentiment dictionary to quantify the sentiment polarity strength of a word. However, such English sentiment dictionary is unsuitable for sentiment analysis of Korean documents. In Korean-based studies, it is difficult to perform sentiment analysis for Korean documents precisely because most of Korean sentiment dictionaries with the sentiment polarity strength are built by surveys, and the number of words is limited. Therefore, an automatic technology is necessary to estimate the sentiment polarity strength of new words that do not exist in the pre-built sentiment dictionary. |