오피니언 마이닝의 제품 특징을 이용한 극성 분류 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-27
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

컴퓨터와 통신 기술의 발전으로 전자상거래라는 비즈니스 모델이 출현하게 되었고, 전자상거래의 시장은 계속해서 발전하는 중이다. 전자상거래로 구매의 문제점은 구매자가 직접 물건을 ...

컴퓨터와 통신 기술의 발전으로 전자상거래라는 비즈니스 모델이 출현하게 되었고, 전자상거래의 시장은 계속해서 발전하는 중이다. 전자상거래로 구매의 문제점은 구매자가 직접 물건을 보고 만진 후에 구매할 수 없으므로 불안감을 가지고 제품을 구매하게 된다. 이러한 문제점을 해결을 위해 구매자들은 SNS(Social working Service)와 상품평을 통해 정보를 얻게 된다. 이 정보를 분석하는 방법으로 오피니언 마이닝(Opinion Mining)이 있다.
오피니언 마이닝에서 사용하는 긍/부정 사전은 영어의 경우에는 Word-Affect, SentiWord 등 공개된 사전이 있지만, 한국어의 경우에는 공개된 사전이 없다. 이러한 사전을 구축하기 위해 수작업으로 진행하는 방법도 있지만, 비용과 시간이 많이 들게 된다.
본 논문에서는 단어의 극성을 분류하는 방법의 정확도 향상을 위한 방법을 제안하고, 이 방법의 우수성을 증명하기 위하여 실험을 시행하였다. 제안 방법은 단어의 극성을 분류하기 위한 SO-PMI(Semantic Orientation from Point-wise Mutual Information)를 이용하였다. 한국어의 극성을 분류할 때에 생기는 문제점을 해결하기 위해 학습 데이터 구축, 학습 데이터의 전처리, 특징이용한 극성 분류를 사용하여 정확도를 높였다. 서술어의 분석을 위해 제품의 특징 추출 방법과 추출한 제품 특징을 이용하여 문장의 끝맺음 규칙을 적용하여 분석하였다. 특징별 극성 분류를 종합하여 특징별 감성 단어의 극성이 정확히 분류되었는지 평가하여 잘 못 분류된 결과를 확인한다. 평가 결과, 특징을 반영하지 않은 극성 분류에서는 제안한 극성 분류기가 기존의 SO-PMI와는 약 9%의 높은 성능을 보였고, SentiWord와는 약 5%의 높은 성능을 보였다. 특징을 반영한 극성 분류에서는 제안한 극성 분류기가 각각의 특징에서 다르게 사용되는 단어에 대한 극성 분류에서 기존의 SO-PMI와는 약 18%의 높은 성능을 보였고, SentiWord와는 약 11%의 높은 성능을 보였다. 또한, 학습 문서를 무작위로 수집하고 정제하여 학습 문서의 개수별 성능을 평가하였다. 평가 결과 무작위로 수집된 학습 문서에서도 기존의 SO-PMI보다 제안하는 극성 분류기가 더 좋은 성능을 보였다.

With the development of computer and communications, the business model, e-commerce, occurred and it has been continuously growing. It has a problem that consumers have to buy products with a feeling of anxiety as they could not actually touch nor see...

With the development of computer and communications, the business model, e-commerce, occurred and it has been continuously growing. It has a problem that consumers have to buy products with a feeling of anxiety as they could not actually touch nor see the products. To solve this problem, buyers get information through SNS(Social working Service) and rates. Opinion Mining is used to analyze this information.
English Positive-Negative words dictionaries , such as World-Affecct, SentiWord are used in Opinion Mining, however, there are no Korean dictionaries. Dictionaries could be complied by hand, but it take lots of time and costs.
The suggested the method for improving accuracy of the classification and conducted an experiment to verify superiority of it. SO-PMI(Semantic Orientation from Point-wise Mutual Information) is used to classify the polarity of words. To settle a matter, occurring when the polarity of Korean is classified, it improved the accuracy by establishing and preprocessing a learning data and considering characteristics. It analyzed predicate by extracting characteristics of products and using the characteristic and applying rules, used at the end of a sentence. It checked whether words, expressing emotions, were accurately classified by combining polarity classification for per characteristic. According to the result, the new classifier performed better than the existing SO-PMI by 9% and by 5% than SentiWord in the classification, not reflecting characteristics. On the contrary, it was better than the existing SO-PMI by 18% and by 11% than SentiWord. Furthermore, it evaluated the performance for each amount of documents by randomly collecting and refining them. In this case, the classifier also performed better than the existing SO-PMI.

韩语论文韩语论文范文
免费论文题目: