한국어 문서 감정 분류를 위한 감정 자질 추출 및 가중치 강화 기법에 관한 연구 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-28
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

본 논문에서는 한국어 감정 분류에 기반이 되는 감정 자질의 효과적인 추출 방법과 추출된 감정 자질의 가중치 강화를 통해 한국어 문서 감정 분류의 성능 향상을 얻을 수 있는 기법을 제안...

본 논문에서는 한국어 감정 분류에 기반이 되는 감정 자질의 효과적인 추출 방법과 추출된 감정 자질의 가중치 강화를 통해 한국어 문서 감정 분류의 성능 향상을 얻을 수 있는 기법을 제안한다. 한국어 감정 자질 추출은 감정을 지닌 대표적인 어휘로부터 시작하여 확장할 수 있으며, 이와 같이 추출된 감정 자질들은 문서의 감정을 분류하는데 중요한 역할을 한다. 문서 감정 분류에 핵심이 되는 감정 자질의 추출을 위해서 영어 단어 시소러스 유의어 정보를 이용하여 자질들을 확장하고, 영한사전을 이용하여 확장된 자질들을 번역하여 감정 자질들을 추출하였다. 그 후, 추출된 감정 자질을 추가 확장하고 학습 데이터를 이용하여 얻을 수 있는 감정 자질의 카이 제곱 통계량(χ2 statics)값을 이용하여 각 문장의 감정 강도를 구한다. 이렇게 구한 문장의 감정 강도의 값을 TF-IDF 가중치 기법에 접목하여 감정 자질의 가중치를 강화시킨다. 마지막으로 긍정 문서에서는 긍정 감정 자질만 강화하고 부정 문서에서는 부정 감정 자질만 강화하여 학습하였다. 본 논문에서는 문서 분류에 뛰어난 성능을 보여주는 지지 벡터 기계(Support Vector Machine)를 사용하여 제안한 방법의 성능을 평가한다. 평가 결과, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 약 2.0%의 성능 향상을 보였다.

韩语论文网站韩语论文
免费论文题目: