추천문장 검색 및 대상추출을 위한 확률 및 규칙 통합 모델 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-27
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

This suggests a method of searching for sentences of recommending particular goods in web documents in Korean. Here, sentences of recommendation include sentences of comparison, which compare and account for, say, product A and product B, superl...

This suggests a method of searching for sentences of recommending particular goods in web documents in Korean. Here, sentences of recommendation include sentences of comparison, which compare and account for, say, product A and product B, superlative sentences expressing the meaning of ‘product A is the best,’ and simple sentences of recommendation saying ‘I recommend product A.’ This classifies such sentences into types, and in conclusion, suggests a method to find out what products have good reputation. Such a method can help to reduce time for deciding what to purchase. As for the above types of sentences, by now some studies have been conducted on sentences of comparison and superlative sentences among other sentences of reputation. However, work on Korean in this area is in an early stage. Thus, this study has developed a technique of search for sentences of recommendation and extraction of opinions, and applied the technique to restaurant reviews.
A different approach is necessary because Korean documents are different from English ones in structure and characteristics. As Korean is an agglutinative language, affixes are combined with roots to mark each word’s function in Korean sentences. Thus, further information of affixes is important but there has been no work using them as features for machine learning. Moreover, there has been work on classification of opinions of comparison but yet no work on detection of subjects of opinions of comparison.
In order to solve such problems, this has classified sentences of recommendation by means of recommendation keywords, rules and Naïve Bayes. Not only basic information of parts of speech yielded from machine learning values with a morpheme analyzer, but also words not registered in the morpheme analyzer dictionary and specific types of particles were used. In terms of this, a relatively higher performance of classification was observed than in cases where only basic information of parts of speech was used. Comparative superior subjects were extracted from sentences of superiority-inferiority comparison by means for compared words and sentence pattern rules after searching for sentences of recommendation.
When the technique of searching for and analysis of sentences of recommendation was applied to restaurant domains, analysis of menus and properties was needed, which do not exist in other domains. Dictionaries of menus and restaurant properties are needed for the analysis of menus and properties. As the existing work on menu dictionaries is about manual development for the purpose of standardized restaurant menu board composition or development of rough dictionaries of name of individual items for general purposes, we didn’t have a sufficient amount of words and had difficulty in updating. Also, the existing studies on the classification of restaurant properties for the purpose of questionnaire surveys of restaurant consumer satisfaction had weakness as the number of their subject words is very limited, and the studies on properties lack restaurant specific properties as they were carried out in opinion mining.
This has used wrapper based web crawlers and frequencies to construct a menu dictionary and add classified information based rates to the dictionary. One can use this information to distinguish food menus belonging to various classification types. Moreover, this has collected restaurant reviews and news documents with the wrapper based web crawlers from restaurant specialized sites and online news sites for the sake of the construction of a restaurant property dictionary. Then it has extracted only nouns from each document through the morpheme analyzer. Drawing on the fact that there are differences in frequently used words between restaurant reviews and news documents, this has made a list of nouns that have been frequently used in restaurant reviews. Based on this list with manual addition of property groups, a restaurant property dictionary has been constructed.

이 논문에서는 한국어로 작성된 웹문서 중 특정 상품 추천 문장만을 검색하는 방법을 제안한다. 추천 문장은 A 상품과 B 상품을 비교 설명한 비교문장, ‘A 상품이 가장 좋다’는 등의 의미를...

이 논문에서는 한국어로 작성된 웹문서 중 특정 상품 추천 문장만을 검색하는 방법을 제안한다. 추천 문장은 A 상품과 B 상품을 비교 설명한 비교문장, ‘A 상품이 가장 좋다’는 등의 의미를 표현한 최상급 문장, ‘A라는 상품을 추천한다’라고 하는 단순 추천문장 등을 포함하고 있다. 이들을 종류별로 분류하고, 결론적으로 어느 제품이 우수하다는 평가를 받고 있는지를 찾아내는 방법을 제안한다. 이러한 방법은 고객의 상품 구매 결정 시간을 단축하는 데에 도움을 줄 수 있다. 위 세 가지 유형의 문장 중에서 현재로서는 영어권 온라인 평판 문장 중 비교 문장 및 최상급 문장을 찾아내는 연구가 일부 진행된 바 있다. 그러나 한국어에 대해서는 이 연구가 아직 초기단계이다. 이에 따라 추천문장을 검색 및 의견대상 추출 기술을 개발하였고 이 기술을 레스토랑 리뷰에 적용하였다.
영어권 문서와 한국어 문서는 구조와 특성이 다르기 때문에 다른 접근 방법이 필요하다. 한국어는 교착어이기 때문에 어근(語根)에 접사(接辭)가 결합되어 문장 내에서의 각 단어의 기능을 나타낸다. 따라서 추가적인 접사의 정보도 매우 중요한데 이를 기계학습의 자질로 사용한 연구는 아직 없다. 그리고 비교의견 분류만 연구되고 있고 비교의견대상 검출은 연구되지 않았다.
이러한 문제를 해결하기 위해 본 논문에서는 추천키워드, 규칙, Naive Bayes를 이용해 추천문장을 분류하였다. 기계학습의 자질 값으로 형태소 분석기를 통해 얻은 기본적인 품사 정보만 사용한 것이 아니라 형태소 분석기 사전에 없는 단어와 구체적인 조사의 종류도 이용하였다. 이를 통해 기본적인 품사 정보만 이용했을 때보다 상대적으로 높은 분류 성능을 보였다. 추천문장을 검색한 다음 비교 어휘와 문장 패턴 규칙을 이용해서 우열비교문장의 비교우세대상을 추출하였다.
추천문장 검색 및 분석 기술을 레스토랑 도메인에 적용 하였는데 다른 도메인에 없는 메뉴명과 속성 분석이 필요했다. 이러한 메뉴명과 속성 분석을 위해서는 메뉴명 사전과 레스토랑 속성 사전이 필요하다. 기존의 메뉴 사전과 관련된 연구는 표준화된 레스토랑 메뉴판 작성을 목적으로 수작업으로 개발하거나 일반적인 목적의 정교하지 않은 개체명 사전이어서 어휘의 양이 충분하지 않고 업데이트가 어렵다. 또한 레스토랑 소비자 만족도 설문조사를 위해 레스토랑 속성을 분류한 연구들이 있는데 어휘수가 매우 한정적이라는 단점이 있으며 오피니언 마이닝에서 진행된 속성 연구들은 레스토랑에 특화된 속성이 부족하다.
본 논문에서는 래퍼 기반 웹 크롤러와 빈도수를 이용해 메뉴사전을 구축하고 분류 정보에 따른 비율을 사전에 추가하였다. 이 정보를 이용해 여러 분류 유형에 해당되는 음식메뉴를 구분할 수 있다. 그리고 레스토랑 속성 사전 구축을 위해 레스토랑 전문 사이트와 온라인 뉴스 사이트에서 레스토랑 리뷰와 뉴스 문서를 래퍼 기반 웹 크롤러로 수집하였다. 그런 다음 형태소 분석기를 통해 각 문서별로 명사만을 추출하였다. 레스토랑 리뷰와 뉴스 문서에서 자주 쓰이는 어휘는 차이가 있는데 이를 이용해서 레스토랑 리뷰에서만 많이 쓰이는 명사의 리스트를 뽑아냈다. 이 리스트는 다시 수작업으로 속성 그룹을 추가하여 레스토랑 속성 사전을 구축한다.

韩语论文范文韩语论文网站
免费论文题目: