최근에 인터넷 사용이 더욱 활발해 짐에 따라, 많은 사람들이 인터넷에서 블로그, 위키 등과 같은 매체를 통해서 자신의 의견을 표현하고 있는 추세이다. 또 특정한 정보의 가치를 평가할 때...
최근에 인터넷 사용이 더욱 활발해 짐에 따라, 많은 사람들이 인터넷에서 블로그, 위키 등과 같은 매체를 통해서 자신의 의견을 표현하고 있는 추세이다. 또 특정한 정보의 가치를 평가할 때, 다른 사람들이 인터넷 상에 올려놓은 의견정보를 참조하고자 하는 수요도 높아지고 있다.
그러나 인터넷 상에 존재하는 의견들을 검색하고자 할 경우 다음과 같은 문제점이 있다. 첫째, 의견정보들은 개개의 웹사이트들에만 존재하여 의견정보들을 사용하고자 할 경우에는 사용자가 일일이 모든 웹사이트를 수동으로 찾아보아야 하는 번거로움이 있으며 둘째, 일반 검색으로 다른 사용자들의 의견정보를 찾고자 하는 경우에는 긍정적인 의견이 있는 웹 문서, 부정적인 의견이 있는 웹 문서 등이 혼재하여 효과적으로 다른 사용자들의 의견을 찾아보기 어려운 점이 있다.
본 논문은 이러한 문제점을 해결하기 위하여, 의견정보를 실시간으로 모니터링하기 위한 웹 콘텐츠 마이닝 시스템을 제안한다. 제안하는 시스템은 인터넷 상에 존재하는 여러 웹사이트들에 있는 웹 콘텐츠에서 사용자 의견정보들을 자동 추출하고 분석하여, 긍정/부정 의견별로 검색 및 통계를 확인할 수 있는 의견 검색 서비스를 제공한다. 그 결과 의견정보 검색 사용자들은 특정 키워드에 대하여 다른 사용자들의 의견을 손쉽게 검색 및 모니터링하는 시스템을 용이하게 사용할 수 있으며, 웹 콘텐츠에서의 의견정보를 추출하고 분석하는 기능을 제공받을 수 있다.
제안한 기법들은 다른 기법들과의 비교 실험을 수행하여 실제 성능이 우수함을 확인하였다. 성능 평가는 긍정/부정 의견정보를 추출하는 기능의 성능 평가, 다국어 정보 검색을 위한 동적 윈도우 기법과 토크나이저 기법을 적용한 성능 평가, 그리고 영어-중국어 음차표기 추출 기법에 대한 성능 평가를 실시하였다. 그 적용 사례로 대표적인 영화 리뷰 문장과 위키디피아 실험 데이터를 대상으로 실험하고 그 결과를 분석하였다.
The free expression through Internet means, such as Blog or Wiki among the general public is accompanied by a growing number of Internet users in recent years. Also, a rising number of demands are being made to collect public Internet information post...
The free expression through Internet means, such as Blog or Wiki among the general public is accompanied by a growing number of Internet users in recent years. Also, a rising number of demands are being made to collect public Internet information posted by people, in the course of evaluating special information value.
But, the following two problems take place when opinions and information on the Internet are searched. One is the complex procedure that requires users to search for opinions or information on 'separate' or 'individual'-based Website, only through 'manual' way. Another is the difficulty and inability in finding out opinions or information among other users through general search means, owing to mixed Web documents containing both positive and negative opinions or information.
In an effort to solve the problems, this research thesis is to suggest web contents mining systems to monitor real-time public information. The system to be suggested extracts/ analyzes automatic opinions or information among users on Internet Web Site Contents, and classifies and provides both positive and negative opinions and information search and statistics-identifying services. These developments give 'opinion and information search users an easy access to the system for searching and monitoring users' opinions or information. And, these can lead users to extract and analyze opinions or information on Web Contents.
The technique proposals evidenced their excellent performance through comparative tests with any other ones. 'Performance evaluation' was conducted on 'function' extracting both positive and negative opinions or information, and / 'Dynamic Window ' technique for information on different foreign languages and 'Tokenizer technique' along with 'English and Chinese words-tuning fork' technique. As a case illustration, film review sentences and wikipedia test data was conducted and analyzed.
,韩语论文题目,韩语论文 |