오늘날 인터넷에서 욕설 필터, 스팸 필터 등에 사용하는 금칙어 방식은 단순한 키워드 매칭을 통해 이루어지는 경우가 많아 금지 단어를 적당히 변형하여 우회하기 쉽다. 때문에 금칙어 방... 오늘날 인터넷에서 욕설 필터, 스팸 필터 등에 사용하는 금칙어 방식은 단순한 키워드 매칭을 통해 이루어지는 경우가 많아 금지 단어를 적당히 변형하여 우회하기 쉽다. 때문에 금칙어 방식이 효과를 보려면 변형된 단어를 수집하여 모두 등록해야만 하는데 변형된 단어의 양이 방대하기 때문에 모든 변형단어를 일일이 금지하는 것은 사실상 불가능하다고 할 수 있다. 본 논문에서는 기본 단어 등록을 통해 입력 문자열의 품사를 분석하여 필요한 부분만 검사하도록 해서 탐색의 효율을 높이고, 품사 태깅에 사용되던 Transformation-Based Learning 이론을 변형 하여 유사도 기법과 함께 적용함으로써 변형단어를 탐지하는 방법을 제안한다.
In the modern Internet, Profanity filter and Spam filter, etc. using the Prohibited words method are easy to avoid by the word transformation because using a simple keyword matching. Therefore, the Prohibited words method must register to collect all ... In the modern Internet, Profanity filter and Spam filter, etc. using the Prohibited words method are easy to avoid by the word transformation because using a simple keyword matching. Therefore, the Prohibited words method must register to collect all the deformed words to get good results. But it is virtually impossible to prohibit all deformed words, because the vast amount of deformed words. In this , we propose a method for detect the deformed word to applied the word similarity and the modified Transformation-based learning theory used in part of speech tagging and to improve the efficiency of search to only check-up of necessary part of speech by analyzing the input string with the default word register. ,韩语毕业论文,韩语论文题目 |