한국어 문장 생성 시스템은 컴퓨터가 사용자에게 전달하고자 하는 내용을 자연스러운 한국어 문장으로 표현하는 시스템으로, 기계번역이나 대화 시스템, 질의 응답 시스템 등 여러 응용 분...
한국어 문장 생성 시스템은 컴퓨터가 사용자에게 전달하고자 하는 내용을 자연스러운 한국어 문장으로 표현하는 시스템으로, 기계번역이나 대화 시스템, 질의 응답 시스템 등 여러 응용 분야에서 자연어 인터페이스를 제공할 때 필수적인 시스템이다.
자연어 대화 시스템에서 사용자는 시스템이 생성해 발화하는 문장으로 시스템과 의사소통을 하게 된다. 이때 사용자와 시스템 사이에 친밀관계가 형성된다. 시스템이 딱딱한 문어체 문장만 생성해 발화하는 것 보다는 부드러운 구어체 문장으로 발화하거나 통신언어를 생성해 발화할 수 있다면 더 친숙함을 느낄 수 있을 것이다.
지금까지 한국어 생성에서 사용자와의 친밀도를 고려해 발화 문장의 문체를 선택하는 것에 관한 연구는 없었다. 본 논문에서는 한국어 생성기의 일부분으로 시스템이 형태소 단위로 생성해 낸 발화 문장의 형태소를 합성하는 과정에서 발화의 문체를 변환하는 시스템을 제안한다. 본 논문에서는 규칙 기반 문체 변환 시스템과 SVMs를 이용한 통계 기반 문체 변환 시스템을 제안한다. 문자 채팅 영역 말뭉치 10000만 문장을 ‘삼체’와 ‘요체’로 변환해 실험한 결과 SVMs를 사용한 통계 기반 문체 변환기가 ‘삼체’ 97.9%, ‘요체’ 94.3%의 정확률(accuracy)을 보여 규칙기반 문체 변환기보다 더 높은 성능을 보였다.
본 시스템은 한국어 문생 생성기의 일부로서 생성된 발화의 문체를 바꿔줄 수 있을 뿐만 아니라, 다량의 구어체나 통신체 말뭉치 구축에도 사용될 수 있다.
A sentence-generation system for Korean is a software which generates natural Korean sentences. It is essential for the application systems such as a machine translation system which translates foreign language to Koreans and a dialogue interface syst...
A sentence-generation system for Korean is a software which generates natural Korean sentences. It is essential for the application systems such as a machine translation system which translates foreign language to Koreans and a dialogue interface system which enables to use natural language dialogues for user interface.
In natural language dialogue system, utterances that generated sentence by system is used in communication between user and system. So, system utterance is very important for familiarity. User will feel more familiar if system can make various sentence styles(ex. Internet language).
Till now, there is no system that make utterance considering familiar with user. In this , we suggest a sentence style conversion system as a part of Korean sentence generator. This system divided rule-based system and statistical-based system. We experiment with 10,000 sentence corpus in SMS massage domain. We experiment about ‘sam style’ and ‘yo style’. As a experiment result, ‘sam style’ has 92.82% and ‘yo style’ has 90.54% in F1-measure. This result came from statistical-based sentence style conversion.
This system not only convert the sentence style but also could use make a large corpus in as a part of Korean sentence generator.
참고문헌 (Reference)
활용도 분석
View
Usage
Share
이 자료의 주제 내 활용도 Top
이 자료의 주제 내 View Top
이 자료의 주제 내 Usage Top
이 자료의 주제 내 Share Top
※ 각 수치는 매주 업데이트됨
,韩语论文题目,韩语论文网站 |