사용자 띄어쓰기 정보를 고려한 띄어쓰기 모형의 베이지언 파라미터 추정 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-28
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

한국어 자동 띄어쓰기띄어쓰기 오류가 포함된 문장을 입력받아 띄어쓰기 교정된 문장을 출력하는 문제라고 정의할 수 있다. 기존의 통계적 띄어쓰기 모델은 띄어쓰기가 올바른 문장으로...

한국어 자동 띄어쓰기는 띄어쓰기 오류가 포함된 문장을 입력받아 띄어쓰기 교정된 문장을 출력하는 문제라고 정의할 수 있다. 기존의 통계적 띄어쓰기 모델은 띄어쓰기가 올바른 문장으로 구성된 학습 말뭉치로부터 최대우도추정을 이용해 모델의 파라미터추정한다. 그러나 이러한 방법은 자료가 충분한 경우에는 좋은 성능을 보이지만, 자료부족 시 부정확한 파라미터 추정을 할 확률이 높다. 본 연구는 이에 대한 대안으로 사용자 입력 문장을 고려하는 베이지언 파라미터 추정을 제안한다. 사용자 입력 문장은 교정 대상이면서 동시에 해당 문장을 입력한 사용자의 주관적 지식이 포함되어 있으며, 학습 말뭉치에는 해당 문장에 대한 다수의 객관적 증거가 존재한다. 학습 말뭉치는 자료가 충분한 경우에는 신뢰할만한 정보를 제공하지만 자료부족의 가능성이 존재하고, 사용자 입력 문장은 어느 부분이 올바른지 명확히 알 수 없다는 신뢰성 문제를 가진다. 본 연구는 사용자 입력 문장에서 파라미터의 사전 분포를 유도하고, 학습 말뭉치에서 우도 함수를 각각 유도하며, 이 둘을 병합하여 사후분포를 획득한다. 베이즈 파라미터 추정을 통해 사용자 입력 문장은 사전 분포로서 학습 말뭉치의 자료부족을 완화하는 역할을 수행하고, 학습 말뭉치는 사용자 띄어쓰기 정보의 신뢰성을 개선하는 역할을 한다. 기존의 대표적인 통계적 모델들에 제안 방법을 적용하고 문어체, 통신환경 구어체, 웹 게시판 등 다양한 말뭉치에 대한 실험에 의하면 제안 방법이 효과적임을 알 수 있다.

韩语论文题目韩语论文范文
免费论文题目: