지식베이스는 자연어 처리 기반의 다양한 응용 시스템 성능에 영향을 미치는 중요한 요소이다. 영어권에서는 YAGO, Cyc, Babel, DBpedia와 같은 지식베이스들이 널리 사용되고 있다. 그러나, 지... 지식베이스는 자연어 처리 기반의 다양한 응용 시스템 성능에 영향을 미치는 중요한 요소이다. 영어권에서는 YAGO, Cyc, Babel, DBpedia와 같은 지식베이스들이 널리 사용되고 있다. 그러나, 지식베이스 구축을 위한 자원의 부족으로 다른 언어를 지원하는 지식베이스는 영어에 비해 많이 부족한 실정이다. 본 논문에서는 DBpedia와 YAGO로부터 YAGO 형식의 한국어 지식베이스(이하 K-YAGO)를 자동 구축하는 방법을 제안한다. 제안 시스템은 YAGO와 인포박스 트리플 간의 간단한 매칭을 통해 초기 K-YAGO를 구축한 뒤, 기계학습을 이용하여 초기 K-YAGO를 확장한다. 실험 결과, 제안 시스템은 초기 K-YAGO 구축 실험에서 0.9642의 신뢰도를 보였고, K-YAGO 확장 실험에서 0.9468의 정밀도와 0.7596의 매크로 F1 척도를 보였다.
The performance of many natural language processing applications depends on the knowledge base as a major resource. YAGO, Cyc, Babel and DBpedia have been extensively used as knowledge bases in English. However, we can not find large volumes of Kor... The performance of many natural language processing applications depends on the knowledge base as a major resource. YAGO, Cyc, Babel and DBpedia have been extensively used as knowledge bases in English. However, we can not find large volumes of Korean knowledge bases due to lack of online resources for constructing knowledge bases. In this , we propose a method to construct a YAGO-style knowledge base automatically for Korean (hereafter, K-YAGO) from DBpedia and YAGO. The proposed system constructs an initial K-YAGO simply by matching YAGO to info-boxes in Wikipedia. Then, the initial K-YAGO is expanded through the use of a machine learning technique. Experiments with the initial K-YAGO shows that the proposed system has a precision of 0.9642. In the experiments with the expanded part of K-YAGO, an accuracy of 0.9468 was achieved with an average macro F1-measure of 0.7596. ,韩语论文网站,韩语论文 |