본 연구는 우리말 용어데이터베이스를 구축하기 위한 포맷을 설계한 것이다. 현재 용어관련 데이터의 교환을 위한 국제 표준 포맷은 국제표준기구의 MATER와 TIF가 있다. 이 두 포맷의 전체적...
본 연구는 우리말 용어데이터베이스를 구축하기 위한 포맷을 설계한 것이다. 현재 용어관련 데이터의 교환을 위한 국제 표준 포맷은 국제표준기구의 MATER와 TIF가 있다. 이 두 포맷의 전체적인 구조와 태그 유형을 분석하였으며 하나의 용어에 부여할 수 있는 용어정보를 식별하기 위하여 MATER의 태그와 TIF의 데이터 카테고리를 분석하였다.
용어데이터베이스에 대한 연구 동향을 검토하여 용어데이터베이스 구축에 중요시되고 있는 용어정보의 종류를 도출하였다. 이를 근거로 우리말 용어에 부여할 수 있는 일반적인 용어 데이터 카테고리를 제안하였으며, 이 데이터 카테고리를 MATER와 TIF에 각각 적용하였다.
본 논문에서 분석한 MATER와 TIF의 특징은 다음과 같다. 첫째, 구조적 측면에서 MATER는 MARC 포맷을 기초로 한 반면 TIF는 본문 (text) 데이터 인코딩을 위한 SGML에 기반을 두었다. 둘째, 용어에 부여한 데이터 카테고리 측면에서 TIF는 MATER에 비하여 개념체계의 표현, 시소러스 관련 정보, 용어작업에 관련된 사항 및 기능, 관리정보, 상관참조에 대한 정보를 더 자세히 수록할 수 있다.
용어정보를 수록하기 위하여 본 논문에서 제안한 데이터 카테고리의 특징은 용어의 쓰임, 어법상 표현, 언어적 표현과 기능, 정의, 설명, 문맥 등에 대한 세부적인 데이터 카테고리를 부가함으로써 용어의 실제적인 쓰임에 대한 이해를 높일 수 있게 하였으며, 용어작업시 필요한 여러 가지 관리기능을 위한 카테고리를 제공하였다는 것이다. 또한 우리말 용어의 한자어 부분, 로마자 부분, 외래어 표기법에 따른 용어의 변형에 대한 정보를 수록하기 위한 데이터 카테고리를 추가하였다. 이러한 데이터 카테고리를 적용한 MATER와 TIF 태그는 기존의 태그와 중복되지 않으므로 용어데이터베이스 구축 환경에 따라 각각 수정·보완하여 사용할 수 있을 것이다.
The purpose of this study is to design the format to develop Hangul terminological database. Presently, the international standard formats for the interchange of terminological data are MATER and TIF both developed by the ISO. These formats and the ty...
The purpose of this study is to design the format to develop Hangul terminological database. Presently, the international standard formats for the interchange of terminological data are MATER and TIF both developed by the ISO. These formats and the types of tags were analysed in this study. Tags of MATER and data categories of TIF were analysed to identify terminology information in a term.
In addition, The classes of terminology information, which are important to develop terminological database, were selected by reviewing of terminological databases. Based on those classes. A set of general terminological data categories was suggested and applied to MATER and TIF respectively.
The characteristics of MATER and TIF analysed in this study were as follows. First, MATER is based on MARC in structural points while TIF is based on SGML, an encoding scheme for the text data. Second, TIF can give more detailed information than MATER as far as data categories are concerned. The set of data categories suggested in this study is characterized by usage, detailed linguistic information, definition, explanation, context and the administrative information in terminology work. It was added that the categories of hanja, romanization and transliteration in a Hangul term. MATER and TIF suggested in this study do not overlap existing tags. Therefore, these can be used to develop Hangul terminological database.
,韩语论文题目,韩语论文网站 |