주제명 표목의 패싯 구조화 모형 개발에 관한 연구 (3)[韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-26
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

최근 키워드 검색이 대중화되었으나, 주제 접근을 도와주는 보조적인 도구로 주제명 표목표의 활용 가능성은 여전하다. 그럼에도 불구하고, 국내 주제명 표목표는 세목 없이 복합 명사 형태로 주제를 표현하면서, 표목의 속성과 구조가 제대로 정의되지 않아서 표목의 생성과 접근에 어려움이 있다. 이러한 문제점을 해결하기 위해서는 주제명 표목을 패싯으로 범주화하고, 패싯의 조합 방식을 정의해야 한다.
연구의 목적은 21세기 정보 환경에 적합한 한글 주제명 표목의 패싯 구조화 모형을 개발하는 것이다. 패싯 모형은 주제명 표목의 속성과 한국어 특성을 반영하여 기본 패싯과 조합 규칙으로 설계하고, 이를 위해 문헌 연구와 사례 분석, 패싯 분석을 실시하였다.
문헌 연구에서는 주제 접근과 주제의 개념, 주제명 표목의 구조, 한글 주제명 표목의 특성, 패싯의 개념 및 분석 절차에 대해 고찰하였다. 이를 통해 주제명 표목의 유형을 주제관련성과 범주관련성으로 구분하고, 기존 주제명 표목의 복잡한 구조를 탈피하면서 다양한 조합 방식을 표현하기 위해 패싯 구조의 필요성을 확인하였다. 그리고 패싯 분석은 주제 분야 정의, 패싯 공식화, 패싯 확장과 구조화, 범위 주기 생성, 패싯 배열, 조합 규칙 제시의 6단계로 이루어지고, 주제명 표목의 생성과 부여에 활용될 수 있음을 파악하였다.
사례 분석에서는 OCLC(Online Computer Library Center)의 FAST(Faceted Application of Subject Terminology), PRECIS(PREserved Content Indexing System), Thesaurus construction and use, CC(Colon Classification) 제7판, BC (Bliss Bibliographic Classification) 제2판, UDC(Universal Decimal Classification) 제3판, 총 6개 사례를 중심으로 기본 패싯의 구성과 패싯 조합 방식을 비교․분석하였다. 분석 결과, 주제관련성 패싯은 5개부터 13개까지 매우 다양하게 구성되었고, 사례에 따라 패싯의 명칭과 개수, 세분화에서 차이가 나타났다. 범주관련성 패싯은 2개부터 5개까지 개수와 종류가 다양하였고, 이 중 형식 패싯은 모든 사례에 있었으며, 언어, 장르, 인물 패싯은 일부 사례에서 다루었다. 조합 방식은 기본적으로 다른 패싯 간에는 후조합 방식을 지향하였으며, 사례에 따라 동일 패싯에 속한 주제명은 전조합 방식을 채택하기도 하였다. 조합 순서는 주제관련성 패싯은 CC의 PMEST 순서를 따랐지만 공간과 시간의 패싯 순서는 사례에 따라 달랐고 범주관련성 패싯의 조합 순서는 모두 다르게 설정되었다.
패싯 분석에서는 사용빈도가 높은 국립중앙도서관 주제명 표목(NLSH) 8,231개를 대상으로 초기 모형을 적용해 패싯을 분류하고, 전조합 주제명에 대한 조합 방식을 분석하였다. 초기 패싯 모형은 FAST 중심으로 나머지 5개 사례의 패싯을 추가하여 토픽, 토픽-사물/개체, 부분, 종류, 전체, 속성, 재료, 토픽-행동, 수혜자, 주체, 산물, 부산물, 사건, 장소, 시대, 개인명, 단체명, 표제명, 형식, 장르, 언어, 인물인 22개 패싯으로 구성하였다.
패싯 분류 결과, 용어적 특징으로 표목 대부분이 한자어이며, 외래어가 많았고, 일반 용어와 학술 용어가 공존하였다. 그리고 복합 명사 형태의 주제명 표목이 많았으며, 이 중 일부 표목들은 축약어 형태로 표기되었다. 패싯 분포는 토픽 패싯에 해당하는 표목이 6,911개(83.96%)로 가장 많았으나, 다른 패싯에 속한 표목들도 1,320건(16.04%)이나 있었다.
패싯별 특성으로는 첫째, 토픽 패싯은 토픽-사물/개체 패싯에 해당하는 주제명 표목이 3,926개(56.81%)로 토픽-행동 패싯 2,985개(43.19%) 보다 훨씬 더 많았다. 둘째, 사건 패싯은 전체 8,231개 중 26개(0.32%)가 있었으며, 이들의 하위 속성은 역사적 사건, 전쟁명, 대회명이 있었다. 셋째, 장소 패싯에 해당하는 표목은 225개(2.73%)가 있었으며, 하위 속성은 대륙, 국가, 도시, 강‧바다‧항구, 산‧산맥, 옛국가명, 육로로 구분되었다. 넷째, 시대 패싯에는 총 30개(0.36%) 주제명 표목이 해당되었으며, 일반 시대구분, 한국 시대, 각국 시대로 하위 속성이 구분되었다. 다섯째, 고유명에 해당하는 개인명, 단체명, 표제명 패싯은 247개(3.01%) 표목으로 개인명 76개(0.93%), 단체명 21개(0.26%), 표제명 150개(1.82%)가 해당되었다. 여섯째, 형식 패싯에 해당하는 주제명 표목은 109개(1.32%)가 있었으며, 하위 속성을 잡저, 사전, 강연집/연설문집, 연속간행물, 교육자료, 총서/전집/선집, 전기, 7가지로 구분하였다. 일곱째, 장르 패싯은 예술과 문학의 특정 양식을 지칭하는 주제명 표목으로 185개(2.25%) 표목이 있었고, 하위 속성은 일반 장르구분과 음악, 미술, 영화/연극, 방송, 만화, 문학으로 세분하였다. 여덟째, 언어 패싯에 해당하는 주제명 표목은 45개(0.55%)였으며, 개별 언어와 글자, 인공어로 하위 구분하였다. 아홉째, 인물 패싯에 해당하는 주제명 표목은 453개(5.50%)가 있었으며, 성별 및 연령, 인종, 사회 지위 및 집단, 직업 및 자격으로 하위 속성을 구분하였다.
위와 같은 패싯 분류 결과를 검증하기 위해 정보 조직 분야의 학계 전문가 3인과 실무자 3인을 대상으로 두 번에 걸쳐 총 600개 주제명 표목의 패싯 분석 결과를 비교하고, 개선 방안에 대한 의견을 수렴하였다. 검증 결과, 패싯의 식별성은 1차 검증에 비해 패싯 정의와 분석 지침을 제공한 2차 검증에서 모두 향상되었다. 특히 장소, 사건, 시대, 개인명, 단체명, 표제명, 언어, 인물에 대한 식별성이 높았고, 토픽과 형식, 장르의 식별성은 상대적으로 낮았다. 둘째, 토픽-행동 패싯은 패싯명 자체로는 상태성 명사를 연상하기 어려우므로 ‘토픽-행동/상태’로 수정하도록 제안하였다. 셋째, 학문명, 역사, 질병에 해당하는 주제명 표목이나 사전적 의미로 개체와 행동을 모두 의미하는 주제명 표목에 대해서는 패싯 분류에 어려움을 겪었으며, 이를 해결하기 위해 중복 분류를 허용하거나 토픽 패싯을 통합하는 방식을 추천하였다. 넷째, 특정 언어명에 KDC 조기표의 언어공통구분항목이 결합된 표목은 토픽과 언어 패싯에 중복 분류하도록 제안하였다.
다음으로 2개 이상의 패싯이 조합된 주제명 표목 755개를 대상으로 패싯 간 조합 방식과 배열 순서를 분석한 결과, 2개 또는 3개 패싯의 조합이 이루어졌다. 2개 패싯 조합의 경우, 토픽 패싯이 8개 패싯과 전조합 표목을 형성하여, 가장 활발한 조합도를 가졌고, 다음으로 장르, 형식, 장소 패싯 순이었다. 3개 패싯 조합은 25개 표목이 해당되었으며, 5가지 유형이 있었다.
이상의 연구 내용을 토대로 한글 주제명 표목의 최종 패싯 모형을 2단계로 설계하였다. 제1단계 모형에서는 IFLA의 FRSAD 모형을 참고하여 주제명 표목의 속성에 따라 3개 집단으로 구분하고, 각 집단별로 기본 패싯과 하위 유형을 구조화하였다. 제1집단은 토픽, 사건, 장소, 시대 패싯, 제2집단은 개인명, 단체명, 표제명 패싯, 제3집단에는 형식, 장르, 언어, 인물 패싯인 4개 패싯을 포함시켰다. 그리고 전조합 주제명의 다양한 조합 방식을 바탕으로 제1집단의 토픽 패싯을 5개 유형으로 세분하였다.
제2단계 모형에서는 11개 상위 패싯을 중심으로 8개의 하위 패싯과 패싯별 44개 하위 속성을 제시하였다. 19개 기본 패싯 중 상위 패싯은 토픽, 사건, 장소, 시대, 개인명, 단체명, 표제명, 형식, 장르, 언어, 인물 패싯으로 정의하였다. 다음으로 하위 패싯은 토픽-사물/개체와 토픽-행동/상태 패싯, 그리고 이와 관련된 부분, 종류, 속성, 전체, 수혜자, 주체 패싯으로 구성하였다. 하위 속성으로 사건 패싯은 역사적 사건, 전쟁명, 대회명을, 장소 패싯은 대륙, 국가, 도시, 강‧바다‧항구, 산‧산맥, 옛국가명, 육로, 시대 패싯은 일반 시대구분, 한국 시대, 각국 시대, 개인명은 국내 인명, 외국 인명, 가족명, 단체명은 국내 단체와 외국/국제 단체, 표제명은 국내서, 외국서, 경전, 노래, 제품/규격명, 형식 패싯은 잡저, 사전, 강연집/연설문집, 연속간행물, 교육 자료, 총서/전집/선집, 전기, 장르 패싯은 일반 장르구분과, 음악, 미술, 영화/연극, 방송, 만화, 문학, 언어 패싯은 개별 언어와 문자, 인공어, 인물 패싯은 성별 및 연령, 인종, 사회 지위/집단, 직업 및 자격으로 구분하였다.
다음으로 기본 패싯의 범위 주기를 패싯에 대한 정의와 분류 기준으로 구성하였다. 패싯 정의에서는 초기 모형에서 기술된 정의 이외에 NLSH의 패싯 분석 결과로 도출된 하위 속성과 대표적인 주제명 표목의 예시를 추가하였다. 그리고 패싯 분석과 검증 과정에서 제기된 문제점을 4가지 유형으로 구분하여, 분류 지침을 제시하고 고려 사항을 논의하였다.
마지막으로 패싯 조합 규칙에서는 한국어 어순에 적합한 한글 주제명 표목의 조합 순서를 도출하고, 조합 구문을 주제명 표목의 생성과 검색에 가상으로 적용해 보았다. 기본 조합 규칙은 장소, 인물, 언어, 시대, 장르, 토픽, 형식 패싯 순으로 정의하였으며, 조합 순서는 한국어의 특성과 일맥상통한다는 것을 확인하였다. 그리고 기본 패싯과 조합 구문을 기존 NLSH에 적용한 결과, 패싯 조합을 통해 다양한 합성 및 복합 주제를 세목 없이 표현할 수 있었고, 주제명 표목의 조합 검색이나 검색 결과의 제한 탐색 등 다양한 접근 방식을 제공하였다.
본 연구는 한글 주제명 표목을 대상으로 기본 패싯 구조를 규명하고, 한글 어순에 적합한 패싯 조합 방식을 체계화 했다는 점에서 의의가 있다. 본 연구의 결과를 토대로 한글 주제명 표목이라는 도서관의 주제 접근 도구를 고품질화하고, 이용자의 주제 접근성을 신장시킬 수 있을 것이다.

韩语论文网站韩语论文范文
免费论文题目: