바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 온라인 열람목록, 검색결과: 2
초록보기
초록

본 연구는 OPAC에서 계층 클러스터링을 응용하여 소장자료를 계층구조로 분류하여 열람하는데 사용될 수 있는 최적의 계층 클러스터링 모형을 찾기 위한 목적으로 수행되었다. 문헌정보학 분야 단행본과 학위논문으로 실험집단을 구축하여 다양한 색인기법(서명단어 자동색인과 통제어 통합색인)과 용어가중치 기법(절대빈도와 이진빈도), 유사도 계수(다이스, 자카드, 피어슨, 코싸인, 제곱 유클리드), 클러스터링 기법(집단간 평균연결, 집단내 평균연결, 완전연결)을 변수로 실험하였다. 연구결과 집단간 평균연결법과 제곱 유클리드 유사도를 제외하고 나머지 유사도 계수와 클러스터링 기법은 비교적 우수한 클러스터를 생성하였으나, 통제어 통합색인을 이진빈도로 가중치를 부여하여 완전연결법과 집단간 평균연결법으로 클러스터링 하였을 때 가장 좋은 클러스터가 생성되었다. 그러나 자카드 유사도 계수를 사용한 집단간 평균연결법이 십진구조와 더 유사하였다.

Abstract

This study is to develop a hiararchic clustering model for document classification and browsing in OPAC systems. Two automatic indexing techniques (with and without controlled terms), two term weighting methods (based on term frequency and binary weight), five similarity coefficients (Dice, Jaccard, Pearson, Cosine, and Squared Euclidean), and three hierarchic clustering algorithms (Between Average Linkage, Within Average Linkage, and Complete Linkage method) were tested on the document collection of 175 books and theses on library and information science. The best document clusters resulted from the Between Average Linkage or Complete Linkage method with Jaccard or Dice coefficient on the automatic indexing with controlled terms in binary vector. The clusters from Between Average Linkage with Jaccard has more likely decimal classification structure.

초록보기
초록

이 연구는 주요 국가의 국가도서관 목록에 나타나고 있는 한국관련 자료의 실태분석을 위해 한국관련 주제명의 주제별 특성과 레코드의 소장상황, 그리고 한국입장에서 쟁점이 되고 있거나 관심이 높은 일부 주제명을 중심으로 그 특성을 비교 분석한 것이다. 연구결과를 요약하면 아래와 같다. 첫째, 미국 등 일부 국가를 제외하고 대부분의 국가도서관에 저장되어 있는 한국관련 레코드가 절대적으로 부족하며, 일본관련 레코드와 비교할 때 대략 2∼3배 이상 적게 나타나고 있다. 둘째, 한국관련 레코드의 세부항목별 주제 분포에서 대체로 ‘역사’와 ‘경제’가 가장 많게 나타나고 있지만 대부분의 국가에서 ‘한국전쟁’이 많은 비중을 차지하고 있는 것은 한국에 대한 외국인의 인식이 왜곡될 가능성이 높다고 생각된다. 셋째, 한국관련 레코드가운데 대부분이 북한에 비해 남한관련 레코드가 1.5∼5배 이상 많게 나타나고 있지만 폴란드, 이탈리아, 멕시코는 오히려 북한이 많게 나타나고 있다. 넷째, 한국관련 주제명 가운데 ‘태권도’, ‘김치’, ‘독도’, ‘동해’ 등의 용어는 국가마다 미묘한 차이점이 드러나고 있지만, 우리의 주변 국가를 제외하고는 대부분 미국의회도서관의 주제명표기와 거의 일치하고 있다. 다섯째, 특히 우리의 인접국인 중국과 일본의 경우, 자국의 정치적, 역사적 입장을 철저하게 반영하여 나타냄으로써 일부 주제명의 표기에 문제점이 발견되고 있다.

Abstract

This research was conducted to analyze the actual condition of data related to Korea shown in the catalog of 15 countries. This study was to compare the subject characteristics of Korea-related subject heading, record collection, and the characteristics of several subject heading, which has been a major issue. The results are as follows. To begin with, Korea-related record in most other national libraries runs absolutely short except for some countries like United States. Korea-related record is generally 2 to 3 times less than Japan related record. Second, referring to the subject distribution in sub criteria of Korea-related record, subject related to ‘history’ and ‘economy’ is shown in the highest rate. Considering that ‘Korean war’ shows the highest rate in Italy and Canada, we can consider that this may cause the distortion of the perception of Korea. Third, in the case of Korea-related record, the record of South Korea is 1.5 to 5 times more than that of North Kore, except for some countries like United States. Forth, regarding the subject headings, the terms such as ‘Taekwondo’, ‘Kimchi’, ‘Tok-do’, ‘Tong-hae’ have different meanings in different countries. However, these terms agree to LCSH in most countries except for neighboring countries. Fifth, in case of China and Japan, the subject headings in reference to political and historical position are raising some problems.

정보관리학회지