바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 재분류, 검색결과: 4
초록보기
초록

본 연구는 국내 주요 학술 DB의 검색서비스에서 제공되고 있는 저자키워드(비통제키워드)의 재분류를 통하여 디스크립터(통제키워드)를 자동 할당할 수 있는 가능성을 모색하였다. 먼저 기계학습에 기반한 주요 분류기들의 특성을 비교하는 실험을 수행하여 재분류를 위한 최적 분류기와 파라미터를 선정하였다. 다음으로, 국내 독서 분야 학술지 논문들에 부여된 저자키워드를 학습한 결과에 따라 해당 논문들을 재분류함으로써 키워드를 추가로 할당하는 실험을 수행하였다. 또한 이러한 재분류 결과에 따라 새롭게 추가된 문헌들에 대하여 통제키워드인 디스크립터와 마찬가지로 동일 주제의 논문들을 모아주는 어휘통제 효과가 있는지를 살펴보았다. 그 결과, 저자키워드의 재분류를 통하여 디스크립터를 자동 할당하는 효과를 얻을 수 있음을 확인하였다.

Abstract

This study purported to investigate the possibility of automatic descriptor assignment using the reclassification of author keywords in domestic scholarly databases. In the first stage, we selected optimal classifiers and parameters for the reclassification by comparing the characteristics of machine learning classifiers. In the next stage, learning the author keywords that were assigned to the selected articles on readings, the author keywords were automatically added to another set of relevant articles. We examined whether the author keyword reclassifications had the effect of vocabulary control just as descriptors collocate the documents on the same topic. The results showed the author keyword reclassification had the capability of the automatic descriptor assignment.

2
김송이(이화여자대학교) ; 정연경(이화여자대학교) 2014, Vol.31, No.3, pp.7-27 https://doi.org/10.3743/KOSIM.2014.31.3.007
초록보기
초록

한국십진분류법(Korea Decimal Classification) 5판에서는 건축학 분야가 건축공학과 건축술이라는 두 항목으로 나뉘어 분류되었으나 2013년 6판에서는 ‘건축, 건축학’으로 통합되었다. 본 연구는 KDC 5판과 KDC 6판의 비교 분석과 DDC, NDC, UDC의 비교 분석을 통하여 개정된 KDC 6판의 건축학 분야를 살펴보고 개선방안을 제안하였다. 주요 십진분류법과의 비교 분석결과 건축학은 항목 통합으로 인한 재분류의 필요성, 이전보다 길어진 건축사 분류번호 문제가 발생하였으며, 한국 전통 건축에 대한 분류 전개 개선이 필요한 것으로 나타나 이에 대한 개선방안을 제안하였다.

Abstract

Constructions and Architecture fields were divided into Architecture engineering and Architecture in the 5th edition of Korean Decimal Classification (KDC), but those were combined in the 6th edition of KDC published in 2013. The purposes of this study are to find problems and to suggest modifications through comparing and analyzing the 5th and the 6th editions of KDC, Dewey Decimal Classification, Nippon Decimal Classification and Universal Decimal Classification. The necessity of reclassification, a long classification number for History of Architecture and addition of categories of traditional building and architectural engineering are required to improve the 6th edition of KDC and the improvements and modifications of those problems are suggested.

초록보기
초록

본 연구의 목적은 대학도서관 웹사이트의 효율적인 이용을 위하여 웹사이트 메뉴구조와 용어를 제안하는데 있다. 메뉴구조는 7가지의 웹사이트 메뉴패턴을 기준으로 분석하였고, 용어는 빈도순에 의한 항목을 분석하였다. 메뉴구조의 분석결과는 전반적으로 2가지 이상의 메뉴구조를 혼합하여 사용하고 있었고, 구조패턴은 <테이블>과 <프레임 + 테이블> 메뉴패턴이 유리한 것으로 나타났다. 메뉴에 사용된 용어는 다양하게 나타나고 있어서 체계적인 재분류와 절제된 표현이 요구된다. 본 연구의 결과는 도서관 웹사이트 제작자와 일선 사서들의 메뉴구조와 용어선정 문제에 도움을 주고, 이용자에게 도서관이 제공하는 서비스의 개념적 혼동과 이해부족 문제를 해소할 것으로 기대 된다.

Abstract

The purpose of this study is to propose new menu structure and terms to be used by Website design for utilization of academic library Website. The menu structure was analyzed, based on seven menu patterns of Website which is widely used, and terms were analyzed by the frequency appearing at the Website. According to the analyzed result, the menu structure used to more than two menu patterns and the terms appear variety. The profitable menu pattern appears 〈table〉 and 〈frame + table〉 menu structures and the terms needs to systematic re-classification and controlled presentation. It is expected that this study can help a designer to the development and implementation of efficient Website. It helps not only to solve the problem of menu structure and term selection for librarian, but get rid of confusion of library services for users.

초록보기
초록

본 연구는 실재 시스템 환경에서 문헌 분류를 위해 범주화 기법을 적용할 경우, 범주화 성능이 어느 정도이며, 적정한 문헌범주화 성능의 달성을 위하여 분류기 학습에 필요한 범주당 가장 이상적인 학습문헌집합의 규모는 무엇인가를 파악하기 위하여 kNN 분류기를 사용하여 실험하였다. 실험문헌집단으로15만 여건의 실제 서비스되는 데이터베이스에서 2,556건 이상의 문헌을 가진 8개 범주를 선정하였다. 이들을 대상으로 범주당 학습문헌수 20개(Tr20)에서 2,000개(Tr2000)까지 단계별로 증가시키며 8개 학습문헌집합 규모를 갖도록 하위문헌집단을 구성한 후, 학습문헌집합 규모에 따른 하위문헌집단 간 범주화 성능을 비교하였다. 8개 하위문헌집단의 거시평균 성능은 F1 값 30%로 선행연구에서 발견된 kNN 분류기의 일반적인 성능에 미치지 못하는 낮은 성능을 보였다. 실험을 수행한 8개 대상문헌집단 중 학습문헌수가 100개인 Tr100 문헌집단이 F1 값 31%로 비용대 효과면에서 분류기 학습에 필요한 최적정의 실험문헌집합수로 판단되었다. 또한, 실험문헌집단에 부여된 주제범주 정확도를 수작업 재분류를 통하여 확인한 후, 이들의 범주별 범주화 성능과 관련성을 기반으로 위 결론의 신빙성을 높였다.

Abstract

This paper examines a level of categorization performance in a reallife collection of abstract articles in the fields of science and technology, and tests the optimal size of documents per category in a training set using a kNN classifier. The corpus is built by choosing categories that hold more than 2,556 documents first, and then 2,556 documents per category are randomly selected. It is further divided into eight subsets of different size of training documents: each set is randomly selected to build training documents ranging from 20 documents (Tr20) to 2,000 documents (Tr2000) per category. The categorization performances of the 8 subsets are compared. The average performance of the eight subsets is 30% in F1 measure which is relatively poor compared to the findings of previous studies. The experimental results suggest that among the eight subsets the Tr100 appears to be the most optimal size for training a kNN classifier. In addition, the correctness of subject categories assigned to the training sets is probed by manually reclassifying the training sets in order to support the above conclusion by establishing a relation between and the correctness and categorization performance.

정보관리학회지