바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: library optimization, 검색결과: 2
1
노영희(건국대학교 문헌정보학과 교수) ; 장로사(중앙대학교 문헌정보학과 강사) 2019, Vol.36, No.4, pp.53-81 https://doi.org/10.3743/KOSIM.2019.36.4.053
초록보기
초록

IFLA의 UN 2030 Agenda, 도서관정보정책위원회의 제3차 도서관발전종합계획(2019-2023)에서 사회적 포용을 실천하는 도서관의 역할을 강조함에 따라 최근 국내외를 막론하고 정보불평등을 해소하기 위한 공공서비스기관으로서 도서관이 새롭게 조명되고 있다. 이에 본 연구에서는 도서관에 적합한 정보불평등 측정지표를 개발하였으며, 이를 위해 전문가 집단의 검증단계로서 FGI 및 델파이기법을 실시하였다. 그 결과, 최종지표는 총 3개의 평가영역, 총 12개의 평가항목, 총 30개의 평가지표로 도출되었다. 구체적으로 첫째, 접근 평가영역에서는 3개의 평가항목, 8개의 평가지표가 도출되었으며, 둘째, 역량 평가영역에서는 5개의 평가항목, 12개의 평가지표가 도출되었고, 셋째, 활용 평가영역에서는 4개의 평가항목, 10개의 평가지표가 도출되었다. 본 연구는 현재 범지구적으로 도서관에 적용 가능한 정보불평등 측정지표가 전무한 상황에서 개발되었다는 점에서 무엇보다 그 의미와 가치가 클 것으로 사료된다.

Abstract

The 3rd Library Comprehensive Development Plan (2019-2023) of the Committee on Library and Information Policy under IFLA-UN 2030 Agenda emphasize the role of libraries in practicing social inclusion. At home and abroad, this is shedding new light on libraries as the public service institutions aimed at resolving information inequality. This study thus developed the information inequality measurement indicator optimized for libraries. For this purpose, FGI and Delphi technique were implemented as the verification stage of the expert group. As a result, the final indicators were derived in three evaluation areas, twelve evaluation items, and 30 evaluation indicators. Specifically, first, 3 evaluation items and 8 evaluation indicators were derived in the access evaluation area; second, 5 evaluation items and 12 evaluation indicators were derived in the competency evaluation area; and third, 4 evaluation items and 10 evaluation indicators were derived in the utilization evaluation area. This study is considered to be of great significance in that the information inequality measurement indicators optimized for libraries were developed, the first of its kind.

초록보기
초록

대표적인 앙상블 기법으로서 랜덤포레스트(RF)를 문헌정보학 분야의 학술지 논문에 대한 자동분류에 적용하였다. 특히, 국내 학술지 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 트리 수, 자질선정, 학습집합 크기 등 주요 요소들에 대한 다각적인 실험을 수행하였다. 이를 통해, 실제 환경의 불균형 데이터세트(imbalanced dataset)에 대하여 랜덤포레스트(RF)의 성능을 최적화할 수 있는 방안을 모색하였다. 결과적으로 국내 학술지 논문의 자동분류에서 랜덤포레스트(RF)는 트리 수 구간 100〜1000(C)과 카이제곱통계량(CHI)으로 선정한 소규모의 자질집합(10%), 대부분의 학습집합(9〜10년)을 사용하는 경우에 가장 좋은 분류 성능을 기대할 수 있는 것으로 나타났다.

Abstract

Random Forest (RF), a representative ensemble technique, was applied to automatic classification of journal articles in the field of library and information science. Especially, I performed various experiments on the main factors such as tree number, feature selection, and learning set size in terms of classification performance that automatically assigns class labels to domestic journals. Through this, I explored ways to optimize the performance of random forests (RF) for imbalanced datasets in real environments. Consequently, for the automatic classification of domestic journal articles, Random Forest (RF) can be expected to have the best classification performance when using tree number interval 100〜1000(C), small feature set (10%) based on chi-square statistic (CHI), and most learning sets (9-10 years).

정보관리학회지