바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 문헌정보학 주제분류, 검색결과: 2
1
최상희(대구가톨릭대학교) ; 하유진(Clarion University Department of Library Science) 2019, Vol.36, No.1, pp.53-71 https://doi.org/10.3743/KOSIM.2019.36.1.053
초록보기
초록

최근 대학에서는 다양하게 변화하고 있는 실무현장과 학술연구분야를 반영하여 교과과정을 개편하자는 요구가 다양하게 나타나고 있다. 이에 이 연구에서는 교육과정 개편에 필요한 해외 문헌정보학 교육과정의 동향을 파악하고자 세 가지 측면에서 미국 문헌정보학 교과과정에 개설되어 있는 교과목을 분석하였다. 교과목 분석에 적용된 기준은 국가직무능력표준(NCS)의 문헌정보관리 직무단위, 한국연구재단의 국가과학기술표준분류와 학술연구분야 분류표에 나타난 문헌정보학 주제 분류이다. 세 가지 측면으로 분석한 결과 공통되게 나타난 현상은 시스템 구축설계 및 정보기술분야의 교과목 수가 많은 것이며 도서관 및 정보센터 경영과 이용자서비스도 교과목이 많은 주제 분야인 것으로 조사되었다.

Abstract

Since new issues and topics are emerging in the information and library science fields, diverse needs are identified to enhance the curriculum of library and information science education. This study investigated curriculum of library and information science in US and identified the topics of classes in the curriculum by the three aspects such as competency areas, scientific and technology category, and research fields. Consequently, topics related various information technology including system design and implement are the most popular topics in all analyses. Library and information center management and user service are also major topics of the curriculum.

초록보기
초록

대표적인 앙상블 기법으로서 랜덤포레스트(RF)를 문헌정보학 분야의 학술지 논문에 대한 자동분류에 적용하였다. 특히, 국내 학술지 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 트리 수, 자질선정, 학습집합 크기 등 주요 요소들에 대한 다각적인 실험을 수행하였다. 이를 통해, 실제 환경의 불균형 데이터세트(imbalanced dataset)에 대하여 랜덤포레스트(RF)의 성능을 최적화할 수 있는 방안을 모색하였다. 결과적으로 국내 학술지 논문의 자동분류에서 랜덤포레스트(RF)는 트리 수 구간 100〜1000(C)과 카이제곱통계량(CHI)으로 선정한 소규모의 자질집합(10%), 대부분의 학습집합(9〜10년)을 사용하는 경우에 가장 좋은 분류 성능을 기대할 수 있는 것으로 나타났다.

Abstract

Random Forest (RF), a representative ensemble technique, was applied to automatic classification of journal articles in the field of library and information science. Especially, I performed various experiments on the main factors such as tree number, feature selection, and learning set size in terms of classification performance that automatically assigns class labels to domestic journals. Through this, I explored ways to optimize the performance of random forests (RF) for imbalanced datasets in real environments. Consequently, for the automatic classification of domestic journal articles, Random Forest (RF) can be expected to have the best classification performance when using tree number interval 100〜1000(C), small feature set (10%) based on chi-square statistic (CHI), and most learning sets (9-10 years).

정보관리학회지