바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 문헌범주화, 검색결과: 2
1
김판준(신라대학교 문헌정보학과) 2023, Vol.40, No.1, pp.1-21 https://doi.org/10.3743/KOSIM.2023.40.1.001
초록보기
초록

본 연구는 텍스트 분류를 위한 효율적인 자질선정 방법으로 자질 순위화 기법의 성능을 구체적으로 검토하였다. 지금까지 자질 순위화 기법은 주로 문헌빈도에 기초한 경우가 대부분이며, 상대적으로 용어빈도를 사용한 경우는 많지 않았다. 따라서 텍스트 분류를 위한 자질선정 방법으로 용어빈도와 문헌빈도를 개별적으로 적용한 단일 순위화 기법들의 성능을 살펴본 다음, 양자를 함께 사용하는 조합 순위화 기법의 성능을 검토하였다. 구체적으로 두 개의 실험 문헌집단(Reuters-21578, 20NG)과 5개 분류기(SVM, NB, ROC, TRA, RNN)를 사용하는 환경에서 분류 실험을 진행하였고, 결과의 신뢰성 확보를 위해 5-fold cross validation과 t-test를 적용하였다. 결과적으로, 단일 순위화 기법으로는 문헌빈도 기반의 단일 순위화 기법(chi)이 전반적으로 좋은 성능을 보였다. 또한, 최고 성능의 단일 순위화 기법과 조합 순위화 기법 간에는 유의한 성능 차이가 없는 것으로 나타났다. 따라서 충분한 학습문헌을 확보할 수 있는 환경에서는 텍스트 분류의 자질선정 방법으로 문헌빈도 기반의 단일 순위화 기법(chi)을 사용하는 것이 보다 효율적이라 할 수 있다.

Abstract

This study specifically reviewed the performance of the ranking schemes as an efficient feature selection method for text classification. Until now, feature ranking schemes are mostly based on document frequency, and relatively few cases have used the term frequency. Therefore, the performance of single ranking metrics using term frequency and document frequency individually was examined as a feature selection method for text classification, and then the performance of combination ranking schemes using both was reviewed. Specifically, a classification experiment was conducted in an environment using two data sets (Reuters-21578, 20NG) and five classifiers (SVM, NB, ROC, TRA, RNN), and to secure the reliability of the results, 5-Fold cross-validation and t-test were applied. As a result, as a single ranking scheme, the document frequency-based single ranking metric (chi) showed good performance overall. In addition, it was found that there was no significant difference between the highest-performance single ranking and the combination ranking schemes. Therefore, in an environment where sufficient learning documents can be secured in text classification, it is more efficient to use a single ranking metric (chi) based on document frequency as a feature selection method.

2
채현수(연세대학교 문헌정보학과 박사과정) ; 김예원(연세대학교 문헌정보학과 석사과정) ; 김혜영(청주대학교 문헌정보학과) ; 이지연(연세대학교 문헌정보학과) 2023, Vol.40, No.4, pp.95-121 https://doi.org/10.3743/KOSIM.2023.40.4.095
초록보기
초록

본 연구는 대학도서관 실무자인 사서의 인식을 바탕으로 대학도서관 서비스 범주별로 활용할 수 있는 4차 산업혁명 기술 조합을 탐색하고 효과적인 서비스 전략을 모색하는 데 목적이 있다. 문헌조사를 바탕으로 4차 산업혁명 기술의 개념과 유형을 파악하였고, 국내외 도서관 서비스의 기술 활용 사례를 살펴보았다. 국내 대학도서관이 서비스하고 있는 항목들을 조사하고 범주화하여 대학도서관 서비스 분야-범주-항목 체계를 정립하였고, 이를 바탕으로 설문조사를 실시하여 대학도서관 사서들이 인식하고 있는 서비스별 기술 도입 필요성과 적정 서비스 자동화 수준을 파악하였다. 조사 결과 우선적으로 고려할 필요가 있는 대학도서관 서비스-기술 조합 9가지를 선별할 수 있었다. 조사 및 분석 결과를 종합하여 서비스 범주별 서비스-기술 전략을 제안하였다. 본 연구는 대학도서관 서비스의 고도화 및 효율화를 위해 신기술 도입 및 활용 가능성을 탐색하고, 실무자들이 공감하고 있는 인식을 통해 서비스-기술 결합을 위해 추진해야 할 방향성을 살펴보았다는 점에서 의의가 있다.

Abstract

This study aims to explore the combinations of services and technologies for academic libraries to use based on librarians’ perception and establish effective service strategies accordingly. The literature review facilitated an understanding of Fourth Industrial Revolution technologies impacting the libraries. We discovered how technologies are transforming library services. We analyzed the academic library services to categorize their service structure. The survey revealed the necessity of introducing technology for each service category and the appropriate automation levels of services based on the perception of librarians. The survey results identified nine prioritized combinations of academic library services and technologies. Based on the analysis, we proposed the service-technology strategies for each category. This study has significance in exploring the potential for introducing and utilizing new technologies to enhance academic library services and exploring ways to combine services and technologies based on the common opinion of librarians.

정보관리학회지