바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

하이브리드 다중모델 학습기법을 이용한 자동 문서 분류

Automatic Text Categorization Using Hybrid Multiple Model Schemes

정보관리학회지 / Journal of the Korean Society for Information Management, (P)1013-0799; (E)2586-2073
2002, v.19 no.4, pp.35-51
https://doi.org/10.3743/KOSIM.2002.19.4.035
명순희 (용인송담대학)
김인철 (경기대학교)
  • 다운로드 수
  • 조회수

초록

본 논문에서는 다중 모델 기계학습 기법을 이용하여 자동 문서 분류의 성능과 신뢰도를 향상시킬 수 있는 연구와 실험 결과를 기술하였다. 기존의 다중 모델 기계 학습법들이 훈련 데이터 또는 학습 알고리즘의 편향에 의한 오류를 극복하고자 한 것인데 비해 본 논문에서 제안한 메타 학습을 이용한 하이브리드 다중 모델 방식은 이 두 가지의 오류 원인을 동시에 해소하고자 하였다. 다양한 문서 집합에 대한 실험 결과. 본 논문에서 제안한 하이브리드 다중 모델 학습법이 전반적으로 기존의 일반 다중모델 학습법들에 비해 높은 성능을 보였으며, 다중 모델의 결합 방식으로서 메타 학습이 투표 방식에 비해 효율적인 것으로 나타났다.

keywords
hybrid multiple model, text classification, multiple modeling algorithm, 문서분류, 기계학습, 다중모델 학습

Abstract

Inductive learning and classification techniques have been employed in various research and applications that organize textual data to solve the problem of information access. In this study, we develop hybrid model combination methods which incorporate the concepts and techniques for multiple modeling algorithms to improve the accuracy of text classification, and conduct experiments to evaluate the performances of proposed schemes. Boosted stacking, one of the extended stacking schemes proposed in this study yields higher accuracy relative to the conventional model combination methods and single classifiers.

keywords
hybrid multiple model, text classification, multiple modeling algorithm, 문서분류, 기계학습, 다중모델 학습

정보관리학회지