바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: classification scheme, 검색결과: 22
초록보기
초록

이 연구는 KCI 기타인문학, 기타사회과학, 사회과학일반 분야(이하 ‘일반 및 기타 분야’로 표기)에 속한 학술지의 다학문성과 학제성을 분석한 후, 이를 바탕으로 일반 및 기타 분야의 학술지 분류에 대한 개선방안을 제안하는 것이 목적이다. 개별 학술지의 다학문성과 학제성은 인용관계에 나타난 학술지 단위 엔트로피와 논문 단위 엔트로피로 각각 측정하였다. 학술지 간 인용관계 분석 결과 KCI 일반 및 기타 분야에는 다학문성과 학제성 측면에서 다양한 학술지가 혼재되어 있는 것으로 나타났다. 일반 및 기타 분야 학술지의 분류를 바로잡기 위해서는 우선 학술연구분야 분류표에 인문학일반 분야를 새로 설정할 필요가 있음을 밝혔다. 나아가서 각 학술지의 다학문성 수준 및 학제성 수준을 고려하여 일반 및 기타 분야 학술지를 재분류하는 방안을 제안하였다.

Abstract

This study analyzed humanities and social science (HSS) journals of KCI to examine the multidisciplinarity and interdisciplinarity in the general and miscellaneous fields (hereinafter referred to as ‘GM fields’), The multidisciplinarity and interdisciplinarity identified in this study will be a foundation to improve classification of KCI journals in GM fields. Each journal’s multidisciplinarity and interdisciplinarity were measured by journal-level entropy and document-level entropy, respectively, in the citation relationships. According to the analysis, GM field journals have wide ranges of multidisciplinarity and interdisciplinarity. To improve classification quality of journals in GM fields, the general humanities should be considered as a new classification class for the multidisciplinary and interdisciplinary journals in the humanities. Furthermore, this study proposes a strategy to reclassify GM field journals of HSS according to their multidisciplinarity and interdisciplinarity.

초록보기
초록

로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부여 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

Abstract

This study examines various weighting methods for improving the performance of automatic classification based on Rocchio algorithm on two collections(LISA, Reuters-21578). First, three factors for weighting are identified as document factor, document factor, category factor for each weighting schemes, the performance of each was investigated. Second, the performance of combined weighting methods between the single schemes were examined. As a result, for the single schemes based on each factor, category-factor-based schemes showed the best performance, document set-factor-based schemes the second, and document-factor-based schemes the worst. For the combined weighting schemes, the schemes(idf*cat) which combine document set factor with category factor show better performance than the combined schemes(tf*cat or ltf*cat) which combine document factor with category factor as well as the common schemes(tfidf or ltfidf) that combining document factor with document set factor. However, according to the results of comparing the single weighting schemes with combined weighting schemes in the view of the collections, while category-factor-based schemes(cat only) perform best on LISA, the combined schemes(idf*cat) which combine document set factor with category factor showed best performance on the Reuters-21578. Therefore for the practical application of the weighting methods, it needs careful consideration of the categories in a collection for automatic classification.

초록보기
초록

국내 학술회의 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히 구현이 쉽고 컴퓨터 처리 속도가 빠른 로치오 알고리즘을 사용하여 『한국정보관리학회 학술대회 논문집』의 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 분류기 생성 방법, 학습집합 규모, 가중치부여 기법, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 파라미터(β, λ)와 학습집합의 크기(5년 이상)를 적절하게 적용하는 것이 효과적이며, 동등한 성능 수준이라면 보다 단순한 단일 가중치부여 기법을 사용하여 분류의 효율성을 높일 수 있음을 발견하였다. 또한 국내 학술회의 논문의 분류는 특정 논문에 하나 이상의 범주가 부여되는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있으므로, 이러한 환경을 고려하여 주요 성능 요소들의 특성에 기초한 최적의 분류 모델을 개발할 필요가 있다.

Abstract

This study examined the factors affecting the performance of automatic classification for the domestic conference papers based on machine learning techniques. In particular, In view of the classification performance that assigning automatically the class labels to the papers in Proceedings of the Conference of Korean Society for Information Management using Rocchio algorithm, I investigated the characteristics of the key factors (classifier formation methods, training set size, weighting schemes, label assigning methods) through the diversified experiments. Consequently, It is more effective that apply proper parameters (β, λ) and training set size (more than 5 years) according to the classification environments and properties of the document set. and If the performance is equivalent, I discovered that the use of the more simple methods (single weighting schemes) is very efficient. Also, because the classification of domestic papers is corresponding with multi-label classification which assigning more than one label to an article, it is necessary to develop the optimum classification model based on the characteristics of the key factors in consideration of this environment.

14
명순희(용인송담대학) ; 김인철(경기대학교) 2002, Vol.19, No.4, pp.35-51 https://doi.org/10.3743/KOSIM.2002.19.4.035
초록보기
초록

본 논문에서는 다중 모델 기계학습 기법을 이용하여 자동 문서 분류의 성능과 신뢰도를 향상시킬 수 있는 연구와 실험 결과를 기술하였다. 기존의 다중 모델 기계 학습법들이 훈련 데이터 또는 학습 알고리즘의 편향에 의한 오류를 극복하고자 한 것인데 비해 본 논문에서 제안한 메타 학습을 이용한 하이브리드 다중 모델 방식은 이 두 가지의 오류 원인을 동시에 해소하고자 하였다. 다양한 문서 집합에 대한 실험 결과. 본 논문에서 제안한 하이브리드 다중 모델 학습법이 전반적으로 기존의 일반 다중모델 학습법들에 비해 높은 성능을 보였으며, 다중 모델의 결합 방식으로서 메타 학습이 투표 방식에 비해 효율적인 것으로 나타났다.

Abstract

Inductive learning and classification techniques have been employed in various research and applications that organize textual data to solve the problem of information access. In this study, we develop hybrid model combination methods which incorporate the concepts and techniques for multiple modeling algorithms to improve the accuracy of text classification, and conduct experiments to evaluate the performances of proposed schemes. Boosted stacking, one of the extended stacking schemes proposed in this study yields higher accuracy relative to the conventional model combination methods and single classifiers.

초록보기
초록

문헌정보학 분야의 국내 학술지 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히, 「정보관리학회지」에 수록된 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 용어 가중치부여 기법, 학습집합 크기, 분류 알고리즘, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 각 요소를 적절하게 적용하는 것이 효과적이며, 보다 단순한 모델의 사용으로 상당히 좋은 수준의 성능을 도출할 수 있었다. 또한, 국내 학술지 논문의 분류는 특정 논문에 하나 이상의 범주를 할당하는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있다. 따라서 이러한 환경을 고려하여 단순하고 빠른 분류 알고리즘과 소규모의 학습집합을 사용하는 최적의 분류 모델을 제안하였다.

Abstract

This study examined the factors affecting the performance of automatic classification based on machine learning for domestic journal articles in the field of LIS. In particular, In view of the classification performance that assigning automatically the class labels to the articles in 「Journal of the Korean Society for Information Management」, I investigated the characteristics of the key factors(weighting schemes, training set size, classification algorithms, label assigning methods) through the diversified experiments. Consequently, It is effective to apply each element appropriately according to the classification environment and the characteristics of the document set, and a fairly good performance can be obtained by using a simpler model. In addition, the classification of domestic journals can be considered as a multi-label classification that assigns more than one category to a specific article. Therefore, I proposed an optimal classification model using simple and fast classification algorithm and small learning set considering this environment.

초록보기
초록

조선총독부 공문서는 근대사 연구의 가장 핵심적인 정보원이다. 이 연구의 목적은 조선총독부 공문서를 원활히 활용할 수 있도록 지원하는 기능분류체계를 개발하기 위한 원칙과 단계를 제시하는 것이다. 우선, 기능적 분류체계를 위한 이론적 근거를 마련하기 위해 기록물 분류의 개념과 역할, 분류 원칙에 대해 살펴보고, ‘기능적 출처’ 개념 도입의 필요성을 제시하였다. 또한 조선총독부 공문서 분류에 왜 기능분류가 적합한지를 살펴보았고, 기능분류 사례와 그 시사점도 살펴보았다. 이러한 이론적 연구와 조선총독부 조직 및 기능 분석 결과를 토대로 조선총독부 기록물을 위한 분류체계 개발을 위한 원칙을 설정하였다. 아울러 개념화, 용어화, 기호화를 고려한 개발모형을 도출하였으며, 분류표와 함께 시소러스를 연계 구축할 수 있는 방안도 제시하였다.

Abstract

Public records, produced during the period of Government-General of Chosun, are essential sources for Korean modern history research. The purpose of this study is to provide a guideline for developing function-based classification scheme for the records. This present paper begins with analyzing archival principles regarding the function-based classification, and examines the problems of current arrangement practices. Based on these analyses, it suggests a guideline for constructing a classification system and a functional thesaurus for the public records of Government-General of Chosun. This guideline also covers functional analysis process and some considerations of different classification aspects which are conceptual, verbal and notational.

17
남태우(중앙대학교) ; 유광연(중앙대학교) 2005, Vol.22, No.2, pp.57-85 https://doi.org/10.3743/KOSIM.2005.22.2.057
초록보기
초록

비십진식 분류법에 속하는 BC는 Henry Evelyn Bliss에 의해서 창안된 것으로, 미국에서 시작되었으나 영국에서 개정되고 현재까지 사용되고 있다. BC는 지식의 분류에 근거하여 주류를 배열했기 때문에 학구적이라는 평가를 받고 있다. 또한 기존 분류 체계 중에서는 가장 완전한 분류법으로 인정받고 있다. 그러나 우수한 분류체계임에도 불구하고, 국내에서는 분류론에 조금씩 언급되어 있을 뿐 그 연구가 체계적으로 분석된 적은 없다. 따라서 본 연구에서는 BC의 창안자인 Bliss에 대한 생애 및 사상 연구를 통해 그가 분류학 분야에 끼친 영향을 분석하고자 한다. 또한 BC에 대한 역사 및 특성 연구를 통해 그 우수성과 가치를 연구하였다. 가장 학구적이라고 평가받고 있는 BC의 연구를 통해 분류학이론에 대한 논리성 및 철학성에 대한 기반을 구축할 수 있을 것이다.

Abstract

Bliss stated that one of the purposes of the classification was to demonstrate that a coherent and comprehensive system, based on the logical principles of classification and consistent with the systems of science and education, may be available to services in libraries, to aid revision of long established classifications and to provide an adaptable, efficient and economical classification, notation and index. A fundamental principle is the idea of subordination each specific subject is subordinated to the appropriate general one. The full scheme followed the publication of two massive theoretical works on the organization of knowledge. Its main feature was the carefully designed main class order, reflecting Comte principle of gradation in speciality.

초록보기
초록

국내 학술연구의 동향을 구체적으로 파악하여 연구개발 활동의 체계적인 지원 및 평가는 물론 현재와 미래의 연구 방향을 설정할 수 있는 기초 데이터로서, 개별 학술지 논문에 표준화된 주제 범주(통제키워드)를 부여할 수 있는 효율적인 방안을 모색하였다. 이를 위해 한국연구재단 「학술연구분야분류표」 상의 분류 범주를 국내 학술지 논문에 자동 할당하는 과정에서, 자질선정 기법을 중심으로 자동분류의 성능에 영향을 미치는 주요 요소들에 대한 다각적인 실험을 수행하였다. 그 결과, 실제 환경의 불균형 데이터세트(imbalanced dataset)인 국내 학술지 논문의 자동분류에서는 보다 단순한 분류기와 자질선정 기법, 그리고 비교적 소규모의 학습집합을 사용하여 상당히 좋은 수준의 성능을 기대할 수 있는 것으로 나타났다.

Abstract

As basic data that can systematically support and evaluate R&D activities as well as set current and future research directions by grasping specific trends in domestic academic research, I sought efficient ways to assign standardized subject categories (control keywords) to individual journal papers. To this end, I conducted various experiments on major factors affecting the performance of automatic classification, focusing on feature selection techniques, for the purpose of automatically allocating the classification categories on the National Research Foundation of Korea’s Academic Research Classification Scheme to domestic journal papers. As a result, the automatic classification of domestic journal papers, which are imbalanced datasets of the real environment, showed that a fairly good level of performance can be expected using more simple classifiers, feature selection techniques, and relatively small training sets.

19
정동열(이화여자대학교) ; 김성진(인하공업전문대학) 2003, Vol.20, No.1, pp.165-198 https://doi.org/10.3743/KOSIM.2003.20.1.165
초록보기
초록

본 연구는 문헌정보학 분야 연구논문에서 저자들의 이론 활용 정도를 분석하기 위하여 한국문헌정보학회지와 정보관리학회지를 대상으로 지난 30년간 연구된 654편의 논문에 대한 내용분석이 이루어졌다. 주요 연구내용은 연구논문의 연대별 생산성, 세부주제영역별 생산성, 연구에 활용된 이론의 유형과 근원, 개별 이론별 활용도, 세부주제 영역별 활용도, 학회지별 활용도 등에 대한 개념적 연구와 실증적 연구가 수행되었다. 이를 위하여 이론의 개념적 기준 설정과 문헌정보연구의 세부주제영역에 대한 새로운 분류 체계, 특히 이론의 활용성을 평가하기 위한 기준으로 ‘이론 활용 5단계’ 모델을 제시하였다.

Abstract

This study analyzed authorsuse of theory in 654 articles that appeared in two core library and information science journals during last three decades. In order to analyze degree of theory use of LIS, such as, publication productivity, growth and distribution of theory in subfields, name and origin of theory, usability of each theory, subfields and journals, and so on, content analysis of LIS theories was performed through conceptual and empirical study. For the purpose of this study, we suggested a couple of new analytical methods, so called, 'Subfield Classification Scheme' within LIS, and '5 Degrees of Theory Use' model for the first time.

초록보기
초록

이 논문에서는 학술지 인용 데이터와 웹 링크 데이터를 이용하여 8개 과학기술 분야의 학제적 구조를 파악하고 각 학문분야 간 학제성을 비교하였다. 분석 대상이 되는 학술지와 웹 페이지의 주제적 성격을 파악하기 위해 기존의 과학기술 분류체계를 재구성하여 이용하였다. 이 연구에서 학제성은 여러 학문분야 간 학제적 연결의 측면에서 파악하였으며, 학제성의 정도는 연관 학문분야의 수로 측정한 학제적 다양성과 자기인용률에 의해 평가하였다. 분석 결과 학술지 인용 분석에서는 밝혀내지 못한 새로운 학제적 연결을 웹 링크 분석에 의해 파악하였으며, 이를 통해 웹 링크 분석이 학제성을 연구하는 수단으로서 유용함을 알 수 있었다. 또한 인용 분석과 링크 분석에서 모두 자연과학 분야에 비해 공학 분야의 학제성이 대체로 더 높게 나타났다.

Abstract

This study identifies the interdisciplinary structures of 8 scientific disciplines in science and technology using the data from journal citations and web links, and compares the interdisciplinarity among these scientific disciplines. The interdisciplinarity refers to interdisciplinary connections among scientific fields and the degree of interdisciplinarity is measured by the number of associated fields and the rate of self-citation. A re-arranged classification scheme for science and technology was adopted to identify subject categories of journals and web pages. Web link analysis revealed a few additional interdisciplinary connections that were not identified by the journal citation analysis, thus demonstrating that it is useful means of investigating the interdisciplinarity of scientific fields. Besides, in most of the cases the interdisciplinarity of the engineering fields were found greater than that of the fields in natural sciences in both analyses.

정보관리학회지