바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 문헌분류, 검색결과: 3
초록보기
초록

로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부여 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

Abstract

This study examines various weighting methods for improving the performance of automatic classification based on Rocchio algorithm on two collections(LISA, Reuters-21578). First, three factors for weighting are identified as document factor, document factor, category factor for each weighting schemes, the performance of each was investigated. Second, the performance of combined weighting methods between the single schemes were examined. As a result, for the single schemes based on each factor, category-factor-based schemes showed the best performance, document set-factor-based schemes the second, and document-factor-based schemes the worst. For the combined weighting schemes, the schemes(idf*cat) which combine document set factor with category factor show better performance than the combined schemes(tf*cat or ltf*cat) which combine document factor with category factor as well as the common schemes(tfidf or ltfidf) that combining document factor with document set factor. However, according to the results of comparing the single weighting schemes with combined weighting schemes in the view of the collections, while category-factor-based schemes(cat only) perform best on LISA, the combined schemes(idf*cat) which combine document set factor with category factor showed best performance on the Reuters-21578. Therefore for the practical application of the weighting methods, it needs careful consideration of the categories in a collection for automatic classification.

초록보기
초록

본 연구는 공공도서관과 대형서점 이용자의 요구 및 이용행태가 유사하다는 가정 하에 두 기관의 분류방식의 분석을 통해 이용자의 도서탐색을 용이하게 해주는 요인들을 조사하였다. 본 연구의 목적은 대형서점의 방식으로 공공도서관의 장서를 분류하는 것을 제안하기보다는 공공도서관과 대형서점 분류방식의 어떤 특징이 탐색을 용이하게 하는지를 알아보아, 공공도서관에서 보다 편리한 분류를 제공하기 위해 고려할 점들이 무엇인지를 알아보는데 있다. 이를 위해 먼저 공공도서관 이용자의 도서탐색의 특징과 공공도서관과 대형서점의 분류방식을 조사·분석한 후 설문지법을 통해 이용자의 도서탐색목적과 탐색영역, 탐색기준을 알아보고, 공공도서관과 대형서점의 분류표를 바탕으로 탐색에 더 편리한 분류방식과 그 원인을 분석하였다. 연구결과 이용자들은 대형서점의 분류방식이 도서탐색에 더 편리하다고 생각하고 있음이 밝혀졌다.

Abstract

The research was conducted to investigate factors that facilitate users’ finding books by analyzing classifications in public library and bookstore. This research was based on the assumption that the users’ needs and information behaviors are similar in both public library and bookstore. The main purpose of this study is not to recommend classifying public library collections the way a bookstore does, but to figure out what makes the users’ book finding more convenient by analyzing the classifications. To carry out the research, users’ book finding in public library and classifications of public library and bookstore are analyzed. Then, a survey was conducted to investigate users’ book finding behaviors, degree of convenience in finding books according to different classifications and the causes of the convenience. The results of the research showed that bookstore’s classification was more convenient for the users in finding books.

초록보기
초록

인터넷의 보급 및 이용 활성화에 따라 인터넷을 통한 정보의 검색 및 획득이 정보검색의 일차적인 행태가 되고 있다. 인터넷을 통한 정보검색의 보편화는 인터넷 정보검색 포털이 제공하는 검색서비스의 중요성을 증대시키고 있다. 포털에서 제공하는 정보검색 서비스의 효율화는 인터넷 정보검색 환경의 효율화로 직결될 수 있다. 이에 본 고에서는 인터넷 정보검색 포털에서 제공하고 있는 서비스 가운데 인터넷 정보자료를 선별하고 조직화하여 제공하고 있는 디렉토리 서비스의 분류체계에 대해 고찰하였다. 구체적인 연구주제로 전통적인 문헌분류법에서 여러 주제분야에 공통적으로 적용될 수 있는 형식, 접근법을 모아 구성한 표준구분(standard subdivision) 항목들을 디렉토리 분류체계에서 어떻게 전개하고 있는 지 현황을 분석해 보았다. 이러한 분석을 기반으로 전통적인 문헌분류법의 표준구분에 포함된 항목들을 디렉토리 서비스에서 전개하는 방안을 제시하였다.

Abstract

With the rapid distribution and active usage of the Internet, information search and retrieval through Internet has become a primary form of information access. This ubiquity of information access through Internet means the increased significance of search performance offered by Internet portals, since the optimization of search performance by portal has strong implication for the effective access of information through Internet in general. In this context, this paper investigates the classification scheme used in the directory service of internet portals, which provides selected and organized access to Internet information. First, the author analyzes the deployment of directory classification of standard subdivision topics used in traditional library classification system, with emphasis on the table composed of the form and approach, which are applicable to diverse subject areas. Then, based on this analysis, he proposed a method of applying certain subdivisions of the standard subdivision to directory service of Internet portals.

정보관리학회지