바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Categorization, 검색결과: 3
초록보기
초록

로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부여 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

Abstract

This study examines various weighting methods for improving the performance of automatic classification based on Rocchio algorithm on two collections(LISA, Reuters-21578). First, three factors for weighting are identified as document factor, document factor, category factor for each weighting schemes, the performance of each was investigated. Second, the performance of combined weighting methods between the single schemes were examined. As a result, for the single schemes based on each factor, category-factor-based schemes showed the best performance, document set-factor-based schemes the second, and document-factor-based schemes the worst. For the combined weighting schemes, the schemes(idf*cat) which combine document set factor with category factor show better performance than the combined schemes(tf*cat or ltf*cat) which combine document factor with category factor as well as the common schemes(tfidf or ltfidf) that combining document factor with document set factor. However, according to the results of comparing the single weighting schemes with combined weighting schemes in the view of the collections, while category-factor-based schemes(cat only) perform best on LISA, the combined schemes(idf*cat) which combine document set factor with category factor showed best performance on the Reuters-21578. Therefore for the practical application of the weighting methods, it needs careful consideration of the categories in a collection for automatic classification.

2
김희섭(경북대학교) ; 이세은(경북대학교 사회과학연구원) ; 황혜경(한국과학기술정보연구원) 2008, Vol.25, No.3, pp.339-355 https://doi.org/10.3743/KOSIM.2008.25.3.339
초록보기
초록

이 논문은 학술지가 지니는 다양한 속성들(내부적인 요소, 외부적인 요소, 그리고 요구론적 요소)이 학술지의 이용 가치에 어떠한 영향을 미치는 지에 대한 실증적 사례분석을 목적으로 하였다. 이 사례연구의 방법은 웹 질문지법을 채택하였으며, K기관 원문서비스 이용자와 DDS 담당자들을 대상으로 수집된 총 383개의 유효한 데이터를 분석하였다. 학술지의 내부적인 요소(즉, IF, 학술지 가격, 사용언어)가 학술지 이용가치에 영향을 미치는 것으로 나타났고, 학술지의 외부적인 요소와 요구론적 요소는 학술지 이용가치에 별다른 영향을 미치지 않는 것으로 나타났다.

Abstract

The purpose of this empirical case study is to explore what factors affect on the economic valuation of academic journals and to ascertain the degree of each impact. For this study, factors were categorized into three groups: internal factors, external factors and demand theory factors. The on-line questionnaire was used to collect data and 383 responded from individual users of and the persons in charge of the DDS(Document Delivery Service). Collected data were analyzed using SPSS 12.0 for Windows/PC. The result showed that there exist a strong relationship between the internal factors of academic journals(i.e., Impact Factor, Cost, and Language) and economic valuation in terms of its use value.

초록보기
초록

본 연구에서는 선행연구의 연구 성과에 기초하여 웹정보의 신뢰성 평가에 영향을 미치는 요인들을 포괄적으로 추출한 다음, 이를 전문가를 대상으로 한 지표적합도 조사를 통해 웹 사이트의 신뢰성 평가지표의 개발을 시도하였다. 선행 연구에서 제시된 국외 54개, 국내 49개의 웹 신뢰성 평가요인을 부분적으로 축소하거나 통합하였으며, 아울러 웹 사이트의 신뢰성을 높이거나 떨어뜨리는 요인을 일부 분석에 추가한 다음, 웹정보 신뢰성 평가지표 적합성 조사를 통해 웹정보 신뢰성 평가지표를 선정하고 계층화하였다. 이러한 과정을 통해 웹 신뢰성 평가에 영향을 미치는 1차 지표로서 웹사이트 신뢰성의 평가영역을 진실성 요인과 전문성 요인, 그리고 안전성 요인으로 나누었으며, 2차 지표로 진실성 요인을 믿음성과 명성으로, 전문성 요인을 유용성과 시의성, 그리고 경쟁력으로, 안전성 요인을 보안성과 안정성으로 나누었으며, 최종적으로 각 하위 요인별 네 개씩 모두 28개의 세부 요인을 추출하였다. 이렇게 개발된 평가지표를 소수의 전문가들을 대상으로 자기 분야의 웹 사이트를 중심으로 한 지표 적합도 조사를 통한 검증과정을 거쳤다.

Abstract

The Internet is now an integral part of the everyday lives of a majority of people. Web users are demanding web sites that offer credible information. This study tired to comprehensively extract the factors that affect the perception web credibility based on preceding researches and develop of indicators for evaluating the web credibility by goodness-fit analysis. I modified more than 100 factors which presented by preceding researches to 28 factors, and allocated these factors into the hierarchical categories like followings; trustworthiness, expertness, safety are categorized as first level factors, trustfulness and reputation are placed to sub-factors of trustworthiness, usefulness, timeliness and competency to sub-factors of expertness, security and reliability to sub-factors of safety as second level factors. Finally this study developed evaluating indicators for web credibility by goodness-of fit analysis.

정보관리학회지