바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: classifier, 검색결과: 6
1
정영미(연세대학교) ; 김용광(연세대학교) 2008, Vol.25, No.4, pp.227-243 https://doi.org/10.3743/KOSIM.2008.25.4.227
초록보기
초록

이 연구에서는 사건중심 뉴스기사 요약문을 자동생성하기 위해 뉴스기사들을 SVM 분류기를 이용하여 사건 주제범주로 먼저 분류한 후, 각 주제범주 내에서 싱글패스 클러스터링 알고리즘을 통해 특정한 사건 관련 기사들을 탐지하는 기법을 제안하였다. 사건탐지 성능을 높이기 위해 고유명사에 가중치를 부여하고, 뉴스의 발생시간을 고려한 시간벌점함수를 제안하였다. 또한 일정 규모 이상의 클러스터를 분할하여 적절한 크기의 사건 클러스터를 생성하도록 수정된 싱글패스 알고리즘을 사용하였다. 이 연구에서 제안한 사건탐지 기법의 성능은 단순 싱글패스 클러스터링 기법에 비해 정확률, 재현율, F-척도에서 각각 37.1%, 0.1%, 35.4%의 성능 향상률을 보였고, 오보율과 탐지비용에서는 각각 74.7%, 11.3%의 향상률을 나타냈다.

Abstract

This study investigates an event detection method with the aim of generating an event-focused news summary from a set of news articles on a certain event using a multi-document summarization technique. The event detection method first classifies news articles into the event related topic categories by employing a SVM classifier and then creates event clusters containing news articles on an event by a modified single pass clustering algorithm. The clustering algorithm applies a time penalty function as well as cluster partitioning to enhance the clustering performance. It was found that the event detection method proposed in this study showed a satisfactory performance in terms of both the F-measure and the detection cost.

초록보기
초록

로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부여 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

Abstract

This study examines various weighting methods for improving the performance of automatic classification based on Rocchio algorithm on two collections(LISA, Reuters-21578). First, three factors for weighting are identified as document factor, document factor, category factor for each weighting schemes, the performance of each was investigated. Second, the performance of combined weighting methods between the single schemes were examined. As a result, for the single schemes based on each factor, category-factor-based schemes showed the best performance, document set-factor-based schemes the second, and document-factor-based schemes the worst. For the combined weighting schemes, the schemes(idf*cat) which combine document set factor with category factor show better performance than the combined schemes(tf*cat or ltf*cat) which combine document factor with category factor as well as the common schemes(tfidf or ltfidf) that combining document factor with document set factor. However, according to the results of comparing the single weighting schemes with combined weighting schemes in the view of the collections, while category-factor-based schemes(cat only) perform best on LISA, the combined schemes(idf*cat) which combine document set factor with category factor showed best performance on the Reuters-21578. Therefore for the practical application of the weighting methods, it needs careful consideration of the categories in a collection for automatic classification.

초록보기
초록

본 연구는 인쇄형 해외학술지 원문제공서비스(DDS)의 경제성을 분석하기 위해 이용자 기반의 경제적 가치 평가 방법론 및 모델을 개발하고자 하였다. 본 연구를 위해 K기관의 구독중인 해외학술지 원문제공서비스의 데이터 중 일부가 분석을 위해 사용되었고 K기관 원문제공서비스 이용자를 대상으로 웹 서베이를 실시하였다. 해외학술지 원문제공서비스의 경제적 가치는 사용가치, 비사용가치, 그리고 기대가치가 고려되었고 사용가치 산출을 위해서는 소득접근법과 시장접근법을 제안하였다. 이용자에 의한 가치 산출을 위해, 본 연구는 조건부가치평가법을 적용하였고 이를 위해 가상 시나리오를 설정하였다.

Abstract

This study is to develope a user-based economic valuation methodology and model for the economic analysis on the DDS of foreign journals. For this study, the sampling data on the annual subscribed journals by K institution was used and the online questionnaire was used to collect data. There are three aspects of the economic value of DDS journals was classified as use value, non-use value, and expectancy value. We suggested the income and market approach to measure its economic use value. To estimate the its value by individual users, this study applied a contingent valuation method and designed the imaginary scenarios.

초록보기
초록

컴퓨터와 정보통신기술의 급격한 발전으로 인터넷의 활용이 보편화됨에 따라 가상공간에서 중요 매체가 되는 웹사이트의 기능과 역할은 매우 중요하며, 이러한 웹사이트에 대한 올바른 수준 평가는 웹사이트의 구축과 운영에 필요한 시사점을 제공해 준다. 많은 선행 연구에서 웹사이트 평가요소가 사용자의 만족도와 재방문에 대한 의도에 긍정적인 영향을 미치는 것으로 보고 있다. 본 연구에서는 기존 웹사이트 평가요소에 대한 연구를 바탕으로 대학도서관의 웹사이트 평가요소를 디자인, 콘텐츠, 사용자 인터페이스, 신뢰감, 운영관리라는 5 가지 항목으로 선정하였고, 사용자 만족과 재방문 의도를 내생 변수로 한 연구모형을 설계하고, 가설을 설정한 다음, 실증 연구를 통해 검증하였다. 그 결과 사용자 만족은 사용자 인터페이스에 가장 영향을 받으며, 재방문 의도는 콘텐츠와 사용자에 대한 신뢰감에 영향을 받는다. 하지만 대학도서관의 웹사이트는 사용자 만족과 재방문 의도 간에는 긴밀한 관계를 가지고 있다고 단정할 수는 없는 것으로 보인다.

Abstract

As time goes by, the function and role of website become more important. Therefore, it is very critical to evaluate and improve continuously the website to the purpose. Many previous studies show that some website evaluation factors will influence the user satisfaction and revisit to the website. The website evaluation criteria from the previous studies related to the university library website evaluation were classified into five assessment criteria which are design, contents, user interface, reliability, and site management. In the results, some significant suggestions were found out. User satisfaction is seriously affected by user interface, and user's intention to revisit is influenced by contents and reliability, but there may not be a close connection between them. Besides, the evaluation method in this study may be applicable to the new website-improving approach of website administrators and researchers.

초록보기
초록

본 연구는 공공도서관과 대형서점 이용자의 요구 및 이용행태가 유사하다는 가정 하에 두 기관의 분류방식의 분석을 통해 이용자의 도서탐색을 용이하게 해주는 요인들을 조사하였다. 본 연구의 목적은 대형서점의 방식으로 공공도서관의 장서를 분류하는 것을 제안하기보다는 공공도서관과 대형서점 분류방식의 어떤 특징이 탐색을 용이하게 하는지를 알아보아, 공공도서관에서 보다 편리한 분류를 제공하기 위해 고려할 점들이 무엇인지를 알아보는데 있다. 이를 위해 먼저 공공도서관 이용자의 도서탐색의 특징과 공공도서관과 대형서점의 분류방식을 조사·분석한 후 설문지법을 통해 이용자의 도서탐색목적과 탐색영역, 탐색기준을 알아보고, 공공도서관과 대형서점의 분류표를 바탕으로 탐색에 더 편리한 분류방식과 그 원인을 분석하였다. 연구결과 이용자들은 대형서점의 분류방식이 도서탐색에 더 편리하다고 생각하고 있음이 밝혀졌다.

Abstract

The research was conducted to investigate factors that facilitate users’ finding books by analyzing classifications in public library and bookstore. This research was based on the assumption that the users’ needs and information behaviors are similar in both public library and bookstore. The main purpose of this study is not to recommend classifying public library collections the way a bookstore does, but to figure out what makes the users’ book finding more convenient by analyzing the classifications. To carry out the research, users’ book finding in public library and classifications of public library and bookstore are analyzed. Then, a survey was conducted to investigate users’ book finding behaviors, degree of convenience in finding books according to different classifications and the causes of the convenience. The results of the research showed that bookstore’s classification was more convenient for the users in finding books.

6
김상균(한국한의학연구원) ; 김철(한국한의학연구원) ; 장현철(한국한의학연구원) ; 예상준(한국한의학연구원) ; 송미영(한국한의학연구원) 2008, Vol.25, No.4, pp.309-326 https://doi.org/10.3743/KOSIM.2008.25.4.309
초록보기
초록

국가 R&D 사업관리 시스템에서는 국내의 국가 연구개발과제 정보를 관리하고 검색할 수 있도록 하고 있다. 특히 연구개발과제들을 분류하고 다양한 검색 및 분석 서비스를 제공하기 위해서 다양한 분류체계를 이용하고 있다. 하지만 하나의 분류체계에 대해 하나의 분류만 입력 가능하도록 하고 있기 때문에 과제의 성격을 명확히 파악하는데 어려움이 있다. 또한 연구개발과제를 위한 분류체계는 모든 분야에 대한 일반적인 분류를 제공하고 있으나 한의학과 같은 특정 분야에 맞는 분류체계는 제공하지 않고 있다. 반면에 한의학 분야에서는 한의학에 대한 분류체계 연구가 진행되어 왔지만 이 분류체계 또한 한의학 전반에 관한 일반적인 분류이기 때문에 한의학 연구개발과제를 위한 분류로는 적합하지 않는 문제가 있다. 따라서 본 연구에서는 이러한 문제를 해결하기 위해 한의학 분야의 연구개발과제들의 성격을 명확히 파악하고 검색 및 분석에 활용할 수 있는 분류를 제안한다.

Abstract

NTIS(National Science & Technology Information Service) provides the information for domestic research projects. It in particular has several classification schemes to classify research projects and provide better retrieval and analysis services. It however is difficult to understand the characteristic of a research project clearly since only a classification in a classification scheme can be chosen about a research project. Moreover, the classification scheme covers the high-level classification for every research areas so that it cannot cover the area specialized to the oriental medicines. On the other hand, the classification schemes for oriental medicines have recently been studied in oriental medicine field. However, it also covers the high-level classification for oriental medicine so that it may not suit to a classification scheme for research projects. Therefore, in this paper we propose a classification scheme to understand clearly the characteristic of research projects in oriental medicine and use to use them to retrieval and analysis services.

정보관리학회지