바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: feature, 검색결과: 7
초록보기
초록

로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부여 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

Abstract

This study examines various weighting methods for improving the performance of automatic classification based on Rocchio algorithm on two collections(LISA, Reuters-21578). First, three factors for weighting are identified as document factor, document factor, category factor for each weighting schemes, the performance of each was investigated. Second, the performance of combined weighting methods between the single schemes were examined. As a result, for the single schemes based on each factor, category-factor-based schemes showed the best performance, document set-factor-based schemes the second, and document-factor-based schemes the worst. For the combined weighting schemes, the schemes(idf*cat) which combine document set factor with category factor show better performance than the combined schemes(tf*cat or ltf*cat) which combine document factor with category factor as well as the common schemes(tfidf or ltfidf) that combining document factor with document set factor. However, according to the results of comparing the single weighting schemes with combined weighting schemes in the view of the collections, while category-factor-based schemes(cat only) perform best on LISA, the combined schemes(idf*cat) which combine document set factor with category factor showed best performance on the Reuters-21578. Therefore for the practical application of the weighting methods, it needs careful consideration of the categories in a collection for automatic classification.

초록보기
초록

동일한 인명을 갖는 서로 다른 실세계 사람들이 존재하는 현실은 인터넷 세계에서 인명으로 표현된 개체의 신원을 식별해야 하는 문제를 발생시킨다. 상기의 문제가 학술정보 내의 저자명 개체로 제한된 경우를 저자식별이라 부른다. 저자식별은 식별 대상이 되는 저자명 개체 사이의 유사도 즉 저자유사도를 계산하는 단계와 이후 저자명 개체들을 군집화하는 단계로 이루어진다. 저자유사도는 공저자, 논문제목, 게재지정보 등의 저자식별자질들의 자질유사도로부터 계산되는데, 이를 위해 기존에 교사방법과 비교사방법들이 사용되었다. 저자식별된 학습샘플을 사용하는 교사방법은 비교사방법에 비해 다양한 저자식별자질들을 결합하는 최적의 저자유사도함수를 자동학습할 수 있다는 장점이 있다. 그러나, 기존 교사방법 연구에서는 SVM, MEM 등의 일부 기계학습기법만이 시도되었다. 이 논문은 다양한 기계학습기법들이 저자식별에 미치는 성능, 오류, 효율성을 비교하고, 공저자와 논문제목 자질에 대해 자질값 추출 및 자질 유사도 계산을 위한 여러 기법들의 비교분석을 제공한다.

Abstract

In bibliographic data, the use of personal names to indicate authors makes it difficult to specify a particular author since there are numerous authors whose personal names are the same. Resolving same-name author instances into different individuals is called author resolution, which consists of two steps: calculating author similarities and then clustering same-name author instances into different person groups. Author similarities are computed from similarities of author-related bibliographic features such as coauthors, titles of papers, publication information, using supervised or unsupervised methods. Supervised approaches employ machine learning techniques to automatically learn the author similarity function from author-resolved training samples. So far, however, a few machine learning methods have been investigated for author resolution. This paper provides a comparative evaluation of a variety of recent high-performing machine learning techniques on author disambiguation, and compares several methods of processing author disambiguation features such as coauthors and titles of papers.

3
서은경(한성대학교) ; 이원경(한성대학교) 2008, Vol.25, No.2, pp.25-48 https://doi.org/10.3743/KOSIM.2008.25.2.025
초록보기
초록

Abstract

The purpose of this study is to suggest retrieval interfaces for Korean paintings which support users to retrieve specific digitalized images of them through various access points and to widely browse based on unique features Korean paintings. The study, first, develops a set of descriptive elements suitable for Korean paintings. Twenty-six core elements and one hundred seventy-two attributes are selected as descriptive items for Korean paintings based on the opinion of 8 experts. Then, to gain realistic evidence of what descriptive elements of image serve users as access points, it is investigated which elements are used as retrieval access points among 26 core elements by 300 peered users who are consisted with two groups such as common users and domain specialists. The study, in final, designs two(general and advanced) types of search interfaces and display interfaces based on the most popular top 15 descriptive elements. This access-enhanced platform which enables user-oriented searches will satisfy users in image retrieving.

초록보기
초록

이 연구에서는 자관의 학술지 상호인용 및 동시인용 분석을 통하여 단순 피인용빈도 이상의 학술지 인용 패턴 분석을 시도 하였다. 이 연구를 통해 학술지의 중요도 파악에 있어서 자관 인용 네트워크의 구조적 분석이 인용빈도 이상의 자관 인용 패턴에 대한 설명을 하고 있는지와, Web of Science에서 제공하는 JIF 이외의 일반적 인용 지수 서비스들을 고려해야 할 필요성이 있는지를 살펴보았다. Y대학교 생명시스템대학 생명공학과 전·현직 교수진이 2006년과 2007년에 발표한 학술논문의 인용 네트워크 분석 및 Web of Science 이외의 일반적 인용 지수들간의 관계를 분석한 결과는 다음과 같다. 첫째, 자관의 상호인용 네트워크를 통해 자관의 연구 분야를 확인할 수 있었다. 둘째, 자관의 동시인용 네트워크 지수들은 자관 인용 네트워크의 구조적 속성을 반영하는 인용 패턴의 설명이 가능하며 이는 피인용빈도와 유사하면서도 추가적인 설명력을 가지는 것을 확인하였다. 셋째, 일반적 인용지수로는 JIF 외에도 합산지향지수, h-index와 같은 다양한 일반적 인용 지수들의 설명력이 다양하므로 이를 이용하여 다각적으로 고려하는 것이 필요한 것으로 파악되었다. 또한 학술지 평가에서 인용 색인 데이터베이스의 수록범위보다는 지수의 유형에 따른 설명력 차이가 크다는 것을 확인하였다. 이와 같은 자관의 인용 네트워크 분석은 정보서비스의 여러 분야에서 유용하게 사용될 수 있을 것으로 기대된다.

Abstract

In this study, we testify that network structural attributes of a citation network can explain other aspects of journal citation behaviors and the importances of journals. And we also testify various citation impact indicators of journals including JIF and h-index to verify the difference among them especially focused on their ability to explain an institution's local features of citation behaviors. An institutional citation network is derived using the articles published in 2006-2007 by biotechnology faculties of Y University. And various journal citation impact indicators including JIF, SJR, h-index, EigenFactor, JII are gathered from different service sites such as Web of Science, SCImago, EigenFactor.com, Journal-Ranking.com. As a results, we can explain the institution's 5 research domains with inter-citation network. And we find that the co-citation network structural features can show explanations on the patterns of institutional journal citation behavior different from the simple cited frequency of the institution or patterns based on general citation indicators. Also We find that journal ranks with various citation indicators have differences and it implies that total-based indices, average-based indices, and hybrid index(h-index) explain different aspects of journal citation pattern. We also reveal that the coverage of citation DB doesn't be a matter in the journal ranking. Analyzing the citation networks derived from an institution's research outputs can be a useful and effective method in developing several library services.

초록보기
초록

Abstract

In this study, web link analysis of the Korean National Archives has been performed using LexiURL to show the dynamic web flow of the National Archives and to identify which closely related institutions the archives should seek to cooperate with for developing an institutional strategic plan. Inlink and co-inlink analysis were performed and, to identify related institutions of the Korean National Archives, a comparison was made with other countries such as Australia, England and the United States. Through web link analysis, several features can be detected and future directions are suggested. Most inlinks and co-inlink of the Korean National Archives were from public institutions, indicating that relationships with educational or research institutions are weak. Moreover, Korean National Archives involve fewer web links related to international activities than other countries. Proceeding from these results, educational function, research function and international activities should be fortified. Korean National Archives need to provide more materials for supporting educational and research activities and more cultural interchange among related institutions. Further research with different heritage institutions such as libraries or museums is needed.

6
김용(전북대학교) ; 김늘봄(정읍시립도서관) ; 이태영(전북대학교) 2008, Vol.25, No.4, pp.87-113 https://doi.org/10.3743/KOSIM.2008.25.4.087
초록보기
초록

본 연구는 호주 이메일메타데이터표준 및 한국기록관리메타데이터 표준에 기반하여 국제표준을 준용하는 이메일기록에 대한 표준화된 메타데이터요소를 개발하는데 있다. 이러한 목표를 달성하기 위하여 본 연구에서는 기록관리 및 기록물 메타데이터와 관련된 국제표준인 ISO 15489와 ISO 23081을 분석 및 조사하였다. 두 번째로, 국내 공공기관에서 생산된 이메일기록에 대한 특징을 추출하기 위하여 사례연구를 수행하였다. 또한, 호주의 이메일 메타데이터표준에 대한 상대평가 연구를 수행하였다. 위의 과정을 통하여 추출된 결과와 함께, 본 연구에서는 이메일기록에 대한 관리를 위한 필수 및 선택적 메타데이터요소를 제안하였다. 또한 제안된 이메일 메타데이터요소에 적용 가능한 XML DTD를 개발하였다. 한편, 제안된 이메일 메타데이터요소는 한국의 지방자치단체의 행정정보시스템에서 생산된 실제 이메일기록에 적용하였다.

Abstract

The purpose of this paper is to develop standardized metadata elements of e-mail records with respect to international standards based on analyzing the Australian Government Email Metadata Standard(AGEMS) elements and Korean Records Management Metadata Standard including e-mail records. To achieve the goal, we investigated and analyzed ISO15489 and ISO 23081 which are the international standard related to records and metadata of records. Second, a case study related to the features of e-mail records produced in public institutions in Korea was performed. Third, we made a comparative study of Australian Government Email Metadata Standard(AGEMS). With the results, we proposed mandatory and optional metadata elements for managing e-mail records. Also, the DTD of proposed metadata elements were developed. The proposed metadata elements of e-mail was applied to e-mails which were produced from a administrative information system of a local government in Korea.

초록보기
초록

이 연구는 전자저널의 평가모형 개발에 관한 연구로서 전자저널의 개념 및 특징 파악, 평가모형 개발, 그리고 평가의 세 단계로 진행되었다. 평가모형은 전자저널의 양적측면과 질적측면을 종합적으로 고려할 수 있도록 개발되었으며, P대학교 도서관이 구독 중인 ScienceDirect 수록 저널 중 기계공학분야 저널을 대상으로 평가를 실시하였다. 평가결과 P대학교가 2000년부터 기계공학분야의 주요저널로서 선정·구독해온 22종의 저널 중 10종(45.5%)이 여전히 가치가 높은 것으로 나타났다. 22종의 기계공학분야 주요저널은 양적측면보다 질적측면에서 더 높은 점수를 받았다. 2000년 당시 패키지 형태로 서비스되기 시작하였던 77종의 기계공학분야 저널 중 14종이 종합평가 결과 주요저널로서 구독될 가치가 있는 것으로 나타났다. 결론적으로 지난 8년간 P대학교 연구자들이 이용해온 총 99종의 기계공학분야 저널의 중요도에 변화가 있었으며, 이는 연구진의 교체, 학계의 연구 동향 등이 반영된 결과로 해석할 수 있다.

Abstract

This study is aiming to develop an evaluation model considering electronic journal's properties and terms of subscription. As the first step to develop an evaluation model, this study analyzed features of electronic journals and various terms of subscription through reviewing literature. Second, it developed the evaluation model for electronic journals by using proper evaluation indicators which were extracted from previous studies on the evaluation journals and considering the terms of ScienceDirect subscription. Third, this evaluation model was applied to the 99 journals in the field of mechanical engineering in ScienceDirect. As a result of the evaluation, it was found out that there were variations in the value of journals between in 2000 and 2007. Some implications regarding e-journal subscription were also added.

정보관리학회지