바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 분류, 검색결과: 8
초록보기
초록

로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부여 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

Abstract

This study examines various weighting methods for improving the performance of automatic classification based on Rocchio algorithm on two collections(LISA, Reuters-21578). First, three factors for weighting are identified as document factor, document factor, category factor for each weighting schemes, the performance of each was investigated. Second, the performance of combined weighting methods between the single schemes were examined. As a result, for the single schemes based on each factor, category-factor-based schemes showed the best performance, document set-factor-based schemes the second, and document-factor-based schemes the worst. For the combined weighting schemes, the schemes(idf*cat) which combine document set factor with category factor show better performance than the combined schemes(tf*cat or ltf*cat) which combine document factor with category factor as well as the common schemes(tfidf or ltfidf) that combining document factor with document set factor. However, according to the results of comparing the single weighting schemes with combined weighting schemes in the view of the collections, while category-factor-based schemes(cat only) perform best on LISA, the combined schemes(idf*cat) which combine document set factor with category factor showed best performance on the Reuters-21578. Therefore for the practical application of the weighting methods, it needs careful consideration of the categories in a collection for automatic classification.

2
김상균(한국한의학연구원) ; 김철(한국한의학연구원) ; 장현철(한국한의학연구원) ; 예상준(한국한의학연구원) ; 송미영(한국한의학연구원) 2008, Vol.25, No.4, pp.309-326 https://doi.org/10.3743/KOSIM.2008.25.4.309
초록보기
초록

국가 R&D 사업관리 시스템에서는 국내의 국가 연구개발과제 정보를 관리하고 검색할 수 있도록 하고 있다. 특히 연구개발과제들을 분류하고 다양한 검색 및 분석 서비스를 제공하기 위해서 다양한 분류체계를 이용하고 있다. 하지만 하나의 분류체계에 대해 하나의 분류만 입력 가능하도록 하고 있기 때문에 과제의 성격을 명확히 파악하는데 어려움이 있다. 또한 연구개발과제를 위한 분류체계는 모든 분야에 대한 일반적인 분류를 제공하고 있으나 한의학과 같은 특정 분야에 맞는 분류체계는 제공하지 않고 있다. 반면에 한의학 분야에서는 한의학에 대한 분류체계 연구가 진행되어 왔지만 이 분류체계 또한 한의학 전반에 관한 일반적인 분류이기 때문에 한의학 연구개발과제를 위한 분류로는 적합하지 않는 문제가 있다. 따라서 본 연구에서는 이러한 문제를 해결하기 위해 한의학 분야의 연구개발과제들의 성격을 명확히 파악하고 검색 및 분석에 활용할 수 있는 분류를 제안한다.

Abstract

NTIS(National Science & Technology Information Service) provides the information for domestic research projects. It in particular has several classification schemes to classify research projects and provide better retrieval and analysis services. It however is difficult to understand the characteristic of a research project clearly since only a classification in a classification scheme can be chosen about a research project. Moreover, the classification scheme covers the high-level classification for every research areas so that it cannot cover the area specialized to the oriental medicines. On the other hand, the classification schemes for oriental medicines have recently been studied in oriental medicine field. However, it also covers the high-level classification for oriental medicine so that it may not suit to a classification scheme for research projects. Therefore, in this paper we propose a classification scheme to understand clearly the characteristic of research projects in oriental medicine and use to use them to retrieval and analysis services.

초록보기
초록

본 연구는 공공도서관과 대형서점 이용자의 요구 및 이용행태가 유사하다는 가정 하에 두 기관의 분류방식의 분석을 통해 이용자의 도서탐색을 용이하게 해주는 요인들을 조사하였다. 본 연구의 목적은 대형서점의 방식으로 공공도서관의 장서를 분류하는 것을 제안하기보다는 공공도서관과 대형서점 분류방식의 어떤 특징이 탐색을 용이하게 하는지를 알아보아, 공공도서관에서 보다 편리한 분류를 제공하기 위해 고려할 점들이 무엇인지를 알아보는데 있다. 이를 위해 먼저 공공도서관 이용자의 도서탐색의 특징과 공공도서관과 대형서점의 분류방식을 조사·분석한 후 설문지법을 통해 이용자의 도서탐색목적과 탐색영역, 탐색기준을 알아보고, 공공도서관과 대형서점의 분류표를 바탕으로 탐색에 더 편리한 분류방식과 그 원인을 분석하였다. 연구결과 이용자들은 대형서점의 분류방식이 도서탐색에 더 편리하다고 생각하고 있음이 밝혀졌다.

Abstract

The research was conducted to investigate factors that facilitate users’ finding books by analyzing classifications in public library and bookstore. This research was based on the assumption that the users’ needs and information behaviors are similar in both public library and bookstore. The main purpose of this study is not to recommend classifying public library collections the way a bookstore does, but to figure out what makes the users’ book finding more convenient by analyzing the classifications. To carry out the research, users’ book finding in public library and classifications of public library and bookstore are analyzed. Then, a survey was conducted to investigate users’ book finding behaviors, degree of convenience in finding books according to different classifications and the causes of the convenience. The results of the research showed that bookstore’s classification was more convenient for the users in finding books.

초록보기
초록

인터넷의 보급 및 이용 활성화에 따라 인터넷을 통한 정보의 검색 및 획득이 정보검색의 일차적인 행태가 되고 있다. 인터넷을 통한 정보검색의 보편화는 인터넷 정보검색 포털이 제공하는 검색서비스의 중요성을 증대시키고 있다. 포털에서 제공하는 정보검색 서비스의 효율화는 인터넷 정보검색 환경의 효율화로 직결될 수 있다. 이에 본 고에서는 인터넷 정보검색 포털에서 제공하고 있는 서비스 가운데 인터넷 정보자료를 선별하고 조직화하여 제공하고 있는 디렉토리 서비스의 분류체계에 대해 고찰하였다. 구체적인 연구주제로 전통적인 문헌분류법에서 여러 주제분야에 공통적으로 적용될 수 있는 형식, 접근법을 모아 구성한 표준구분(standard subdivision) 항목들을 디렉토리 분류체계에서 어떻게 전개하고 있는 지 현황을 분석해 보았다. 이러한 분석을 기반으로 전통적인 문헌분류법의 표준구분에 포함된 항목들을 디렉토리 서비스에서 전개하는 방안을 제시하였다.

Abstract

With the rapid distribution and active usage of the Internet, information search and retrieval through Internet has become a primary form of information access. This ubiquity of information access through Internet means the increased significance of search performance offered by Internet portals, since the optimization of search performance by portal has strong implication for the effective access of information through Internet in general. In this context, this paper investigates the classification scheme used in the directory service of internet portals, which provides selected and organized access to Internet information. First, the author analyzes the deployment of directory classification of standard subdivision topics used in traditional library classification system, with emphasis on the table composed of the form and approach, which are applicable to diverse subject areas. Then, based on this analysis, he proposed a method of applying certain subdivisions of the standard subdivision to directory service of Internet portals.

5
정영미(연세대학교) ; 김용광(연세대학교) 2008, Vol.25, No.4, pp.227-243 https://doi.org/10.3743/KOSIM.2008.25.4.227
초록보기
초록

이 연구에서는 사건중심 뉴스기사 요약문을 자동생성하기 위해 뉴스기사들을 SVM 분류기를 이용하여 사건 주제범주로 먼저 분류한 후, 각 주제범주 내에서 싱글패스 클러스터링 알고리즘을 통해 특정한 사건 관련 기사들을 탐지하는 기법을 제안하였다. 사건탐지 성능을 높이기 위해 고유명사에 가중치를 부여하고, 뉴스의 발생시간을 고려한 시간벌점함수를 제안하였다. 또한 일정 규모 이상의 클러스터를 분할하여 적절한 크기의 사건 클러스터를 생성하도록 수정된 싱글패스 알고리즘을 사용하였다. 이 연구에서 제안한 사건탐지 기법의 성능은 단순 싱글패스 클러스터링 기법에 비해 정확률, 재현율, F-척도에서 각각 37.1%, 0.1%, 35.4%의 성능 향상률을 보였고, 오보율과 탐지비용에서는 각각 74.7%, 11.3%의 향상률을 나타냈다.

Abstract

This study investigates an event detection method with the aim of generating an event-focused news summary from a set of news articles on a certain event using a multi-document summarization technique. The event detection method first classifies news articles into the event related topic categories by employing a SVM classifier and then creates event clusters containing news articles on an event by a modified single pass clustering algorithm. The clustering algorithm applies a time penalty function as well as cluster partitioning to enhance the clustering performance. It was found that the event detection method proposed in this study showed a satisfactory performance in terms of both the F-measure and the detection cost.

초록보기
초록

본 연구는 먼저 민간의 고객관계관리(CRM)시스템을 정부차원에서 적용한 정책고객관계관리(PCRM)시스템의 개념과 현황, PCRM과 CRM의 비교, 그리고 통일부의 도입사례를 통해 PCRM의 핵심인 고객의 정의와 분류 과정에 대해 살펴본다. 다음, 통일부 소속 전문도서관인 북한자료센터의 사례를 통해 다른 정부기관 전문도서관에서의 활용 방향과 전자정부에서 시도된 다른 연계 시스템들과의 관계에 대해 논구한다. 마지막으로 이를 통해 PCRM이 전문도서관에서 발전적으로 정착하기 위해서 보안해야 할 문제에 대해서 고찰한다.

Abstract

This study examines firstly concept and present condition of Policy Customer Relationship Management(PCRM) system which applying in the governmental dimension Customer Relationship Management(CRM) system of enterprises(profit-making organizations), comparison of PCRM and CRM, and definition of customer and customer classification process as a key of PCRM. Next, investigates applying plan in the other special libraries of governmental institution through the case study of Information Center on North Korea(special library attached to the Ministry of Unification) and relationship with different connection systems attempted in e-government(Enterprise Architecture). Lastly, through this, considers complemental issues for developmental fixation in special libraries.

7
안인자(동원대학교) ; 황금숙(대림대학교) ; 노영희(건국대학교) 2008, Vol.25, No.1, pp.129-148 https://doi.org/10.3743/KOSIM.2008.25.1.129
초록보기
초록

능력중심의 사회가 도래함에 따라 사서직이 고숙련의 전문직으로 전문성강화를 하기 위하여 직무분석을 통하여 국립중앙도서관사서의 핵심직무를 도출하고, 전문사서의 유형을 개발하였다. 직무분석 결과 국립중앙도서관사서의 업무는 22개의 책무와 216개의 작업이며, 96개의 핵심업무로 구성되었다. 이를 체계적 교육과정개발을 위한 교육과정 우선순위 결정도구에 의하여 분석하고, 현장의 수요를 반영한 결과 기능별 10종, 이용대상별 2종을 제안하였다. 제안된 유형은 다음과 같다:장서개발전문사서, 분류ㆍ목록전문사서, 정보조사제공전문사서, 독서전문사서, 국제표준(ISO/TC, ISBN, ISSN, CIP)연구전문사서, DB전문가 및 시스템전문사서, 국내협력지원전문사서, 국제교류전문사서, 도서관마케팅전문사서, 교육설계전문사서, 어린이 전문사서, 장애인서비스 전문사서.

Abstract

Analyzing out the Key Tasks and Developing the Professional Type of National Librarians through Job Analysis was made, because improving the professionalism of librarians is the strategy of survival in the competency based society. It is composed of 22 duties, 216 tasks of national librarian job and 96 key tasks is extracted among them. As the results, 12 types of professional librarian which is composed 10 function oriented types, and 2 user oriented types, is suggested: collection development librarian, catalogerㆍtaxonomist, information service librarian, reading coach, research librarian of international standards, database & system manager, international work librarian, national support librarian, marketing librarian, library literacy librarian, children' librarian, handicapped service librarian.

8
김수경(한국정보통신대학교) ; 안기홍(한밭대학교) ; 최호진(한국과학기술원) 2008, Vol.25, No.4, pp.43-66 https://doi.org/10.3743/KOSIM.2008.25.4.043
초록보기
초록

시맨틱 웹 기술의 제안과 더불어 다양한 분야에 온톨로지의 특징을 적용한 기술 개발 연구가 많이 진행되고 있다. 인간이 소유한 개념을 가장 적절하게 표현하기 위해 현재에도 OWL, RDF와 같은 온톨로지 언어의 표현력을 확장시키기 위해 N-ary 관계나 모델-이론 의미론과 같은 개발이 진행되고있다. 본 연구는 한국어에 있어 문장이 내포하는 의미를 정확하게 결정하기 위해 문장의 구조에 따라 달라지는 단어의 의미를 연관할 수 있도록 N-ary 관계와 디자인 기반이 적용된 온톨로지의 지식 표현 방법을 연구하였다. 특히 다양한 지식 영역을 포함하는 다의어(polysemy)와 동의어(synonym)의 특징을 갖는 단어에 있어 각 지식 영역으로 분류되어 각 지식 영역에 있는 유사한 의미를 가진 단어로 확장되어 유사한 의미를 가진 단어가 포함된 문장의 경우 까지도 확장할 수 있는 표현 방법을 연구하였다. 연구의 검증을 위해 사용자가 입력한 병증 문장을 제안된 방법에 따라 구축된 온톨로지내 지식 관계와 의미 결정을 위한 추론 표현 방법을 이용하여 병증의 의미를 결정하고 그에 따른 진단을 제공하는 실험 시스템을 구현하였고, 한국어가 갖고 있는 문장의 유의성, 모호성, 복합성 의 특징을 보유한 증상문들의 실험 결과 의미 결정과 유사 의미 확장에 있어 우수한 성능을 보여주었다.

Abstract

Currently be proceeded a lot of researchers for ‘user information demand description' for interface of an information retrieval system or Web search engines, but user information demand description for a natural language form is a difficult situation. These reasons are as they cannot provide the semantic similarity that an information retrieval model can be completely satisfied with variety regarding an information demand expression and semantic relevance for user information description. Therefore, this study using the description logic that is a knowledge representation base of OWL and a vector model-based weight between concept, and to be able to satisfy variety regarding an information demand expression and semantic relevance proposes a decision way for perfect assistances of user information demand description. The experiment results by proposed method, semantic similarity of a polyseme and a synonym showed with excellent performance in decision.

정보관리학회지