바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: clustering analysis, 검색결과: 3
초록보기
초록

개체들 사이의 관계를 저차원 공간에 매핑하는 다차원척도법을 수행하기 위한 다양한 방법과 알고리즘이 개발되어왔다. 그러나 PROXSCAL이나 ALSCAL과 같은 기존의 기법들은 50개 이상의 개체를 포함하는 데이터 집합을 대상으로 개체 간의 관계와 군집 구조를 시각화하는데 있어서 효과적이지 못한 것으로 나타났다. 이 연구에서 제안하는 군집 지향 척도법 CLUSCAL(CLUster-oriented SCALing)은 기존 방법과 달리 입력되는 데이터의 군집 구조를 고려하도록 고안되었다. 50명의 저자동시인용 데이터와 85개 단어의 동시출현 데이터에 대해서 적용해본 결과 제안한 CLUSCAL 기법은 군집 구조를 잘 식별할 수 있는 MDS 지도를 생성하는 유용한 기법임이 확인되었다.

Abstract

There have been many methods and algorithms proposed for multidimensional scaling to mapping the relationships between data objects into low dimensional space. But traditional techniques, such as PROXSCAL or ALSCAL, were found not effective for visualizing the proximities between objects and the structure of clusters of large data sets have more than 50 objects. The CLUSCAL(CLUster-oriented SCALing) technique introduced in this paper differs from them especially in that it uses cluster structure of input data set. The CLUSCAL procedure was tested and evaluated on two data sets, one is 50 authors co-citation data and the other is 85 words co-occurrence data. The results can be regarded as promising the usefulness of CLUSCAL method especially in identifying clusters on MDS maps.

2
최상희(대구가톨릭대학교) ; 이재윤(경기대학교) 2012, Vol.29, No.1, pp.331-349 https://doi.org/10.3743/KOSIM.2012.29.1.331
초록보기
초록

구조적 초록은 학술 논문의 주제를 표현하는 역할을 하여 학술 논문을 처리하는데 중요한 요소로 인식되어왔다. 이 연구에서는 구조적 초록을 구성하는 세부 필드의 속성을 4개로 분석하고 초록의 구조를 활용하여 문서 클러스터링에 적용할 수 있는 가능성을 고찰고자 하였다. 구조적 초록의 필드 속성을 문서 클러스터링에 적용한 결과 클러스터링 기법간의 편차가 있었으나 연구 목적이 제공하는 정보량에 비해 주제성이 커서 클러스터링 성능에 가장 큰 영향을 미치고 있는 것으로 나타났다. 또한 분석 결과 특정 필드에 특화되어 출현하는 필드 종속적인 단어가 발생하는 것으로 나타나 필드 종속적인 단어를 배제하고 집단내 평균연결 기법을 적용하였을 때는 클러스터링의 성능이 개선되는 것으로 분석되었다.

Abstract

Structured abstracts have been regarded as an essential information factor to represent topics of journal articles. This study aims to provide an unconventional view to utilize structured abstracts with the analysis on sub fields of a structured abstract in depth. In this study, a structured abstract was segmented into four fields, namely, purpose, design, findings, and values/implications. Each field was compared in the performance analysis of document clustering. In result, the purpose statement of an abstract affected on the performance of journal article clustering more than any other fields. Furthermore, certain types of keywords were identified to be excluded in the document clustering to improve clustering performance, especially by Within group average clustering method. These keywords had stronger relationship to a specific abstract field such as research design than the topic of an article.

3
곽선영(이화여자대학교) ; 정은경(이화여자대학교) 2012, Vol.29, No.1, pp.115-134 https://doi.org/10.3743/KOSIM.2012.29.1.115
초록보기
초록

전통적인 저자동시인용분석은 인용색인 데이터베이스가 색인하는 제 1저자만을 대상으로 하기 때문에 제1저자 이외의 저자의 기여도가 제외된다는 한계를 지니고 있다. 본 연구의 목적은 경제학 분야를 대상으로 하여 복수저자기반의 저자동시인용분석을 활용하여 해당 학문분야의 지적구조를 제시하고자 한다. 이를 위하여 네 가지 실험집단을 구성하였다. (1) 인용된 문헌의 제 1저자만을 고려한 저자동시인용분석, (2) 문헌당 총합 제한 없이 복수저자에게 동일한 인용빈도 부여한 저자동시인용분석, (3) 문헌당 총 합을 제한하여 인용빈도를 부여한 저자동시인용분석, (4) 저자기입 순서를 고려하여 인용빈도를 부여한 저자동시인용분석. 본 연구의 결과는 크게 제 1저자만 고려한 방식과 복수저자를 모두 고려한 방식에 따라 군집형성에 있어서 차이를 보였다. 또한 복수저자의 인용빈도를 구하는 방식에 따라서 군집의 소속이 달라지는 변화를 찾아볼 수 있다. 이러한 결과는 공동저작이 증가하는 학문적 추세에 비추어서 학문의 지적구조를 밝히기 위해서는 복수저자가 고려된 저자동시인용분석이 중요하다는 점을 시사한다.

Abstract

The author co-citation analysis is generally based on the frequency of the first author because most citation databases include only the first author in the bibliographic information. In this sense, the purpose of this study is to provide a better knowledge structure by utilizing the multiple authorship of author co-citation analysis. To achieve the purpose of this study, four different data sets are prepared: (1) counting the first author, (2) counting all the author without limiting the total frequency, (3) counting all the author with limiting the total frequency, and (4) counting adjusted frequencies based on the order of author subscription. The findings of this study show that there are clear differences between the knowledge structure counting all the author and the one counting only the first author. In addition, depending on the different methods, there are subtle changes of cluster members for authors.

정보관리학회지