바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Cluster analysis, 검색결과: 39
초록보기
초록

최근 문헌정보학의 관련 분야로 주목받고 있는 데이터과학은 오랫동안 문헌정보학에서 해오던 정보의 수집, 저장, 조직, 분석, 활용 등의 활동을 데이터에 적용하여 그 가치를 이해하려는 학문이며, 통계학과 컴퓨터공학 등 다른 학문분야와의 연계가 필요한 분야이다. 이러한 데이터과학 분야의 연구 영역을 파악하기 위하여 동시출현단어 분석을 사용하여 Web of Science 핵심컬렉션에 수록된 문헌들 중 데이터과학 관련 자료들을 수집하고, 그 주제범주를 활용하여 네트워크분석을 실시하였다. 총 667건의 자료에 대한 159개의 주제범주를 기술분석하여 데이터과학 관련 연구가 많이 이루어지고 있는 학문분야를 조사하였고, 네트워크분석을 통해 데이터과학 분야 연구영역의 지적구조를 시각적으로 파악하였다. 분석결과, 데이터과학 분야의 연구들은 2개 영역 9개 군집으로 구분되었으며, 주제범주의 용어들 중 중심성이 높은 용어들을 통해 각 군집의 대표적인 주제들을 선정하였다. 연구의 결과는 데이터과학 분야의 연구들에 대한 지적구조를 파악하는데 도움이 될 수 있고, 문헌정보학과의 연계융합전공으로서의 데이터과학 교과과정 개발에 방향성을 제시할 수도 있을 것이다.

Abstract

Data Science is emerging as a closely related field of study to Library and Information Science (LIS), and as an interdisciplinary subject combining LIS, statistics and computer science in an attempt to understand the value of data by applying what LIS has been doing for collecting, storing, organizing, analyzing, and utilizing information. To investigate which subject fields other than LIS, statistics, and computer science are related to Data Science, this study retrieved 667 materials from Web of Science Core Collection, extracted terms representing Web of Science Categories, examined subject fields that are studying Data Science using descriptive analysis, analyzed the intellectual structure of the field by co-word analysis and network analysis, and visualized the results as a Pathfinder network with clustering created with the PNNC clustering algorithm. The result of this study might help to understand the intellectual structure of the Data Science field, and may be helpful to give an idea for developing relatively new curriculum.

초록보기
초록

한국의 dCollection이 학위논문 수집기로 활용되고 있는데 반해, 일본의 레포지토리는 다양한 학술 컨텐츠를 수집, 보존, 확산하고 오픈 엑세스를 실현하기 위한 개별 기관의 자발적인 운영 도구로 발전되고 있다. 본 연구는 일본의 기관 레포지토리 통계 DB인 IRDB를 통해 레포지토리의 특성을 통계적으로 분석하고 구축된 컨텐츠량, 종별 구축 비율, 그리고 종간 상관성을 살펴보았다. 또한 등록된 컨텐츠 특성을 변수로 K-means 군집 분석을 수행함으로써, 일본에 형성된 기관 레포지토리가 어떻게 유형화될 수 있는지 분석하였다. 분석 결과, 일본의 기관 레포지토리는 교내학술논문, 학위논문, 기술보고서, 의학자료, 학술잡지논문 등 다양한 컨텐츠를 수용하고 있을 뿐 아니라, 컨텐츠의 특징에 따라 5개의 차별화된 군집으로 유형화됨으로써 다양한 모습으로 발전되어 가고 있었다.

Abstract

While dCollections of Korea have been initiated by a government for metadata harvesting, institutional repositories of Japan have been managed as instituion’s independent tool for not only collectiong, archiving and distributing their intellecture assets, but also realizing open access. This study analyzes IRDB of Japanese statistically for understanding features of institutional repositories and by clustering the repository on the basis of types of contents, the differences have been brightened. According to analysis result, Japanese repository contains diverse types of contents, such as journal articles, scholarly papers, text books and technical reports. etc. and clustered by five distinguished group with different contents type.

23
박지연(이화여자대학교) ; 정동열(이화여자대학교) 2013, Vol.30, No.4, pp.31-59 https://doi.org/10.3743/KOSIM.2013.30.4.031
초록보기
초록

본 연구는 저자서지결합분석을 사용하여 한국 문헌정보학의 1990년대와 2000년대 지적구조와 그 변화를 분석하는데 목적을 두고 있다. 이를 위해 첫째, 군집분석, 다차원척도법을 통하여 시기별 세부 주제 영역을 밝혔다. 둘째, 네트워크 분석을 통해 세부 주제 영역 간 관계를 시각화하고 전역 중심성이 높은 주제 영역을 확인하였다. 셋째, 1990년대와 2000년대 지적구조 비교를 통해 시간의 경과에 따른 주제 영역의 흐름을 규명하였다.

Abstract

The purpose of this study was to examine the intellectual structure of domestic LIS in the 1990s and 2000s using author bibliographic coupling analysis (ABCA). First, cluster analysis and multi-dimensional scaling analysis were performed to examine core subject areas and to map authors in two-dimensional space. Second, network analysis was used to visualize intellectual relationships among subject areas and to reveal the top subject areas for global centrality. Third, the 1990s and 2000s intellectual structures was compared to identify the changes of the intellectual structure over the course of time.

24
이재윤(명지대학교) ; 정은경(이화여자대학교) 2014, Vol.31, No.2, pp.57-77 https://doi.org/10.3743/KOSIM.2014.31.2.057
초록보기
초록

Abstract

As co-authorship has been prevalent within science communities, counting the credit of co-authors appropriately is an important consideration, particularly in the context of identifying the knowledge structure of fields with author-based analysis. The purpose of this study is to compare the characteristics of co-author credit counting methods by utilizing correlations, multidimensional scaling, and pathfinder networks. To achieve this purpose, this study analyzed a dataset of 2,014 journal articles and 3,892 cited authors from the Journal of the Architectural Institute of Korea: Planning & Design from 2003 to 2008 in the field of Architecture in Korea. In this study, six different methods of crediting co-authors are selected for comparative analyses. These methods are first-author counting (m1), straight full counting (m2), and fractional counting (m3), proportional counting with a total score of 1 (m4), proportional counting with a total score between 1 and 2 (m5), and first-author-weighted fractional counting (m6). As shown in the data analysis, m1 and m2 are found as extreme opposites, since m1 counts only first authors and m2 assigns all co-authors equally with a credit score of 1. With correlation and multidimensional scaling analyses, among five counting methods (from m2 to m6), a group of counting methods including m3, m4, and m5 are found to be relatively similar. When the knowledge structure is visualized with pathfinder network, the knowledge structure networks from different counting methods are differently presented due to the connections of individual links. In addition, the internal validity shows that first-author-weighted fractional counting (m6) might be considered a better method to author clustering. Findings demonstrate that different co-author counting methods influence the network results of knowledge structure and a better counting method is revealed for author clustering.

25
이지원(대구가톨릭대학교 도서관학과 부교수) 2019, Vol.36, No.4, pp.279-300 https://doi.org/10.3743/kosim.2019.36.4.279
초록보기
초록

본 연구는 동시출현단어 분석을 사용하여 2000년대와 2010년대 목록 분야 연구동향 및 지적구조 분석을 수행하고, 두 시기의 차이점을 비교하였다. 목록 분야는 독자적인 연구 영역을 확고히 구축하고 있었으며, 2000년대와 2010년대 연구동향 및 지적구조에 많은 차이점이 발견되었다. 첫째, 논문 수에 있어서는 2000년대에 비해 2010년대에는 연간 평균 4.2편이 감소하였으나, 저자키워드 수는 큰 차이는 나지 않았다. 연대별 키워드 출현빈도는 22.2%의 키워드만이 두 시기에 모두 3회 이상 나타났으며, 77.8%의 키워드들은 한 시기에만 3회 이상 나타났다. 둘째, 지적구조에 있어서 살펴보면, 2000년대에는 3단계 군집을 보여주어 2단계 군집으로 표현된 2010년대에 비해 보다 복잡한 형태의 네트워크를 형성하였다. 셋째, 각 군집의 특성 변화를 살펴본 결과, 일부 변화가 적은 연구주제들이 있기는 하지만, 많은 연구주제들이 더욱 활발히 진행되거나 세분되었으며, 감소하기도 하는 변화가 있었다. 이러한 연구의 결과는 목록 분야의 시대적 흐름과 함께 지적구조를 시각적으로 파악할 수 있게 하며, 미래의 모습을 예측하여 관련 교육과 연구를 준비할 수 있다는 점에서 의의가 있다.

Abstract

This study aims to analyze and to demonstrate the research trends and intellectual structure in the field of catalog in the 2000s and 2010s through co-word analysis. The field of catalog had firmly established its own research area and Many differences were found in research trends and intellectual structures in the 2000s and 2010s. First, the average number of articles decreased by 4.2 in the 2010s compared to the 2000s, but the number of author keywords was not significantly different. Only 22.2% of keywords appeared more than three times in both periods, and 77.8% of keywords appeared more than three times in one period. Second, in terms of intellectual structure, the 2000s, represented by three-level clusters, formed a more complex network than the 2010s, represented by two-level clusters. Third, as a result of examining the changes in the characteristics of each cluster, there were some research topics with few changes, but many research topics were more actively progressed or subdivided, and decreased. The results of this study are meaningful in that they can visually grasp the intellectual structure along with the trend of the age of catalogue, and can prepare for related education and research by predicting the future.

26
이지원(대구가톨릭대학교 문헌정보학과 교수) ; 이성숙(충남대학교 문헌정보학과 교수) 2024, Vol.41, No.1, pp.367-387 https://doi.org/10.3743/KOSIM.2024.41.1.367
초록보기
초록

본 연구는 새로운 표준과 규칙의 제정이 이루어지고 또한 향후 예고되어 있음으로 큰 변화의 과정을 거치고 있는 목록학에 있어 그동안 연구가 거의 없었던 해외 연구들의 최근 동향과 지적 구조를 규명하고자 하였다. 이를 위해 2010년 이후 14년간 발행된 논문 680편을 수집한 후, 이로부터 전처리를 거쳐 추출한 1,942개의 저자 키워드를 분석해보았다. 주요 분석 결과는 다음과 같다. 첫째, 해외 목록학 연구는 2017년 이후 주목할만한 성장세를 보이고 있었다. 둘째, 상위빈도 연구주제는 편목, 메타데이터, RDA, 대학도서관, 전거 제어, 링크드 데이터, FRBR, 목록, LCSH, 도서관, 온라인목록이었다. 셋째, 연구주제들은 크게 도서관 목록의 전통적인 부분과 관련된 것과 최근 들어 더욱 활발하게 논의가 진행되고 있는 주제인 전거제어와 협동편목, RDA, 링크드데이터와 관련된 2개의 군집으로 나눌 수 있었고, 이를 14개 소군집으로 세분하여 분석하였다. 넷째, 키워드 군집 14개의 성장지수와 표준 성과지수를 살펴본 결과, 하나의 군집을 제외하고는 학문 분야의 성장의 측면에서 모두 성장을 나타내는 수치를 보여주었다. 본 연구는 향후 국내 학계와 현장을 위한 목록의 발전 양상 예측하기 위한 기초자료 및 관련 교육에 유용하게 활용될 수 있다는 점에서 그 의의가 있다.

Abstract

This study aims to identify the recent trends and intellectual structure of international research in the field of catalog, which is undergoing a major change due to the enactment of new standards and rules and the anticipated future. For this purpose, we collected 680 articles published in the 14 years since 2010 and analyzed 1,942 author keywords extracted from them after preprocessing. The main findings of the analysis are as follows First, overseas cataloging research has seen notable growth since 2017. Second, the most frequent research topics were: cataloging, metadata, RDA, university libraries, authority control, linked data, FRBR, catalog, LCSH, libraries, andonline cataloging. Third, the research themes were divided into two clusters, one related to the traditional aspects of library cataloging and the other related to the more recently discussed topics of authority control, cooperative cataloging, RDA, and linked data, which were further subdivided into 14 subclusters. Fourth, we looked at the growth index and standard performance index of the 14 keyword clusters and found that all but one cluster showed growth in terms of discipline growth. This study is significant in that it can be used as a basis for predicting the future development of inventories for Korean academia and the field and for related education.

초록보기
초록

학문과 기술의 발달이 전개되면서 학문 간의 융합이 이루어지고 학제적 성향을 띠는 학문이 더욱 등장하게 되었다. 현재까지 계량정보학적 방법으로 학문 분야의 지적구조를 파악한 연구는 있었지만 학제적인 학문의 특성을 규명하여 지적구조를 분석한 시도는 적었다. 따라서 본 연구에서는 학제성을 띠는 의료정보학(Medical Informatics) 분야의 저널 중 IEEE ENG MED BIOL 저널을 선정하여 저자동시인용 분석과 동시출현단어 분석을 통해 본 저널의 지적구조를 파악하였다. 또한 상위 3개 대표 저널의 저자 및 MeSH Term을 추출하여 종합적으로 비교분석하였다. 이를 통해 의료정보학 분야의 융합된 학문들의 관계를 구조적으로 파악하고 의료정보학의 학문적 성향을 분석했다.

Abstract

Due to the development of science and technology, the convergence of various disciplines has been fostered. Accordingly, interdisciplinary studies have increasingly been expanded by integrating knowledge and methodology from different disciplines. The primary focus of biblimetric methods is on investigating the intellectual structure a field, and analysis of the characterization of interdisciplinary studies is overlooked. In this study, we aim to identify the intellectual structure of the field of medical informatics through author co-citation analysis and co-word analysis by the representative journal “IEEE ENG MED BIOL.” In addition, we examine authors and MeSH Terms of top three representative journals for further analysis of the field. We examine the intellectual structure of the medical informatics field by author and word clusters to identify the network structure of medical informatics disciplines.

초록보기
초록

이 연구에서는 토픽 모델링 결과 해석의 용이성을 위하여, 동적 인용 네트워크를 활용하여 LDA 기반 토픽 모델링의 토픽 수를 설정하고 중복 배치된 주요 키워드를 자아 중심 네트워크 분석을 통해 재배치하여 제시하는 방법을 제안하였다. ‘White LED’ 두 분야의 논문 데이터를 이용하여 분석한 결과, 동적 인용 네트워크 분석을 통해 형성된 분석대상 문헌집단에 혼잡도에 따른 토픽수를 사용하고 중복 분류된 토픽 내 주요 키워드를 자아중심 네트워크 분석 기법을 적용하여 재배치한 결과가 토픽 간의 중복도가 가장 낮은 것으로 나타났다. 따라서 동적 인용 네트워크 및 자아 중심 네트워크 분석을 적용함으로써 토픽모델링에 의한 분석 결과를 보완하는 다면적인 연구 동향 분석이 가능할 것으로 보인다.

Abstract

The combined approach of using ego-centric network analysis and dynamic citation network analysis for refining the result of LDA-based topic modeling was suggested and examined in this study. Tow datasets were constructed by collecting Web of Science bibliographic records of White LED and topic modeling was performed by setting a different number of topics on each dataset. The multi-assigned top keywords of each topic were re-assigned to one specific topic by applying an ego-centric network analysis algorithm. It was found that the topical cohesion of the result of topic modeling with the number of topic corresponding to the lowest value of perplexity to the dataset extracted by SPLC network analysis was the strongest with the best values of internal clustering evaluation indices. Furthermore, it demonstrates the possibility of developing the suggested approach as a method of multi-faceted research trend detection.

29
최원실(이화여자대학교 일반대학원 문헌정보학과) ; 정은경(이화여자대학교) 2019, Vol.36, No.3, pp.109-129 https://doi.org/10.3743/KOSIM.2019.36.3.109
초록보기
초록

대학의 재정 악화는 대학도서관 예산 삭감으로 이어지고, 특히 자료구입비 예산에 큰 영향을 끼쳤다. 이에 대한 해결책으로 대학도서관 자원공유에 관한 논의가 이루어지고 있으며, 상호대차 데이터를 분석하는 연구들이 진행되었다. 본 연구는 이러한 연구 흐름과 같이 국내 4년제 대학도서관 상호대차 장서 프로파일을 규명하고자 하였다. 이를 위해 2011년부터 2017년까지 KERIS 종합목록의 서지와 상호대차 데이터를 활용하여 상호대차 현황을 분석하였다. 그 결과로 첫째, 2011년에는 대규모 대학도서관을 중심으로 서양서 상호대차의 제공이 이루어졌으나, 2014년 이후 점차적으로 고유장서의 비율이 증가하면서 상호대차 네트워크 내 주요 권역의 범위가 확대되고, 권역 내 영향력이 증가하는 기관이 다수 출현하였다. 둘째, 2012년에는 서양서 소장 종수가 많고, 공통장서의 비율이 높을수록 상호대차 네트워크 내 영향력이 크게 나타났으나, 2016년에는 이러한 경향과 더불어 고유장서의 비중이 높을수록 제공 측면에서 영향력이 증가하였다. 셋째, 서양서 소장과 상호대차 지수에 의한 계층적 군집 분석에 따른 6개 군집의 대학도서관이 규명되었다. 이러한 연구결과는 향후 대학도서관 자원공유를 위한 정책 수립에 있어서 활용할 수 있으리라 기대한다.

Abstract

Since the recent financial crisis in universities has caused the decrease of academic library budget, the resource sharing has been considered by utilizing inter-library loan (ILL) data for solving the financial deficit. This study aims to identify the collection profiles of western monographs’ ILL data among 4-year academic libraries. In order to achieve the purpose of this study, this study analyzes ILL data from 2011 to 2017 using the bibliographic data and ILL transactions of the KERIS union catalog. The findings of the study show that the western monographs was significantly provided by large-scale academic libraries in 2011, however, the extent of major regions expanded, and the number of influential institutions rose in 2016. Second, in 2012, the influence in the ILL network increased in the quantity of western monographs holdings and the proportion of common collections. On the other hand, in 2016, it was also shown that the influence in terms of provision in the ILL network increased in the proportion of unique collections. Lastly, the ILL participating academic libraries were classified into six clusters by a hierarchical clustering analysis of holdings and ILL indexes.

초록보기
초록

이 연구에서는 프로파일링 분석과 동시출현단어 분석을 이용해 인접 학문과의 연관성을 바탕으로 한국어교육학의 정체성을 분석하고자 하였다. 먼저, 한국어교육학, 국어교육학, 국어학 학술지의 논문에서 추출한 주제어를 기반으로 저널 프로파일링 분석을 수행하였고 그 결과 한국어교육학 분야의 학술지들이 하나의 독립된 군집을 형성하는 것으로 나타났다. 그리고 학문 분야 프로파일링 분석과 동시출현단어 분석을 이용해 학문 분야 간 관계를 분석한 결과 한국어교육학이 국어학보다 국어교육학과 더 큰 유사성을 가지는 것으로 나타났다. 마지막으로, 동시출현단어 분석을 통해 세 학문 분야의 지적 구조를 비교․분석하였다. 이를 통해 한국어교육학에서만 출현한 주제들을 확인함으로써 인접학문들과의 관계 속에서 한국어교육학이 드러내는 정체성을 파악할 수 있었다.

Abstract

This study aims at establishing the identity of teaching Korean as a Foreign Language (KFL) domain by using journal profiling and co-word analysis in comparison with the relevant and adjacent domains. Firstly, by extracting and comparing topic terms, we calculate the similarity of academic journals of the three domains, KFL, teaching Korean as a Native Language (KNL), and Korean Linguistics (KL). The result shows that the journals of KFL form a distinct cluster from the others. The profiling analysis and co-word analysis are then conducted to visualize the relationship among all the three domains in order to uncover the characteristics of KFL. The findings show that KFL is more similar to KNL than to KL. Finally, the comparison of knowledge structures of these three domains based on the co-word analysis demonstrates the uniqueness of KFL as an independent domain in relation with the other relevant domains.

정보관리학회지