바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: clustering, 검색결과: 57
초록보기
초록

최근 문헌정보학의 관련 분야로 주목받고 있는 데이터과학은 오랫동안 문헌정보학에서 해오던 정보의 수집, 저장, 조직, 분석, 활용 등의 활동을 데이터에 적용하여 그 가치를 이해하려는 학문이며, 통계학과 컴퓨터공학 등 다른 학문분야와의 연계가 필요한 분야이다. 이러한 데이터과학 분야의 연구 영역을 파악하기 위하여 동시출현단어 분석을 사용하여 Web of Science 핵심컬렉션에 수록된 문헌들 중 데이터과학 관련 자료들을 수집하고, 그 주제범주를 활용하여 네트워크분석을 실시하였다. 총 667건의 자료에 대한 159개의 주제범주를 기술분석하여 데이터과학 관련 연구가 많이 이루어지고 있는 학문분야를 조사하였고, 네트워크분석을 통해 데이터과학 분야 연구영역의 지적구조를 시각적으로 파악하였다. 분석결과, 데이터과학 분야의 연구들은 2개 영역 9개 군집으로 구분되었으며, 주제범주의 용어들 중 중심성이 높은 용어들을 통해 각 군집의 대표적인 주제들을 선정하였다. 연구의 결과는 데이터과학 분야의 연구들에 대한 지적구조를 파악하는데 도움이 될 수 있고, 문헌정보학과의 연계융합전공으로서의 데이터과학 교과과정 개발에 방향성을 제시할 수도 있을 것이다.

Abstract

Data Science is emerging as a closely related field of study to Library and Information Science (LIS), and as an interdisciplinary subject combining LIS, statistics and computer science in an attempt to understand the value of data by applying what LIS has been doing for collecting, storing, organizing, analyzing, and utilizing information. To investigate which subject fields other than LIS, statistics, and computer science are related to Data Science, this study retrieved 667 materials from Web of Science Core Collection, extracted terms representing Web of Science Categories, examined subject fields that are studying Data Science using descriptive analysis, analyzed the intellectual structure of the field by co-word analysis and network analysis, and visualized the results as a Pathfinder network with clustering created with the PNNC clustering algorithm. The result of this study might help to understand the intellectual structure of the Data Science field, and may be helpful to give an idea for developing relatively new curriculum.

42
최원실(이화여자대학교 일반대학원 문헌정보학과) ; 정은경(이화여자대학교) 2019, Vol.36, No.3, pp.109-129 https://doi.org/10.3743/KOSIM.2019.36.3.109
초록보기
초록

대학의 재정 악화는 대학도서관 예산 삭감으로 이어지고, 특히 자료구입비 예산에 큰 영향을 끼쳤다. 이에 대한 해결책으로 대학도서관 자원공유에 관한 논의가 이루어지고 있으며, 상호대차 데이터를 분석하는 연구들이 진행되었다. 본 연구는 이러한 연구 흐름과 같이 국내 4년제 대학도서관 상호대차 장서 프로파일을 규명하고자 하였다. 이를 위해 2011년부터 2017년까지 KERIS 종합목록의 서지와 상호대차 데이터를 활용하여 상호대차 현황을 분석하였다. 그 결과로 첫째, 2011년에는 대규모 대학도서관을 중심으로 서양서 상호대차의 제공이 이루어졌으나, 2014년 이후 점차적으로 고유장서의 비율이 증가하면서 상호대차 네트워크 내 주요 권역의 범위가 확대되고, 권역 내 영향력이 증가하는 기관이 다수 출현하였다. 둘째, 2012년에는 서양서 소장 종수가 많고, 공통장서의 비율이 높을수록 상호대차 네트워크 내 영향력이 크게 나타났으나, 2016년에는 이러한 경향과 더불어 고유장서의 비중이 높을수록 제공 측면에서 영향력이 증가하였다. 셋째, 서양서 소장과 상호대차 지수에 의한 계층적 군집 분석에 따른 6개 군집의 대학도서관이 규명되었다. 이러한 연구결과는 향후 대학도서관 자원공유를 위한 정책 수립에 있어서 활용할 수 있으리라 기대한다.

Abstract

Since the recent financial crisis in universities has caused the decrease of academic library budget, the resource sharing has been considered by utilizing inter-library loan (ILL) data for solving the financial deficit. This study aims to identify the collection profiles of western monographs’ ILL data among 4-year academic libraries. In order to achieve the purpose of this study, this study analyzes ILL data from 2011 to 2017 using the bibliographic data and ILL transactions of the KERIS union catalog. The findings of the study show that the western monographs was significantly provided by large-scale academic libraries in 2011, however, the extent of major regions expanded, and the number of influential institutions rose in 2016. Second, in 2012, the influence in the ILL network increased in the quantity of western monographs holdings and the proportion of common collections. On the other hand, in 2016, it was also shown that the influence in terms of provision in the ILL network increased in the proportion of unique collections. Lastly, the ILL participating academic libraries were classified into six clusters by a hierarchical clustering analysis of holdings and ILL indexes.

43
박지연(이화여자대학교) ; 정동열(이화여자대학교) 2013, Vol.30, No.4, pp.31-59 https://doi.org/10.3743/KOSIM.2013.30.4.031
초록보기
초록

본 연구는 저자서지결합분석을 사용하여 한국 문헌정보학의 1990년대와 2000년대 지적구조와 그 변화를 분석하는데 목적을 두고 있다. 이를 위해 첫째, 군집분석, 다차원척도법을 통하여 시기별 세부 주제 영역을 밝혔다. 둘째, 네트워크 분석을 통해 세부 주제 영역 간 관계를 시각화하고 전역 중심성이 높은 주제 영역을 확인하였다. 셋째, 1990년대와 2000년대 지적구조 비교를 통해 시간의 경과에 따른 주제 영역의 흐름을 규명하였다.

Abstract

The purpose of this study was to examine the intellectual structure of domestic LIS in the 1990s and 2000s using author bibliographic coupling analysis (ABCA). First, cluster analysis and multi-dimensional scaling analysis were performed to examine core subject areas and to map authors in two-dimensional space. Second, network analysis was used to visualize intellectual relationships among subject areas and to reveal the top subject areas for global centrality. Third, the 1990s and 2000s intellectual structures was compared to identify the changes of the intellectual structure over the course of time.

44
최형욱(이화여자대학교 일반대학원 문헌정보학과) ; 정은경(이화여자대학교) 2017, Vol.34, No.3, pp.109-124 https://doi.org/10.3743/KOSIM.2017.34.3.109
초록보기
초록

여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문 인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 ‘Sociology’로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 ‘Sociology’로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

Abstract

Through a wide variety of disciplines, practices on data access and re-use have been increased recently. In fact, there has been an emerging phenomenon that researchers tend to use the data sets produced by other researchers and give scholarly credit as citation. With respect to this practice, in 2012, Thomson Reuters launched Data Citation Index (DCI). With the DCI, citation to research data published by researchers are collected and analyzed in a similar way for citation to journal articles. The purpose of this study is to identify the characteristics and intellectual structure of sociology field based on research data, which is one of actively data-citing fields. To accomplish this purpose, two data sets were collected and analyzed. First, from DCI, a total of 8,365 data were collected in the field of sociology. Second, a total of 12,132 data were collected from Web of Science with a topic search with ‘Sociology’. As a result of the co-word analysis of author provided-keywords for both data sets, the intellectual structure of research data-based sociology was composed of two areas and 15 clusters and that of article-based sociology was composed with three areas and 17 clusters. More importantly, medical science area was found to be actively studied in research data-based sociology and public health and psychology are identified to be central areas from data citation.

45
정영미(연세대학교) ; 유소영(연세대학교) 2009, Vol.26, No.3, pp.7-24 https://doi.org/10.3743/KOSIM.2009.26.3.007
초록보기
초록

학술적 웹 공간을 대상으로 하는 연구는 페이지와 링크의 역동성 때문에 정량적인 방법과 함께 내용 분석 등의 정성적인 방법을 사용하는 것이 필요하다. 따라서 이 연구에서는 내용 분석의 한 방법으로 한국 학술적 웹 공간 내에서 외부 링크로 연결된 페이지 및 링크의 유형을 분류한 후 이를 네트워크 구조 분석에 반영하여 한국 학술적 웹 공간의 특성을 자세히 살펴보았다. 분석 결과 데이터의 수집 시점을 나타내는 기본 네트워크와 내용 분석 시점을 나타내는 활성 네트워크 사이에 구조적으로 큰 차이가 없었으나, 기관 유형별로 다른 기관들을 링크하는 목적이 다르게 나타났다. 그리고 한국 학술적 웹 공간은 여러 중앙성 지수들과 결속계수 간의 설명력이 유사하게 나타나는 형태의 네트워크임을 확인하였다.

Abstract

Since the Web is dynamic, it is necessary to analyze scholarly Web space with both quantitative and qualitative methods for better understanding of communication characteristics. In this study, we analyzed contents of pages and links to ascertain the characteristics of Korean scholarly Web space in terms of network structure and communication behavior. The result shows that the structure of the original network with all the external links remained is not much different from that of the network with activated external links only. However, the purposes of linking vary among scholarly institutions. The centrality measures correlate more strongly with the clustering coefficient than with the constraint index implying the similar explanatory power of the two types of structural indices.

초록보기
초록

학문과 기술의 발달이 전개되면서 학문 간의 융합이 이루어지고 학제적 성향을 띠는 학문이 더욱 등장하게 되었다. 현재까지 계량정보학적 방법으로 학문 분야의 지적구조를 파악한 연구는 있었지만 학제적인 학문의 특성을 규명하여 지적구조를 분석한 시도는 적었다. 따라서 본 연구에서는 학제성을 띠는 의료정보학(Medical Informatics) 분야의 저널 중 IEEE ENG MED BIOL 저널을 선정하여 저자동시인용 분석과 동시출현단어 분석을 통해 본 저널의 지적구조를 파악하였다. 또한 상위 3개 대표 저널의 저자 및 MeSH Term을 추출하여 종합적으로 비교분석하였다. 이를 통해 의료정보학 분야의 융합된 학문들의 관계를 구조적으로 파악하고 의료정보학의 학문적 성향을 분석했다.

Abstract

Due to the development of science and technology, the convergence of various disciplines has been fostered. Accordingly, interdisciplinary studies have increasingly been expanded by integrating knowledge and methodology from different disciplines. The primary focus of biblimetric methods is on investigating the intellectual structure a field, and analysis of the characterization of interdisciplinary studies is overlooked. In this study, we aim to identify the intellectual structure of the field of medical informatics through author co-citation analysis and co-word analysis by the representative journal “IEEE ENG MED BIOL.” In addition, we examine authors and MeSH Terms of top three representative journals for further analysis of the field. We examine the intellectual structure of the medical informatics field by author and word clusters to identify the network structure of medical informatics disciplines.

초록보기
초록

이 연구에서는 토픽 모델링 결과 해석의 용이성을 위하여, 동적 인용 네트워크를 활용하여 LDA 기반 토픽 모델링의 토픽 수를 설정하고 중복 배치된 주요 키워드를 자아 중심 네트워크 분석을 통해 재배치하여 제시하는 방법을 제안하였다. ‘White LED’ 두 분야의 논문 데이터를 이용하여 분석한 결과, 동적 인용 네트워크 분석을 통해 형성된 분석대상 문헌집단에 혼잡도에 따른 토픽수를 사용하고 중복 분류된 토픽 내 주요 키워드를 자아중심 네트워크 분석 기법을 적용하여 재배치한 결과가 토픽 간의 중복도가 가장 낮은 것으로 나타났다. 따라서 동적 인용 네트워크 및 자아 중심 네트워크 분석을 적용함으로써 토픽모델링에 의한 분석 결과를 보완하는 다면적인 연구 동향 분석이 가능할 것으로 보인다.

Abstract

The combined approach of using ego-centric network analysis and dynamic citation network analysis for refining the result of LDA-based topic modeling was suggested and examined in this study. Tow datasets were constructed by collecting Web of Science bibliographic records of White LED and topic modeling was performed by setting a different number of topics on each dataset. The multi-assigned top keywords of each topic were re-assigned to one specific topic by applying an ego-centric network analysis algorithm. It was found that the topical cohesion of the result of topic modeling with the number of topic corresponding to the lowest value of perplexity to the dataset extracted by SPLC network analysis was the strongest with the best values of internal clustering evaluation indices. Furthermore, it demonstrates the possibility of developing the suggested approach as a method of multi-faceted research trend detection.

초록보기
초록

이 연구에서는 프로파일링 분석과 동시출현단어 분석을 이용해 인접 학문과의 연관성을 바탕으로 한국어교육학의 정체성을 분석하고자 하였다. 먼저, 한국어교육학, 국어교육학, 국어학 학술지의 논문에서 추출한 주제어를 기반으로 저널 프로파일링 분석을 수행하였고 그 결과 한국어교육학 분야의 학술지들이 하나의 독립된 군집을 형성하는 것으로 나타났다. 그리고 학문 분야 프로파일링 분석과 동시출현단어 분석을 이용해 학문 분야 간 관계를 분석한 결과 한국어교육학이 국어학보다 국어교육학과 더 큰 유사성을 가지는 것으로 나타났다. 마지막으로, 동시출현단어 분석을 통해 세 학문 분야의 지적 구조를 비교․분석하였다. 이를 통해 한국어교육학에서만 출현한 주제들을 확인함으로써 인접학문들과의 관계 속에서 한국어교육학이 드러내는 정체성을 파악할 수 있었다.

Abstract

This study aims at establishing the identity of teaching Korean as a Foreign Language (KFL) domain by using journal profiling and co-word analysis in comparison with the relevant and adjacent domains. Firstly, by extracting and comparing topic terms, we calculate the similarity of academic journals of the three domains, KFL, teaching Korean as a Native Language (KNL), and Korean Linguistics (KL). The result shows that the journals of KFL form a distinct cluster from the others. The profiling analysis and co-word analysis are then conducted to visualize the relationship among all the three domains in order to uncover the characteristics of KFL. The findings show that KFL is more similar to KNL than to KL. Finally, the comparison of knowledge structures of these three domains based on the co-word analysis demonstrates the uniqueness of KFL as an independent domain in relation with the other relevant domains.

초록보기
초록

본 연구에서는 학습주제의 연결망 구조와 스캔 및 클러스터 분석을 통해서 추출한 정보활용교육의 표준 학습주제를 가지고, 교과 교육과정과의 연계성을 갖춘 통합 정보활용교육과정을 개발하고자 하였다. 그리고 개발한 통합 정보활용교육과정의 실제 운영을 위한 교수-학습모형을 설계하였다. 본 연구에서는 정보활용교육과 교과 교육과정의 공통성 분석을 위해서 간학문적 성격을 갖는 정보활용교육의 학습주제를 분석기준으로 활용하였다. 공통성 분석결과 다음과 같은 특징을 발견하였다. 첫째, 제1학습주제(기초 학습기술과 인성 영역)가 속한 정보사회, 도서관, 정보기술, 협력기술 영역은 교과 교육과정과 연계성이 높게 나타났다. 둘째, 정보활용교육의 핵심 영역인 제2학습주제(정보문제 해결능력 영역)는 교과 연계성이 낮게 나타났다.

Abstract

This study sought to develop an integrated information literacy curriculum that would have a strong relationship with curricula through the standard themes abstracted from theme network structures, scan and cluster analyses of the information literacy curricula. In addition, this study also attempted to develop a teaching-learning model for the developed integrated information literacy curriculum. This study utilized the themes of information literacy instruction that have interdisciplinary characteristics as analysis criteria in analyzing the commonality of information literacy instruction and the subject curricula. The following characteristics were found from the analyzing the areas of commonality. Foremost, the first themes(the fields of basic learning skills and nature) which belongs to the fields of information society, library, information technology, collaborative skills were found to have many relationships with the subject curricula. Next, the second themes(the field of information problem solving capabilities) which is the core field of information literacy instruction showed a weak relationship with the subject curricula.

초록보기
초록

본 연구의 목적은 빅데이터 연구 논문의 주제 분야 간의 연관관계를 분석하는데 있다. 동시 인용 관계를 적용하여 분석 대상의 주제 분야를 추출하였으며, R 프로그램의 Apriori 알고리즘을 이용하여 연관관계의 규칙을 분석하고, arulesViz 패키지를 사용하여 시각화하였다. 연구 결과 22개 주제 분야가 추출되었는데, 이들 주제 분야는 3가지 군집으로 구분되었다. 주제 분야의 연관관계 유형을 분석한 결과, 연관관계의 복잡성에 따라 ‘전문형’, ‘일반형’, ‘확대형’으로 구분되었다. 전문형에는 문헌정보학, 신문방송학 등이 포함되었고, 일반형에는 정치외교학, 무역학, 관광학 등이 포함되었고, 확대형에는 기타인문학, 사회과학일반, 관광학일반 등이 포함되었다. 이 연관관계는 빅데이터 연구자가 한 주제 분야를 인용할 때 관계가 있는 다른 주제 분야를 인용하는 경향을 보여주는 것으로, 도서관에서 학술정보서비스를 위해 연관관계를 활용한 서비스를 고려해야 할 필요가 있다.

Abstract

The purpose of this study is to analyze the association among the subject areas of big data research papers. The subject group of the units of analysis was extracted by applying co-citation networks, and the rules of association were analyzed using Apriori algorithm of R program, and visualized using the arulesViz package of R program. As a result of the study, 22 subject areas were extracted and these subjects were divided into three clusters. As a result of analyzing the association type of the subject, it was classified into ‘professional type’, ‘general type’, ‘expanded type’ depending on the complexity of association. The professional type included library and information science and journalism. The general type included politics & diplomacy, trade, and tourism. The expanded types included other humanities, general social sciences, and general tourism. This association networks show a tendency to cite other subject areas that are relevant when citing a subject field, and the library should consider services that use the association for academic information services.

정보관리학회지