바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 군집분석, 검색결과: 5
초록보기
초록

본 연구는 2014년부터 2018년까지 최근 5년간 미국에서 발표된 도서관학 및 정보과학 분야 학위논문의 연구 동향을 파악하기 위해 PQDT Global 데이터베이스에 수록된 1,016편의 박사학위 논문을 수집하여 각 논문의 관련 학문 분야를 나타내는 분야명들을 추출하고 네트워크 분석을 통해 분야명 간의 관계와 네트워크 전반에 걸쳐 다른 분야들과 관계가 있는 전역중심성이 높은 분야명을 파악하는 것과 동시에 군집분석을 통해 연관성 높은 분야명들이 어떠한 군집을 형성하는지, 각 군집 안에서 지역중심성이 높은 분야명들은 어떤 것들인지 살펴보았다. 103개 핵심 분야명 키워드를 이용한 네트워크 분석 결과 최근 5년간 미국의 도서관학 및 정보과학 분야 박사학위 논문의 관련 학문분야로는 컴퓨터 관련 분야, 교육 관련 분야, 커뮤니케이션 관련 분야 외에도 다양한 이용자 집단에 관한 연구와 정보시스템 관련 분야 등을 포함하여 26개의 군집을 형성하는 것으로 나타났다. 26개 군집들 중 정보과학을 중심으로 하는 군집에는 컴퓨터 관련 학문 분야명들이 다수 포함되었고, 도서관학을 중심으로 하는 군집에는 대부분 교육 관련 분야명들이 포함되었으며, 그 외에도 이용자 연구와 관련하여 특정 이용자 그룹과 관련된 젠더연구 분야나 정보시스템과 관련하여 경영학, 지리학, 의공학 등 다양한 학문 분야와 연관되어 있음을 알 수 있다.

Abstract

The study examines the research trends of doctoral dissertations in Library Science and Information Science published in the U.S. for the last 5 years. Data collected from PQDT Global includes 1,016 doctoral dissertations containing “Library Science” or “Information Science” as subject headings, and keywords extracted from those dissertations were used for a network analysis, which helps identifying the intellectual structure of the dissertations. Also, the analysis using 103 subject heading keywords resulted in various centrality measures, including triangle betweenness centrality and nearest neighbor centrality, as well as 26 clusters of associated subject headings. The most frequently studied subjects include computer-related subjects, education-related subjects, and communication-related subjects, and a cluster with information science as the most central subject contains most of the computer-related keywords, while a cluster with library science as the most central subject contains many of the education-related keywords. Other related subjects include various user groups for user studies, and subjects related to information systems such as management, economics, geography, and biomedical engineering.

초록보기
초록

Mendeley의 독자 정보는 학계 밖에서 학문의 결과물이 어떻게 소비되고 있는지 다각도로 파악하여 피인용도로는 해석할 수 없었던 미지의 세계를 예측하는데 활용될 수 있다. 본 연구는 Mendeley의 co-readership 데이터를 활용해 한국 관련 논문의 독자 국가 네트워크 분석을 수행하여 공통의 학문적 관심사를 공유하는 국가 군집을 이해하고 이들 국가가 네트워크 상에서 어떠한 영향력을 가지는지 확인하였다. 그 결과 전 분야에서 미국을 비롯한 선진국은 대체로 높은 전역중심성을 보여 한국 관련 연구에 대한 전반적인 협력과 잠재적 교류 가능성을 가지는 것으로 나타났으며, 일부 개발도상국은 높은 지역중심성을 보여 상호간 공통의 학문적 관심사로 연계되어 있는 것으로 확인되었다. 한편 의학과 사회과학 분야는 OECD 국가와 개발도상국이 분리된 독자층을 이루었으며, 공학 분야는 신흥경제개발국이 대규모 독자 군집으로 형성되는 특징을 보였다. 또한 공학은 네트워크 밀도가 상대적으로 높게 나타나 국가간 학문적 교류와 지식의 확산, 협력의 가능성이 높은 것으로 분석되었다.

Abstract

Mendeley readership data could be used to understand how research outcome be spent outside of academia in multi way. So it could be utilized to understand unknown world which citation rate could not explain still now. This study, by conducting a country network analysis using Mendeley’s co readership data about articles of Korea related research, clusters countries that share common academic interest. As a result, the US and other advanced countries in all fields showed high overall and regional centrality, indicating that they have overall cooperation and potential for exchange of Korea related studies. Some developing countries have shown high regional centrality and are linked to common academic interests. In the medical and social sciences, the OECD and developing countries have formed a separate group of readers, and the engineering sector has been characterized by emerging developing countries as a large community of readers. In addition, engineering science field has shown that network density is relatively high, so there might be high possibility of academic exchanges, knowledge dissemination and cooperation among countries.

초록보기
초록

본 연구의 목적은 빅데이터 연구 논문의 주제 분야 간의 연관관계를 분석하는데 있다. 동시 인용 관계를 적용하여 분석 대상의 주제 분야를 추출하였으며, R 프로그램의 Apriori 알고리즘을 이용하여 연관관계의 규칙을 분석하고, arulesViz 패키지를 사용하여 시각화하였다. 연구 결과 22개 주제 분야가 추출되었는데, 이들 주제 분야는 3가지 군집으로 구분되었다. 주제 분야의 연관관계 유형을 분석한 결과, 연관관계의 복잡성에 따라 ‘전문형’, ‘일반형’, ‘확대형’으로 구분되었다. 전문형에는 문헌정보학, 신문방송학 등이 포함되었고, 일반형에는 정치외교학, 무역학, 관광학 등이 포함되었고, 확대형에는 기타인문학, 사회과학일반, 관광학일반 등이 포함되었다. 이 연관관계는 빅데이터 연구자가 한 주제 분야를 인용할 때 관계가 있는 다른 주제 분야를 인용하는 경향을 보여주는 것으로, 도서관에서 학술정보서비스를 위해 연관관계를 활용한 서비스를 고려해야 할 필요가 있다.

Abstract

The purpose of this study is to analyze the association among the subject areas of big data research papers. The subject group of the units of analysis was extracted by applying co-citation networks, and the rules of association were analyzed using Apriori algorithm of R program, and visualized using the arulesViz package of R program. As a result of the study, 22 subject areas were extracted and these subjects were divided into three clusters. As a result of analyzing the association type of the subject, it was classified into ‘professional type’, ‘general type’, ‘expanded type’ depending on the complexity of association. The professional type included library and information science and journalism. The general type included politics & diplomacy, trade, and tourism. The expanded types included other humanities, general social sciences, and general tourism. This association networks show a tendency to cite other subject areas that are relevant when citing a subject field, and the library should consider services that use the association for academic information services.

4
최형욱(이화여자대학교 일반대학원 문헌정보학과) ; 최예진(이화여자대학교 일반대학원 문헌정보학과) ; 남소연(이화여자대학교 일반대학원 문헌정보학과) 2018, Vol.35, No.2, pp.89-114 https://doi.org/10.3743/KOSIM.2018.35.2.089
초록보기
초록

학문 분야의 연구 동향 변화에 대한 연구는 해당 분야의 세부 연구주제와 구조에 대한 파악뿐만 아니라 시간 흐름에 따른 변화 모습을 관찰할 수 있는 방법이다. 이에 본 연구에서는 국내 문헌정보학 분야의 연구 동향을 살펴보기 위하여 2003년부터 2017년까지 한국학술지인용색인(KCI)에 등재된 문헌정보학 분야 학술지 중 인용지수가 가장 높은 3종에 개제된 논문의 한국어 저자키워드를 대상으로 동시출현단어 분석을 수행하였다. 시계열 분석을 위해 15년의 연구 기간을 5년 단위로 누적하여 2003년~2007년, 2003년~2012년, 2003년~2017년으로 구분하였고, 기간별로 출현빈도 10회 이상의 저자키워드를 선정하여 분석하고 이를 시각화하였다. 분석 결과, 2003년~2007년 기간의 지적구조는 총 25개의 키워드로 구성된 8개의 영역이 확인되었으며, 2003년~2012년 기간의 지적구조에서는 총 76개의 키워드로 구성된 3영역 17 군집이 확인되었다. 또한, 2003년~2017년 기간의 지적구조는 총 132개의 키워드로 구성된 6영역 32군집으로 나타났다. 누적 기간별 종합 분석 결과, 한국의 문헌정보학 분야는 지난 15년간 기간별로 새로운 키워드가 포괄적으로 추가되었으며, 세부 주제 역시 세분화 되어 점차 세분화되고 확장되고 있음을 확인하였다.

Abstract

Research on changes in research trends in academic disciplines is a method that enables observation of not only the detailed research subject and structure of the field but also the state of change in the flow of time. Therefore, in this study, in order to observe the changes of research trend in library and information science field in Korea, co-word analysis was conducted with Korean author keywords from three types of journals which were listed in the Korea Citation Index(KCI) and have top citation impact factor were selected. For the time series analysis, the 15-year research period was accumulated in 5-years units, and divided into 2003~2007, 2003~2012, and 2003~2017. The keywords which limited to the frequency of appearance 10 or more, respectively, were analyzed and visualized. As a result of the analysis, during the period from 2003 to 2007, the intellectual structure composed with 25 keywords and 8 areas was confirmed, and during the period from 2003 to 2012, the structure composed by 3 areas 17 sub-areas with 76 keywords was confirmed. Also, the intellectual structure during the period from 2003 to 2017 was crowded into 6 areas 32 consisting of a total of 132 keywords. As a result of comprehensive period analysis, in the field of library and information science in Korea, over the past 15 years, new keywords have been added for each period, and detailed topics have also been subdivided and gradually segmented and expanded.

초록보기
초록

본 논문에서는 온라인 뉴스 기사에서 자동으로 추출된 키워드 집합을 활용하여 특정 시점에서의 세부 주제별 토픽을 추출하고 정형화하는 새로운 방법론을 제시한다. 이를 위해서, 우선 다량의 텍스트 집합에 존재하는 개별 단어들의 중요도를 측정할 수 있는 복수의 통계적 가중치 모델들에 대한 비교 실험을 통해 TF-IDF 모델을 선정하였고 이를 활용하여 주요 키워드 집합을 추출하였다. 또한 추출된 키워드들 간의 의미적 연관성을 효과적으로 계산하기 위해서 별도로 수집된 약 1,000,000건 규모의 뉴스 기사를 활용하여 단어 임베딩 벡터 집합을 구성하였다. 추출된 개별 키워드들은 임베딩 벡터 형태로 수치화되고 K-평균 알고리즘을 통해 클러스터링 된다. 최종적으로 도출된 각각의 키워드 군집에 대한 정성적인 심층 분석 결과, 대부분의 군집들이 레이블을 쉽게 부여할 수 있을 정도로 충분한 의미적 집중성을 가진 토픽들로 평가되었다.

Abstract

In this paper, we propose a new methodology for extracting and formalizing subjective topics at a specific time using a set of keywords extracted automatically from online news articles. To do this, we first extracted a set of keywords by applying TF-IDF methods selected by a series of comparative experiments on various statistical weighting schemes that can measure the importance of individual words in a large set of texts. In order to effectively calculate the semantic relation between extracted keywords, a set of word embedding vectors was constructed by using about 1,000,000 news articles collected separately. Individual keywords extracted were quantified in the form of numerical vectors and clustered by K-means algorithm. As a result of qualitative in-depth analysis of each keyword cluster finally obtained, we witnessed that most of the clusters were evaluated as appropriate topics with sufficient semantic concentration for us to easily assign labels to them.

정보관리학회지