바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 연관관계 분석, 검색결과: 12
초록보기
초록

본 연구의 목적은 빅데이터 연구 논문의 주제 분야 간의 연관관계를 분석하는데 있다. 동시 인용 관계를 적용하여 분석 대상의 주제 분야를 추출하였으며, R 프로그램의 Apriori 알고리즘을 이용하여 연관관계의 규칙을 분석하고, arulesViz 패키지를 사용하여 시각화하였다. 연구 결과 22개 주제 분야가 추출되었는데, 이들 주제 분야는 3가지 군집으로 구분되었다. 주제 분야의 연관관계 유형을 분석한 결과, 연관관계의 복잡성에 따라 ‘전문형’, ‘일반형’, ‘확대형’으로 구분되었다. 전문형에는 문헌정보학, 신문방송학 등이 포함되었고, 일반형에는 정치외교학, 무역학, 관광학 등이 포함되었고, 확대형에는 기타인문학, 사회과학일반, 관광학일반 등이 포함되었다. 이 연관관계는 빅데이터 연구자가 한 주제 분야를 인용할 때 관계가 있는 다른 주제 분야를 인용하는 경향을 보여주는 것으로, 도서관에서 학술정보서비스를 위해 연관관계를 활용한 서비스를 고려해야 할 필요가 있다.

Abstract

The purpose of this study is to analyze the association among the subject areas of big data research papers. The subject group of the units of analysis was extracted by applying co-citation networks, and the rules of association were analyzed using Apriori algorithm of R program, and visualized using the arulesViz package of R program. As a result of the study, 22 subject areas were extracted and these subjects were divided into three clusters. As a result of analyzing the association type of the subject, it was classified into ‘professional type’, ‘general type’, ‘expanded type’ depending on the complexity of association. The professional type included library and information science and journalism. The general type included politics & diplomacy, trade, and tourism. The expanded types included other humanities, general social sciences, and general tourism. This association networks show a tendency to cite other subject areas that are relevant when citing a subject field, and the library should consider services that use the association for academic information services.

초록보기
초록

여가를 위해 독서를 하는 독자는 특정 작가를 선호하는 경우가 많은데 독서분야를 확장할 때에도 자신이 선호하는 작가와 연관된 작가나 장르로 독서분야를 확장하는 성향이 있다. 이 연구에서는 중심작가로 에드거 앨런 포를 선정한 후 독자들이 에드거 앨런 포와 연관하여 다른 독자에게 추천하는 작가와 작품정보를 기반으로 작가 이미지를 분석하였다. 에드거 앨런 포와 동시출현한 작가와 작품의 빈도수를 분석하고 추천작가간, 작품간 관계를 네트워크 기법으로 분석하였다. 분석결과 에드거 앨런 포의 장르적 이미지와 연관된 작가군, 작가들 간의 관계, 연관 도서가 파악되었다, 이 연구에서 제시한 특정 작가의 이미지, 연관 작가 및 작품 정보를 도출하는 방안은 특정 작가를 중심으로 도서관 독서 프로그램이나 문화 프로그램, 북 큐레이션을 하게 될 경우 활용할 수 있는 도구가 될 것이다.

Abstract

Many readers tend to read books of a specific author and to expand their reading areas according to the author. This study chose Edgar Allan Poe and analyzed the image of the author using co-recommended authors and books by other readers. The frequencies of co-occurred authors and books were investigated and the relations of authors and books were analyzed with network analysis methods. As a result, genre images of Poe, related authors, and related books are discovered. This study also suggested the methods to identify the image of a author, related author groups, and related books for libraries’ reading programs and book curation.

초록보기
초록

본 연구에서는 주요 검색 포털들의 검색어 추천 서비스를 분석, 평가하였다. 이 연구에서는 네이버와 구글 코리아를 대상으로 추천되는 연관 검색어의 적합도 및 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 또한 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하고, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교하였다. 연구 결과, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 또한 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 본 연구의 결과는 향후 포털들의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다.

Abstract

This study aims to analyze and evaluate term suggestion services of major search portals, Naver and Google Korea. In particular, this study evaluated relevance and currency of related search terms provided, and analyzed characteristics such as number and distribution of terms, and queries that did not produce terms. This study also analyzed types of terms in terms of the relationship between queries and terms, and investigated types and characteristics of harmful terms and terms with grammatical errors. Finally, Korean queries and English queries, and popular queries and academic queries were compared in terms of the amount and relevance of search terms provided. The results of this study show that the relevance and currency of Naver's related search terms are somewhat higher than those of Google. Both Naver and Google tend to add terms to or delete terms from original queries, and provide identical search terms or synonym terms rather than providing entirely new search terms. The results of this study can be implemented to the portal's effective development of term suggestion services.

초록보기
초록

이 연구에서는 공개된 가중 네트워크 분석용 소프트웨어인 Opsahl의 tnet과 이재윤의 WNET에서 지원하는 가중 네트워크 중심성 지수를 비교 분석해보았다. tnet은 가중 연결정도중심성, 가중 근접중심성, 가중 매개중심성을 지원하고, WNET은 최근접이웃중심성, 평균연관성, 평균프로파일연관성, 삼각매개중심성을 지원한다. 가상 데이터를 대상으로 한 분석에서 tnet의 중심성 지수는 링크 가중치의 선형 변화에 민감한 반면 WNET의 중심성 지수는 선형 변화에 영향을 받지 않았다. 실제 네트워크 6종을 대상으로 가중 네트워크 중심성을 측정하고 결과를 비교하여 두 소프트웨어의 가중 네트워크 중심성 지수들의 특징을 파악하고 중심성 지수 간 관계를 살펴보았다.

Abstract

This study compared and analyzed weighted network centrality measures supported by Opsahl’s tnet and Lee’s WNET, which are free softwares for weighted network analysis. Three node centrality measures including weighted degree, weighted closeness, and weighted betweenness are supported by tnet, and four node centrality measures including nearest neighbor centrality, mean association, mean profile association, triangle betweenness centrality are supported by WNET. An experimental analysis carried out on artificial network data showed tnet’s high sensitiveness on linear transformations of link weights, however, WNET’s centrality measures were insensitive to linear transformations. Seven centrality measures from both tools, tnet and WNET, were calculated on six real network datasets. The results showed the characteristics of weighted network centrality measures of tnet and WNET, and the relationships between them were also discussed.

초록보기
초록

본 연구는 2014년부터 2018년까지 최근 5년간 미국에서 발표된 도서관학 및 정보과학 분야 학위논문의 연구 동향을 파악하기 위해 PQDT Global 데이터베이스에 수록된 1,016편의 박사학위 논문을 수집하여 각 논문의 관련 학문 분야를 나타내는 분야명들을 추출하고 네트워크 분석을 통해 분야명 간의 관계와 네트워크 전반에 걸쳐 다른 분야들과 관계가 있는 전역중심성이 높은 분야명을 파악하는 것과 동시에 군집분석을 통해 연관성 높은 분야명들이 어떠한 군집을 형성하는지, 각 군집 안에서 지역중심성이 높은 분야명들은 어떤 것들인지 살펴보았다. 103개 핵심 분야명 키워드를 이용한 네트워크 분석 결과 최근 5년간 미국의 도서관학 및 정보과학 분야 박사학위 논문의 관련 학문분야로는 컴퓨터 관련 분야, 교육 관련 분야, 커뮤니케이션 관련 분야 외에도 다양한 이용자 집단에 관한 연구와 정보시스템 관련 분야 등을 포함하여 26개의 군집을 형성하는 것으로 나타났다. 26개 군집들 중 정보과학을 중심으로 하는 군집에는 컴퓨터 관련 학문 분야명들이 다수 포함되었고, 도서관학을 중심으로 하는 군집에는 대부분 교육 관련 분야명들이 포함되었으며, 그 외에도 이용자 연구와 관련하여 특정 이용자 그룹과 관련된 젠더연구 분야나 정보시스템과 관련하여 경영학, 지리학, 의공학 등 다양한 학문 분야와 연관되어 있음을 알 수 있다.

Abstract

The study examines the research trends of doctoral dissertations in Library Science and Information Science published in the U.S. for the last 5 years. Data collected from PQDT Global includes 1,016 doctoral dissertations containing “Library Science” or “Information Science” as subject headings, and keywords extracted from those dissertations were used for a network analysis, which helps identifying the intellectual structure of the dissertations. Also, the analysis using 103 subject heading keywords resulted in various centrality measures, including triangle betweenness centrality and nearest neighbor centrality, as well as 26 clusters of associated subject headings. The most frequently studied subjects include computer-related subjects, education-related subjects, and communication-related subjects, and a cluster with information science as the most central subject contains most of the computer-related keywords, while a cluster with library science as the most central subject contains many of the education-related keywords. Other related subjects include various user groups for user studies, and subjects related to information systems such as management, economics, geography, and biomedical engineering.

6
고영만(성균관대학교) ; 조수련(성균관대학교) ; 박지영(성균관대학교) 2013, Vol.30, No.4, pp.111-131 https://doi.org/10.3743/KOSIM.2013.30.4.111
초록보기
초록

본 연구에서는 ‘학술지의 피인용횟수 순위’를 적용한 tapered h-지수의 변형지표 Kor-hT를 고안하여 제안하였다. Kor-hT의 의미를 평가하기 위하여 Kor-hT 지수 값의 중복률 및 지수 값과 평가요소 사이의 연관성 변화를 다른 학술지 평가지표인 h-지수, tapered h-지수 및 IF와 비교 분석하였다. 지수 값의 중복률 분석은 지표의 변별력을 살펴보기 위한 것이며, 지수 값과 평가요소와의 상관관계 분석은 지표의 평가요소인 피인용횟수 및 논문 수가 지수 값에 각각 어떻게 반영되는지를 알아보기 위한 것이다. 분석을 위해 2008년부터 2010년까지의 한국학술지인용색인(KCI) 3개년 데이터를 사용하였다. 분석 결과 본 연구에서 제안한 Kor-hT가 비교 대상 지표에 비해 지수 값의 중복률이 가장 낮아 높은 변별력을 보였으며, 지수 값과 평가요소와의 상관관계에 있어서도 피인용횟수와 논문 수 모두에서 상관관계가 가장 높은 것으로 나타났다.

Abstract

This study describes the meaning of and the formula for Kor-hT, which is a modified index built on the tapered h-index by applying ‘the ranking according to the number of citations of journals’. This study evaluated the de-duplication rate of index values of Kor-hT and analyzed the change in the correlation between the index values and evaluation elements using the Korea Citation Index data from 2008 to 2010. Kor-hT is compared with h-index, tapered h-index, and IF. As a result, Kor-hT appeared to be superior to other indexes on de-duplication rate. It is also shown that there is a very strong positive correlation between the evaluation elements, the number of citations and the number of articles of journals, and the index values of Kor-hT.

7
고영만(성균관대학교) ; 송민선(성균관대학교 정보관리연구소) ; 김비연(성균관대학교) ; 민혜령(성균관대학교) 2013, Vol.30, No.2, pp.227-243 https://doi.org/10.3743/KOSIM.2013.30.2.227
초록보기
초록

본 연구의 목적은 저자키워드의 출현빈도와 해당 키워드가 속한 논문들의 총피인용횟수 간 상관관계 여부를 확인하고자 하는 것이다. 연구의 배경은 인문사회과학 분야 학술용어사전을 구축하는데 있어서 실제 연구에서의 활용도가 높고 다른 키워드와의 의미적 연관관계가 많은 학술용어를 추출하기 위한 방법론을 개발해 보고자 하는 것이다. 본 연구의 목적을 이루기 위해 한국연구재단 한국학술지인용색인(KCI)에 수록된 2007년에서 2011년까지의 인문학 및 사회과학 분야 학술지 논문의 저자키워드와 피인용횟수를 분석하였다. 분석 결과 저자키워드의 출현빈도와 해당 키워드가 속한 논문들의 총피인용횟수는 통계적으로 상관관계가 있으며, 저자키워드의 출현빈도가 늘어날수록 논문의 총피인용횟수도 많아지는 것으로 나타났다.

Abstract

The purpose of this study is to verify the correlation between the appearance frequency of author keyword and the number of citation in journal articles. In this study, we were trying to develop a methodology that can select the term having semantic relation with other terms and higher utilization to build a structured scientific glossary. In order to achieve this purpose, we analyzed the number of citation and the author keyword of the humanities and social science journal articles of the Korea Citation Index (KCI) from 2007 to 2011. This study found a correlation between appearance frequency of author keyword and the number of citation of the journal articles, with higher appearance frequency of author keyword of the journal articles being more cited.

초록보기
초록

이 연구에서는 프로파일링 분석과 동시출현단어 분석을 이용해 인접 학문과의 연관성을 바탕으로 한국어교육학의 정체성을 분석하고자 하였다. 먼저, 한국어교육학, 국어교육학, 국어학 학술지의 논문에서 추출한 주제어를 기반으로 저널 프로파일링 분석을 수행하였고 그 결과 한국어교육학 분야의 학술지들이 하나의 독립된 군집을 형성하는 것으로 나타났다. 그리고 학문 분야 프로파일링 분석과 동시출현단어 분석을 이용해 학문 분야 간 관계를 분석한 결과 한국어교육학이 국어학보다 국어교육학과 더 큰 유사성을 가지는 것으로 나타났다. 마지막으로, 동시출현단어 분석을 통해 세 학문 분야의 지적 구조를 비교․분석하였다. 이를 통해 한국어교육학에서만 출현한 주제들을 확인함으로써 인접학문들과의 관계 속에서 한국어교육학이 드러내는 정체성을 파악할 수 있었다.

Abstract

This study aims at establishing the identity of teaching Korean as a Foreign Language (KFL) domain by using journal profiling and co-word analysis in comparison with the relevant and adjacent domains. Firstly, by extracting and comparing topic terms, we calculate the similarity of academic journals of the three domains, KFL, teaching Korean as a Native Language (KNL), and Korean Linguistics (KL). The result shows that the journals of KFL form a distinct cluster from the others. The profiling analysis and co-word analysis are then conducted to visualize the relationship among all the three domains in order to uncover the characteristics of KFL. The findings show that KFL is more similar to KNL than to KL. Finally, the comparison of knowledge structures of these three domains based on the co-word analysis demonstrates the uniqueness of KFL as an independent domain in relation with the other relevant domains.

9
이강산다정(중앙대학교) 2015, Vol.32, No.3, pp.155-182 https://doi.org/10.3743/KOSIM.2015.32.3.155
초록보기
초록

본 논문은 현대목록법의 기초를 세운 Seymour Lubetzky의 생애 및 저술분석을 통하여 도서관 사상 및 목록법 이론을 도출하였다. 문헌조사와 역사연구방법을 적용하여 시대적인 사회적, 사상적, 문화적 배경을 조사하였다. 국내․외 단편적인 연구결과를 토대로 종합적인 연구를 지향하였으며, Lubetzky의 목록법 사상의 영향관계를 분석하였다. 그리하여 Lubetzky의 도서관 및 목록법 사상을 도출하였다. Lubetzky의 목록법 이론은 목록원칙의 설계 및 서지적 관계 정립이다. 먼저 기술목록법의 원칙은 필요성, 단순성, 통일성, 일관성, 목적성, 상호연관성의 특성을 포함해야 하며, 목록의 목적을 명시해야 한다. 서지적 관계는 지적 생산물인 저작과 구체적인 실체인 저서로 구분하는 것을 토대로 형성되었다. 또한 기본저록을 저자명 기준으로 기입하여 저작의 집중을 도모하였고, 저자명에 단체명과 무저자명을 포함시켜 저자의 개념을 확장하였다.

Abstract

This study came up a library thought and the theory of cataloging through analyzing the life and writings of Seymour Lubetzky who founded the principals of cataloging in the twentieth century. This study investigated the historical social, ideological, and cultural context, using a literature survey and the methodology of historical research. Moreover, this study aimed a comprehensive research based on the results of domestic and foreign fragmentary studies, and analyzed the effects of Lubetzky’s thought of cataloging. Thus, this study found Lubetzky’s library and cataloging thought. The theory of cataloging that analyzes the above findings is the design of cataloging rules and a bibliographical relationship establishment. First of all, the principles of descriptive cataloging should contain the necessity, simplicity, unity, consistency, finality, and the characteristics of interrelations, and clarify the purpose of cataloging. The bibliographical relationship is built on dividing a work as an intellectual product into a book as a physical substance. Moreover, a basic entry is entered on the basis of author names for planning the concentration of works, and a corporate name and an anonym are contained in the author names for extending the concept of author.

초록보기
초록

정보통신기술의 발달로 학술 정보의 양이 기하급수적으로 증가하였고 방대한 양의 텍스트 데이터를 처리하기 위한 자동화된 텍스트 처리의 필요성이 대두되었다. 생의학 문헌에서 생물학적 의미와 치료 효과 등에 대한 정보를 발견해내는 바이오 텍스트 마이닝은 문헌 내의 각 개념들 간의 유의미한 연관성을 발견하여 의학 영역에서 상당한 시간과 비용을 줄여준다. 문헌 기반 발견 연구로 새로운 생의학적 가설들이 발견되었지만 기존의 연구들은 반자동화된 기법으로 전문가의 개입이 필수적이며 원인과 결과의 한가지의 관계만을 밝히는 제한점이 있다. 따라서 본 연구에서는 중간 개념인 B를 다수준으로 확장하여 다양한 관계성을 동시출현 개체와 동사 추출을 통해 확인한다. 그래프 기반의 경로 추론을 통해 각 노드 사이의 관계성을 체계적으로 분석하여 규명할 수 있었으며 새로운 방법론적 시도를 통해 기존에 밝혀지지 않았던 새로운 가설 제시의 가능성을 기대할 수 있다.

Abstract

Due to the recent development of Information and Communication Technologies (ICT), the amount of research publications has increased exponentially. In response to this rapid growth, the demand of automated text processing methods has risen to deal with massive amount of text data. Biomedical text mining discovering hidden biological meanings and treatments from biomedical literatures becomes a pivotal methodology and it helps medical disciplines reduce the time and cost. Many researchers have conducted literature-based discovery studies to generate new hypotheses. However, existing approaches either require intensive manual process of during the procedures or a semi-automatic procedure to find and select biomedical entities. In addition, they had limitations of showing one dimension that is, the cause-and-effect relationship between two concepts. Thus, this study proposed a novel approach to discover various relationships among source and target concepts and their intermediate concepts by expanding intermediate concepts to multi-levels. This study provided distinct perspectives for literature-based discovery by not only discovering the meaningful relationship among concepts in biomedical literature through graph-based path interference but also being able to generate feasible new hypotheses.

정보관리학회지