바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: data science, 검색결과: 6
1
정은경(이화여자대학교 사회과학대학 문헌정보학과 교수) 2020, Vol.37, No.1, pp.153-177 https://doi.org/10.3743/KOSIM.2020.37.1.153
초록보기
초록

오픈과학의 흐름에서 데이터 공유와 재이용은 중요한 연구자의 활동이 되어가고 있다. 데이터 공유와 재이용에 관한 여러 논의 중에서 데이터학술지와 데이터논문의 발간이 가시적인 결과를 보여주고 있다. 데이터학술지는 여러 학문 분야에서 발간되고 있으며, 논문의 수도 점차 증가하고 있다. 데이터논문은 데이터 자체와는 다르게 인용을 주고 받는 활동이 포함되어, 따라서 이들이 형성하는 고유한 지적구조가 생겨나게 된다. 본 연구는 데이터학술지와 데이터논문이 학술커뮤니티에서 구성하는 지적구조를 규명하고자 Web of Science에 색인된 14종의 데이터학술지와 6,086건의 데이터논문과 인용된 참고문헌 84,908건을 분석하였다. 저자사항과 함께 동시인용분석과 서지결합분석을 네트워크로 시각화하여 데이터논문이 형성한 세부 주제 분야를 규명하였다. 분석결과, 저자, 저자소속기관, 국가를 추출하여 출현빈도를 살펴보면, 전통적인 학술지 논문과 다른 양상을 보인다. 이러한 결과는 데이터의 생산이 용이한 기관과 국가에 주로 데이터논문을 출간하기 때문이라고 해석될 수 있다. 동시인용분석와 서지결합분석 모두 분석도구, 데이터베이스, 게놈구성 등이 주된 세부 주제 영역으로 나타났다. 동시인용분석결과는 9개의 군집으로 형성되었는데, 특정 주제 분야로 나타난 영역은 수질과 기후 등의 분야이다. 서지결합분석은 총 27개의 컴포넌트로 구성되었는데, 수질, 기후 이 외에도 해양, 대기 등의 세부 주제 영역이 파악되었다. 특기할만한 사항으로는 사회과학 분야의 주제 영역도 나타났다는 점이다.

Abstract

In the context of open science, data sharing and reuse are becoming important researchers’ activities. Among the discussions about data sharing and reuse, data journals and data papers shows visible results. Data journals are published in many academic fields, and the number of papers is increasing. Unlike the data itself, data papers contain activities that cite and receive citations, thus creating their own intellectual structures. This study analyzed 14 data journals indexed by Web of Science, 6,086 data papers and 84,908 cited references to examine the intellectual structure of data journals and data papers in academic community. Along with the author’s details, the co-citation analysis and bibliographic coupling analysis were visualized in network to identify the detailed subject areas. The results of the analysis show that the frequent authors, affiliated institutions, and countries are different from that of traditional journal papers. These results can be interpreted as mainly because the authors who can easily produce data publish data papers. In both co-citation and bibliographic analysis, analytical tools, databases, and genome composition were the main subtopic areas. The co-citation analysis resulted in nine clusters, with specific subject areas being water quality and climate. The bibliographic analysis consisted of a total of 27 components, and detailed subject areas such as ocean and atmosphere were identified in addition to water quality and climate. Notably, the subject areas of the social sciences have also emerged.

2
김나연(이화여자대학교 일반대학원 문헌정보학과 석사) ; 정은경(이화여자대학교 문헌정보학과 교수) 2020, Vol.37, No.4, pp.1-26 https://doi.org/10.3743/KOSIM.2020.37.4.001
초록보기
초록

오늘날 점차 데이터 집약적으로 변모하는 학문 환경 속에서 데이터는 연구부산물이 아닌 연구성과물로써 학술 커뮤니케이션의 기반으로 자리 잡아가고 있다. 그러나 데이터 공급의 확대나 접근가능성의 확보만으로는 실제적인 데이터 재이용을 담보하는 데 한계가 있다. 이를 극복하기 위해서는 학술연구자의 데이터 재이용 행위와 데이터요구를 심층적으로 파악할 필요성이 있다. 따라서 본 연구는 연구자의 주요 데이터 재이용 행위와 데이터요구를 규명하고자 하였다. 이를 위해 한국사회과학자료원(KOSSDA)의 최근 3개년 데이터 재이용문헌 중 KCI 등재 논문의 저자를 연구대상으로 선정하고, 인터뷰를 수락한 연구자 12명과의 심층면담을 수행하였다. 심층면담 분석결과, 데이터를 재이용하는 요인은 개인적, 경제적, 기술적, 사회적 측면 모두에서 나타났으며, 데이터 재이용 목적에 따라 데이터 그 자체를 이용하거나 데이터가 지닌 맥락정보를 활용하였다. 웹 기반의 정보원으로부터 데이터를 주로 습득하였으나 비공식적인 커뮤니케이션을 통해 파악하는 경우도 있었다. 한편 데이터 재이용 시에 발생하는 학술연구자의 데이터요구를 살펴보면 생산 단위는 기관을, 언어는 영어를, 국가로는 미국을 선호하였다. 또한 조사원 기입식 대인면접 조사 방식으로 수집된 양적 데이터를 우선시하였다. 메타데이터와 식별정보를 충분히 포함한 원자료 수준의 데이터를 긍정적으로 인식하였으나, 접근 및 이용이 통제된 데이터는 데이터가 지닌 가치에 대한 확신을 갖기 어려워 부정적으로 받아들였다. 그러나 데이터의 규모나 최신성과 관련된 선호는 뚜렷하게 나타나지 않았는데 이는 선택 가능한 유사 데이터가 부재하였기 때문이었다.

Abstract

In today’s increasingly data-intensive academic environment, data is becoming the foundation of academic communication as a research outcome rather than a research by-product. However, there is a limit to guaranteeing actual data reuse only by expanding the data supply or securing accessibility. In order to overcome this, it is necessary to understand the data reuse behavior and data needs in-depth. Therefore, this study attempted to identify the major data reuse behavior and data needs among researchers. To this end, the authors of KCI papers among the data reuse documents of the Korea Social Science Data Archive (KOSSDA) for the past 3 years were targeted. An in-depth interview was conducted with 12 researchers who accepted the interview. As a result, factors considered when reusing data were personal, economic, technical, and social aspects, and it was found that the data itself was used or contextual information of the data was used depending on the purpose of data reuse. The path to acquiring data is a web-based source of information, and a path through informal communication can also be found. In terms of the data needs, it was found that they prefer English, the United States, and institutional producers. Also they have a clear preference for quantitative data from an interviewer-filled interpersonal interview survey method, rich metadata along with raw data, and data that contains identification information. However, due to the lack of confidence in the value, it is negative for the use of data with controlled access and use, and it is difficult to confirm a clear preference because there is no similar data available for selection in terms of size and freshness.

3
정유경(연세대학교 근대한국학연구소 HK연구교수) 2020, Vol.37, No.2, pp.311-331 https://doi.org/10.3743/KOSIM.2020.37.2.311
초록보기
초록

본 연구의 목적은 디지털 인문학 분야의 국내외 주요 연구의 동향을 살펴보고 비교 분석하는 데 있다. 기존의 디지털 인문학 동향에 관한 연구들은 해외의 주요 연구사례와 국가정책, 발전 방향 등을 검토하는 연구들로, 디지틸 인문학 분야의 세부 연구주제 및 하위 분야를 파악하는 것과는 거리가 있었다. 본 연구에서는 국내외 학술 문헌의 계량서지적 분석을 통해 디지털 인문학 분야의 지적 구조를 살펴보고자 한다. 이를 위해 Web of Science와 RISS로부터 2020년 3월까지 출판된 디지털 인문학 관련 국내외 학술 문헌을 수집하여 분석에 사용하였다. 이 자료들을 대상으로 구조적 토픽모델을 적용하여 세부 주제들을 살펴보았으며, 이 주제들의 시계열적 추이를 파악하였다. 분석결과, 국내외 공통적으로 인문학 기반의 융합 연구들이 수행되었으며, 주로 사료의 디지털화가 주된 연구의 관심사였다. 국내는 문화콘텐츠와 스토리텔링 관련된 연구주제가 두드러지게 나타났으며, 해외는 디지털화된 자료의 제공 측면에서 문헌정보학 관련 주제들이 주목을 받는 것으로 나타났다. 이를 통해 국내의 디지털 인문학 분야의 연구 공백을 파악하고 연구주제 확장이 가능한 영역들을 제안하였다.

Abstract

The purpose of this study is investigate the research trend on digital humanities. Previous studies focused on analyzing representative cases and national policies, not overall research trends in the digital humanities field. To this problem, this study intends to identify the intellectual structure of the digital humanities by adopting bibliometric approach. In this study, 1,765 articles retrieved from Web of Science and 514 records from RISS were analyzed to investigate research trends. Structural topic models were applied to examine research topics and to grasp the time-series trend. The results show that humanities-based convergence studies and digitization were main research interests in both side. In Korea, research topics related to cultural contents and storytelling were prominent, while in terms of providing digitized data, library and information science field was one of the important research topic abroad.

4
나경식(건국대학교 문헌정보학과) ; 정용선(동신대학교 한의과대학 간호학과) 2020, Vol.37, No.3, pp.177-202 https://doi.org/10.3743/KOSIM.2020.37.3.177
초록보기
초록

In this study the author examines the health information seeking behavior of older adults from the perspective of cognitive load. Using a qualitative method, based on ground theory, data were collected using in-depth interviews. Twenty-eight participants were participating older adults living in G community city, South Korea who experienced seeking health information. Interview transcripts were analyzed using a qualitative thematic coding framework. Three themes describing older adults’ health information seeking behaviors were focused: intrinsic, extraneous, and germane cognitive load. The findings are geared towards the context of older adults’ information seeking to support an understanding of successful information seeking behaviors in this population and to contribute to their health and well-being. The intent is to present information on current research in the field of Library and Information Science and to demonstrate how a cognitive load approach can be used to address the problems of older adults’ health information seeking behaviors.

Abstract

In this study the author examines the health information seeking behavior of older adults from the perspective of cognitive load. Using a qualitative method, based on ground theory, data were collected using in-depth interviews. Twenty-eight participants were participating older adults living in G community city, South Korea who experienced seeking health information. Interview transcripts were analyzed using a qualitative thematic coding framework. Three themes describing older adults’ health information seeking behaviors were focused: intrinsic, extraneous, and germane cognitive load. The findings are geared towards the context of older adults’ information seeking to support an understanding of successful information seeking behaviors in this population and to contribute to their health and well-being. The intent is to present information on current research in the field of Library and Information Science and to demonstrate how a cognitive load approach can be used to address the problems of older adults’ health information seeking behaviors.

초록보기
초록

이 연구에서는 한 대학도서관의 신착 도서 리스트 중 사회 과학 분야 6,253권에 대해 목차 정보를 이용하여 자동 분류를 적용하였다. 분류기는 kNN 알고리즘을 사용하였으며 자동 분류의 범주로 도서관에서 도서에 부여한 DDC 300대 강목을 사용하였다. 분류 자질은 도서의 서명과 목차를 사용하였으며, 목차는 인터넷 서점으로부터 Open API를 통해 획득하였다. 자동 분류 실험 결과, 목차 자질은 분류 재현율과 분류 정확률 모두를 향상시키는 좋은 자질임을 알 수 있었다. 또한 목차는 풍부한 자질로 불균형인 데이터의 과적합 문제를 완화시키는 것으로 나타났다. 법학과 교육학은 사회 과학 분야에서 특정성이 높아 서명 자질만으로도 좋은 분류 성능을 가져오는 점도 파악할 수 있었다.

Abstract

This study applied automatic classification using table of contents (TOC) text for 6,253 social science books from a newly arrived list collected by a university library. The k-nearest neighbors (kNN) algorithm was used as a classifier, and the ten divisions on the second level of the DDC’s main class 300 given to books by the library were used as classes (labels). The features used in this study were keywords extracted from titles and TOCs of the books. The TOCs were obtained through the OpenAPI from an Internet bookstore. As a result, it was found that the TOC features were good for improving both classification recall and precision. The TOC was shown to reduce the overfitting problem of imbalanced data with its rich features. Law and education have high topic specificity in the field of social sciences, so the only title features can bring good classification performance in these fields.

6
최예진(이화여자대학교 이화사회과학원 비상임연구원) ; 정연경(이화여자대학교 사회과학대학 문헌정보학과 교수) 2020, Vol.37, No.1, pp.23-49 https://doi.org/10.3743/KOSIM.2020.37.1.023
초록보기
초록

본 연구는 문헌정보학 정규교육과정에서 중점적으로 다뤄야 하는 정보조직분야의 주요 영역을 도출하고, 영역별 내용요소를 제안하였다. 이를 위해 문헌연구, 내용분석, 설문조사 및 전문가평가를 수행하였다. 이를 통해 정보조직분야를 정보조직일반, 분류, 목록, 실습이라는 4영역으로 구성하고, 총 31개의 영역별 내용요소를 제시하였다. 본 연구를 통해 영역별로 도출된 내용요소들은 정보조직분야 교과목에 대한 강의계획안이나 교수 요목을 설계할 때 도움이 될 수 있는 기초자료로 활용할 수 있다. 또한, 본 연구에서 사용한 연구방법을 적용하여 정보조직분야의 주요 영역별 내용요소를 확장할 수 있기 때문에, 정보조직분야 교육내용을 설계를 위한 기초자료로 활용될 수 있을 것이다.

Abstract

This study derives the main areas of information organization that should be covered in the formal curriculum of Library and Information Science, and suggests content elements for each area. Literature research, content analysis, survey and expert evaluation were conducted. Based upon these, information organization field was composed of four areas: information organization in general, classification, inventory, and practice, and a total of 31 content elements were presented. The content elements derived from each area through this study can be used as basic and helpful data when designing syllabus or teaching subjects in the field. In addition, it is possible to expand the content elements of each area of the information organization field through the research method used in this study. Finally, the results of this study will be used as basic materials when conducting the educational contents of information organization field.

정보관리학회지