바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 연구데이터, 검색결과: 17
1
김성욱(전북대학교 문헌정보학과 석사과정) ; 김선태(전북대학교 문헌정보학과) 2020, Vol.37, No.3, pp.77-106 https://doi.org/10.3743/KOSIM.2020.37.3.077
초록보기
초록

본 연구에서는 학제 간 연구가 가장 활발하고 응용가능성이 가장 높은 응집물질물리분야의 연구데이터를 체계적으로 관리하기 위한 개선방안을 제안하였다. 이를 위해 연구데이터 관리 도구인 Data Asset Framework (DAF)와 데이터 공유 및 재사용을 위한 FAIR원칙을 바탕으로 설문 내용을 구성하여 14명의 연구자를 대상으로 응집물질물리분야의 연구데이터 관리 현황을 수집하였다. 수집된 데이터는 설문에 응답한 연구자의 특성 및 기초정보, 데이터 보존 및 관리, 데이터 공유 및 접근에 관한 데이터로 구성되었다. 수집된 설문결과를 분석하여 응집물질물리분야의 연구데이터 특징과 데이터 수집과 생산, 데이터 보존과 관리, 데이터 공유 및 접근에 대한 9가지 문제점을 도출하였으며, 각 측면에서 도출된 문제점에 대한 개선방안을 제언하였다.

Abstract

In this study, we proposed a method to systematically manage research data in the field of condensed matter physics, which is the most active and interdisciplinary field. In the course of the research, a questionnaire was conducted for researchers in the field of condensed matter physics. The questionnaire was constructed based on the research data management tool Data Asset Framework (DAF) and the FAIR principle for data sharing and reuse. The current status of research data management in the field of aggregated material physics was collected from 14 researchers. The collected data consisted of data on the characteristics and basic information of researchers who answered the questionnaire, data preservation and management, and data sharing and access. By analyzing the collected questionnaire results, nine problems were drawn about the characteristics of research data in the field of aggregate material physics, data collection and production, data preservation and management, data sharing and access. In this study, suggestions were made to improve the problems derived from each aspect.

초록보기
초록

2016년 1월 1일부터 공공도서관 빅데이터 플랫폼이 서비스되기 시작하여 도서관 빅데이터가 공공도서관 업무 개선에 활용되고 있다. 본 논문은 도서관 빅데이터 플랫폼 활용사례들을 살펴보고 도서관 빅데이터 플랫폼의 활용효과를 높일 수 있는 개선방안을 도출하고자 한다. 이를 위해 먼저, 도서관 빅데이터 플랫폼을 활용한 사례들에서 활용한 빅데이터와 활용유형분석 및 도출된 서비스/시행정책을 살펴본다. 다음으로, 현재 공공도서관에서 사용하는 통합도서관리시스템(ILUS)과 도서관 빅데이터 플랫폼 각각의 자료분석 방식을 비교함으로써 도서관 빅데이터 플랫폼의 한계점과 이점을 살펴본다. 사례분석 결과, 프로그램 기획 및 수행, 장서, 수서, 기타의 유형으로 빅데이터를 활용하였고 서비스/시행정책은 이용자 맞춤형 테마서가 및 독서진흥프로그램 진행, 장서활용도 증대, 특화주제에 기반한 수서 및 대출현황 데이터 공개로 요약되었다. 비교분석결과, ILUS는 자관의 자료실현황분석에 특화되어 있으며, 빅데이터 플랫폼은 다양한 속성(연령, 성별, 지역, 대출시기 등)에 따른 선택적 분석이 가능하여 분석시간단축과 유연한 분석이 가능하다. 마지막으로 사례분석과 비교분석에서 밝혀진 특징 및 한계점을 정리하고 개선방안을 제시한다.

Abstract

Since big data platform services for the public library began January 1, 2016, libraries have used big data to improve their work performance. This paper aims to examine the use cases of library big data and attempts to draw improvement plan to improve the effectiveness of library big data. For this purpose, first, we examine big data used while utilizing the library big data platform, the usage pattern of big data and services/policies drawn by big data analysis. Next, the limitations and advantages of the library big data platform are examined by comparing the data analysis of the integrated library management system (ILUS) currently used in public libraries and data analysis through the library big data platform. As a result of case analysis, big data usage patterns were found program planning and execution, collection, collection, and other types, and services/policies were summarized as customizing bookshelf themes for the book curation and reading promotion program, increasing collection utilization, and building a collection based on special topics. and disclosure of loan status data. As a result of the comparative analysis, ILUS is specialized in statistical analysis of library collection unit, and the big data platform enables selective and flexible analysis according to various attributes (age, gender, region, time of loan, etc.) reducing analysis time. Finally, the limitations revealed in case analysis and comparative analysis are summarized and suggestions for improvement are presented.

3
김나연(이화여자대학교 일반대학원 문헌정보학과 석사) ; 정은경(이화여자대학교 문헌정보학과 교수) 2020, Vol.37, No.4, pp.1-26 https://doi.org/10.3743/KOSIM.2020.37.4.001
초록보기
초록

오늘날 점차 데이터 집약적으로 변모하는 학문 환경 속에서 데이터는 연구부산물이 아닌 연구성과물로써 학술 커뮤니케이션의 기반으로 자리 잡아가고 있다. 그러나 데이터 공급의 확대나 접근가능성의 확보만으로는 실제적인 데이터 재이용을 담보하는 데 한계가 있다. 이를 극복하기 위해서는 학술연구자의 데이터 재이용 행위와 데이터요구를 심층적으로 파악할 필요성이 있다. 따라서 본 연구는 연구자의 주요 데이터 재이용 행위와 데이터요구를 규명하고자 하였다. 이를 위해 한국사회과학자료원(KOSSDA)의 최근 3개년 데이터 재이용문헌 중 KCI 등재 논문의 저자를 연구대상으로 선정하고, 인터뷰를 수락한 연구자 12명과의 심층면담을 수행하였다. 심층면담 분석결과, 데이터를 재이용하는 요인은 개인적, 경제적, 기술적, 사회적 측면 모두에서 나타났으며, 데이터 재이용 목적에 따라 데이터 그 자체를 이용하거나 데이터가 지닌 맥락정보를 활용하였다. 웹 기반의 정보원으로부터 데이터를 주로 습득하였으나 비공식적인 커뮤니케이션을 통해 파악하는 경우도 있었다. 한편 데이터 재이용 시에 발생하는 학술연구자의 데이터요구를 살펴보면 생산 단위는 기관을, 언어는 영어를, 국가로는 미국을 선호하였다. 또한 조사원 기입식 대인면접 조사 방식으로 수집된 양적 데이터를 우선시하였다. 메타데이터와 식별정보를 충분히 포함한 원자료 수준의 데이터를 긍정적으로 인식하였으나, 접근 및 이용이 통제된 데이터는 데이터가 지닌 가치에 대한 확신을 갖기 어려워 부정적으로 받아들였다. 그러나 데이터의 규모나 최신성과 관련된 선호는 뚜렷하게 나타나지 않았는데 이는 선택 가능한 유사 데이터가 부재하였기 때문이었다.

Abstract

In today’s increasingly data-intensive academic environment, data is becoming the foundation of academic communication as a research outcome rather than a research by-product. However, there is a limit to guaranteeing actual data reuse only by expanding the data supply or securing accessibility. In order to overcome this, it is necessary to understand the data reuse behavior and data needs in-depth. Therefore, this study attempted to identify the major data reuse behavior and data needs among researchers. To this end, the authors of KCI papers among the data reuse documents of the Korea Social Science Data Archive (KOSSDA) for the past 3 years were targeted. An in-depth interview was conducted with 12 researchers who accepted the interview. As a result, factors considered when reusing data were personal, economic, technical, and social aspects, and it was found that the data itself was used or contextual information of the data was used depending on the purpose of data reuse. The path to acquiring data is a web-based source of information, and a path through informal communication can also be found. In terms of the data needs, it was found that they prefer English, the United States, and institutional producers. Also they have a clear preference for quantitative data from an interviewer-filled interpersonal interview survey method, rich metadata along with raw data, and data that contains identification information. However, due to the lack of confidence in the value, it is negative for the use of data with controlled access and use, and it is difficult to confirm a clear preference because there is no similar data available for selection in terms of size and freshness.

4
한희정(전북대학교 문화융복합아카이빙 연구소 전임연구원) ; 윤성호(전북대학교 일반대학원 기록관리학과 석사과정) ; 오효정(전북대학교 문헌정보학과 부교수) ; 양동민(전북대학교 일반대학원 기록관리학과 부교수) 2020, Vol.37, No.2, pp.251-284 https://doi.org/10.3743/KOSIM.2020.37.2.251
초록보기
초록

정보의 활용이 국가 경쟁력의 핵심으로 부각되면서 우리 정부를 포함한 주요 선진국들은 데이터를 중요하게 인식하고 있으며, 이에 따라 장기보존 기술 연구 및 표준 제정 등을 추진하여 데이터의 체계적인 관리 및 보존을 위한 노력을 지속적으로 기울이고 있다. 그러나 현재 국내의 경우 다양한 유형의 데이터들에 대해 법령에는 기록관리 대상으로 명시하고 있지만, 이를 수집, 관리 및 보존하기 위한 구체적인 방법은 표준전자문서 이외에는 없는 상황이다. 특히, 행정정보시스템에서 생산되는 엄청난 규모의 데이터세트에 대한 관리 및 보존은 무엇보다 강하게 요구되어 왔으나 데이터세트에 대한 지침이 제대로 제공되고 있지 않고 있다. 보존포맷 선정체계가 마련되어야 시스템 보완 및 구축이 가능하기 때문에 우선적으로 데이터세트 특성을 고려한 보존포맷 선정 기준 체계가 보다 구체화 되어야 하며, 선정기준에 따라 도출된 데이터세트 보존포맷의 변환에 대한 실증적인 검증 작업이 필요하다. 이에 본 연구는 데이터세트의 특성을 고려한 보존포맷 선정 기준에 대한 평가체계를 도출하고, 보존포맷에 대한 실증적 검증을 통해 장기보존할 수 있는 방안을 제시하고자 한다.

Abstract

As the use of information has emerged as the core of national competitiveness, major developed countries and the Korean government have realized the importance of data. They have pursued technical research and standard establishment for long-term preservation and continuously strived for systematic management and preservation of data. However, although various types of data are specified for the purpose of record management in the law, there is no specific method on how to collect, manage and preserve them, except standard electronic documents. In particular, management and preservation of huge datasets from the administrative information system have been strongly demanded above all. Any guidelines for datasets do not have been properly provided. After the framework for selecting preservation format must be prepared, the system can be supplemented and built. The framework considering the characteristics of the dataset should be specified more concretely, and empirical verification of the conversion and restoration for the dataset preservation format derived according to the selection criteria is necessary. Therefore, this study intends to propose a method for long-term preservation through empirical verification of the preservation format after deriving an evaluation the framework for the preservation format selection criteria considering the characteristics of the dataset.

5
한상우(광주대학교 문헌정보학과 조교수) 2020, Vol.37, No.1, pp.179-195 https://doi.org/10.3743/KOSIM.2020.37.1.179
초록보기
초록

데이터의 중요성이 높아짐에 따라 최근 데이터 리터러시가 중요한 개념으로 등장하였다. 본 연구는 인문학 기반 데이터 리터러시 모형을 설계하는 것을 목적으로 한다. 이를 위해 데이터 리터러시 관련 연구를 분석하여 도출한 데이터 리터러시 세부 역량과 디지털 인문학 교육 프로그램의 주요 내용을 분석하여 인문학의 주요한 교육 내용을 결합하여 데이터 리터러시 모형을 설계하였다. 본 연구의 결과인 데이터 리터러시 모형을 적용하여 대학에서 데이터 리터러시 교과 운영시 적용이 가능할 것이며, 향후 데이터 리터러시의 효과성을 평가하는 후속연구를 제안하고자 한다.

Abstract

As data becomes more important, data literacy has recently emerged as an significant term. The purpose of this study is to design data literacy model based on digital humanities. To attain this end, data literacy model was designed by combining the main contents derived from the digital humanities education program with specific capabilities extracted from research related to data literacy. By applying the data literacy model, which is the result of this study, it will be applicable to the data literacy courses in universities, and I would like to propose a follow-up study to evaluate the effectiveness of data literacy in the future.

초록보기
초록

도서관 LOD가 확산되지 못하는 현시점에서, 본 연구의 목적은 국내 도서관 LOD의 발행과 구축에 대한 현황을 살펴보고, 그 개선방안을 모색하기 위한 것이다. 사용한 연구방법은 문헌연구, 사례조사, 전문가 면담이다. 본 연구에서 제시된 개선방안은 첫째 도서관은 LOD 구축 대상의 중복을 피하고, 유일하고 특화된 자료를 구축할 필요가 있다. 둘째 도서관은 이용자 요구를 반영한 LOD 서비스를 개발하고, 편리한 LOD 인터페이스를 구현할 필요가 있다. 셋째 도서관은 데이터의 식별체계를 마련하고 전거파일을 구축할 필요가 있다. 넷째 도서관은 사서나 이용자에게 데이터 개방과 연계의 필요성을 인식시키고, 이를 위한 교육과 홍보의 기회를 제공할 필요가 있다. 다섯째 도서관은 통합 검색을 위해 LOD를 활용하고, 도서관 LOD를 검색할 수 있는 통합 플랫폼을 마련할 필요가 있다. 여섯째 도서관은 LOD 발행과 활용을 위한 협력을 강화하고, 실무협의체를 구성할 필요가 있다. 일곱째 정부는 LOD 추진에 대한 지속적인 의지로 강력한 정책을 추진해야 하며, 계속해서 예산 지원을 할 필요가 있다.

Abstract

The purpose of this study is to find the cause and solution of the situation where library LOD does not spread after the introduction of library LOD. Research methods include literature research, case studies, and expert interviews. The improvement plan presented in this study is that first, the library needs to avoid the redundancy of the LOD construction target and build the only and specialized data. Second, libraries need to develop LOD services that reflect user needs and implement convenient LOD interfaces. Third, libraries need to establish identification system of data and build a authority file. Fourth, libraries need to recognize the necessity of data opening and linking to librarians and users, and provide opportunities for education and publicity. Fifth, it is necessary to use LOD for integrated search and to establish an integrated platform for search of library LOD. Sixth, libraries need to strengthen cooperation for LOD issuance and utilization, and form a working-level consultative body. Seventh, the government should pursue strong policies with a continuous commitment to LOD promotion and need to continue to provide budget support.

7
이정연(이화여자대학교 이화사회과학원) ; 전수현(우아한형제들 데이터애널리스트) 2020, Vol.37, No.2, pp.171-195 https://doi.org/10.3743/KOSIM.2020.37.2.171
초록보기
초록

본 연구는 대표적인 온라인 협업커뮤니티인 한국 위키피디아의 초기 2002년부터 2019년까지의 편집로그 빅데이터를 해체하여 공동협업과정을 시계열적으로 분석하였다. 공개된 오픈데이터의 표준화된 XML 문서편집 기록을 활용해 Phython과 R을 이용하여 분석 요소를 추출하여 이를 활용하였다. 연구 분석 결과 한국 위키피디아 편집자의 참여 방법, 데이터 내용의 특징, 문서 생성의 추이 등을 설명할 수 있었다. 소수 편집자들의 적극적 활동과 대다수 편집자들의 느슨한 참여도 밝혀졌으며, 온라인에서도 나타나는 사회 문화적 특징이 한국 위키피디아에서도 나타났다. 집단지성을 지속화시키기 위해서는 새롭고 다양한 외부자원이 필수인데 신규 진입자들이 공동편집 커뮤니티에 안착하기 위한 다각적인 고려가 필요하며, 관리자 그룹의 고착화를 탈피하여 순환구조를 통한 개방성이 필요함을 제언하였다.

Abstract

This study analyzed the collaborative process in time series by dismantling the edit log big data of Wikipedia Korea, a representative online collaboration community, from early 2002 to 2019. Analysis elements were extracted from the document edit records, formatted in standardized XML, and analyzed using Python and R. The ways of editors’ contribution, the characteristics of data contents, and the trend of document creation were explained by the analysis. An active contribution of a small set of editors and a loose participation of the majority were revealed. In addition, sociocultural characteristics that appear in online communities were also found in Wikipedia Korea. A new, diverse set of external resources is necessary to sustain the collective intelligence. An effort to settle new editors into the wikipedia community and an openness through circulation structure to avoid the exclusiveness of the management group are suggested.

초록보기
초록

공공데이터의 개방과 제공의 활성화와 함께, 공공도서관이 업무 중에 생산한 서지 데이터와 대출 이력과 같은 데이터가 도서관 공공데이터로 제공되고 있다. 본 논문은 도서관 공공데이터의 품질을 진단하고, 그 결과를 바탕으로 도서관 공공데이터의 품질을 높일 개선방안을 제안하고자 한다. 먼저, 문헌정보학 영역에서 공공데이터에 관해 이루어진 연구를 개괄한다. 그다음으로, 도서관 공공데이터 개방 플랫폼인 도서관 정보나루의 오픈 API를 통해 확보한 도서관 공공데이터의 완전성과 정확성을 진단한다. 마지막으로, 데이터 품질 진단 결과에 바탕을 개선방안을 도출한다. 완전성을 진단한 결과, 도서의 식별과 검색을 위 필수적인 서지 요소에서 다수의 공백이 확인되었다. 정확성을 진단한 결과, 값의 유형, 값의 범위, 제한조건을 따르지 않는 부정확한 서지 요소가 확인되었다. 본 연구는 데이터 품질 진단 분석 결과를 바탕으로, 도서관 정보나루의 데이터 수집 절차 개선, 데이터별 스키마 구축, 데이터 수집과 데이터 처리에 관한 안내 제공, 원자료 공개를 제언하였다.

Abstract

With the popularization of open government data, Library-related open government data is also open and utilized to the public. The purpose of this paper is to diagnose the quality of library-related open government data and propose improvement measures to enhance the quality based on the diagnosis result. As a result of diagnosing the completeness of the data, a number of blanks are identified in the bibliographic elements essential for identifying and searching a book. As a result of diagnosing the accuracy of the data, the bibliographic elements that are not compliant with the data schema have been identified. Based on the result of data quality diagnosis, this study suggested improving the data collection procedure, establishing data set schema, providing details on data collection and data processing, and publishing raw data.

9
정은경(이화여자대학교 사회과학대학 문헌정보학과 교수) 2020, Vol.37, No.1, pp.153-177 https://doi.org/10.3743/KOSIM.2020.37.1.153
초록보기
초록

오픈과학의 흐름에서 데이터 공유와 재이용은 중요한 연구자의 활동이 되어가고 있다. 데이터 공유와 재이용에 관한 여러 논의 중에서 데이터학술지와 데이터논문의 발간이 가시적인 결과를 보여주고 있다. 데이터학술지는 여러 학문 분야에서 발간되고 있으며, 논문의 수도 점차 증가하고 있다. 데이터논문은 데이터 자체와는 다르게 인용을 주고 받는 활동이 포함되어, 따라서 이들이 형성하는 고유한 지적구조가 생겨나게 된다. 본 연구는 데이터학술지와 데이터논문이 학술커뮤니티에서 구성하는 지적구조를 규명하고자 Web of Science에 색인된 14종의 데이터학술지와 6,086건의 데이터논문과 인용된 참고문헌 84,908건을 분석하였다. 저자사항과 함께 동시인용분석과 서지결합분석을 네트워크로 시각화하여 데이터논문이 형성한 세부 주제 분야를 규명하였다. 분석결과, 저자, 저자소속기관, 국가를 추출하여 출현빈도를 살펴보면, 전통적인 학술지 논문과 다른 양상을 보인다. 이러한 결과는 데이터의 생산이 용이한 기관과 국가에 주로 데이터논문을 출간하기 때문이라고 해석될 수 있다. 동시인용분석와 서지결합분석 모두 분석도구, 데이터베이스, 게놈구성 등이 주된 세부 주제 영역으로 나타났다. 동시인용분석결과는 9개의 군집으로 형성되었는데, 특정 주제 분야로 나타난 영역은 수질과 기후 등의 분야이다. 서지결합분석은 총 27개의 컴포넌트로 구성되었는데, 수질, 기후 이 외에도 해양, 대기 등의 세부 주제 영역이 파악되었다. 특기할만한 사항으로는 사회과학 분야의 주제 영역도 나타났다는 점이다.

Abstract

In the context of open science, data sharing and reuse are becoming important researchers’ activities. Among the discussions about data sharing and reuse, data journals and data papers shows visible results. Data journals are published in many academic fields, and the number of papers is increasing. Unlike the data itself, data papers contain activities that cite and receive citations, thus creating their own intellectual structures. This study analyzed 14 data journals indexed by Web of Science, 6,086 data papers and 84,908 cited references to examine the intellectual structure of data journals and data papers in academic community. Along with the author’s details, the co-citation analysis and bibliographic coupling analysis were visualized in network to identify the detailed subject areas. The results of the analysis show that the frequent authors, affiliated institutions, and countries are different from that of traditional journal papers. These results can be interpreted as mainly because the authors who can easily produce data publish data papers. In both co-citation and bibliographic analysis, analytical tools, databases, and genome composition were the main subtopic areas. The co-citation analysis resulted in nine clusters, with specific subject areas being water quality and climate. The bibliographic analysis consisted of a total of 27 components, and detailed subject areas such as ocean and atmosphere were identified in addition to water quality and climate. Notably, the subject areas of the social sciences have also emerged.

10
황성욱(전북대학교 기록관리학과) ; 정예용(전북대학교 기록관리학과) ; 김수정(전북대학교 문헌정보학과) ; 오효정(전북대학교 문헌정보학과) 2020, Vol.37, No.2, pp.23-45 https://doi.org/10.3743/KOSIM.2020.37.2.023
초록보기
초록

최근 ‘코로나19’라는 초유의 재난 사태를 맞이하여 대한민국 정부의 투명한 정보 공개를 통한 적극적 대응에 전 세계가 주목하고 있다. 이렇듯 공공데이터 개방은 특정 정보에 대한 국민의 인지도와 접근성을 높임으로써 다양한 사회적, 경제적 가치를 상승시키는 데 필수적이다. 본 연구는 정부차원에서 주도적으로 수집하고 공개하고 있는 공공데이터포털의 이용 활성화를 위해 각국에서 운영하고 있는 SNS 현황과 그에 따른 개선방안을 제안하고자 한다. 이를 위해 국내․외 공공데이터포털 SNS 운용현황을 살펴보고, 그 중 선진 사례 3국(인도, 미국, 한국)의 서비스를 선정하여 계량 분석, 피드백 분석, 시계열 분석, 정보유형 분석을 실시하였다. 분석결과를 통해 정보유형 및 이용요구를 파악하고 시사점을 도출하여 공공데이터 이용 활성화를 위한 구체적인 개선방안을 제언하였다.

Abstract

The world is paying attention to the South Korean government’s aggressive COVID-19 response, key of which is transparency and openness in sharing information. Opening up government information is essential to enhancing its social and economic value through increased awareness and accessibility. The purpose of this study is to investigate the current status of SNS operated by national open data portals in which government-collected and -disclosed data is available and to suggest improvements for the use of open data portals. To do this, the study compared 3 national open data portals, each from India, U.S.A, and Korea, by performing quantitative analysis, user feedback analysis, time-series analysis, and information type analysis. Based on the identified information types and user needs, the study suggests concrete ways to facilitate the use of open data portals.

정보관리학회지