바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 데이터과학, 검색결과: 3
1
박지원(전남대학교 대학원 기록관리학과) ; 장우권(전남대학교) 2021, Vol.38, No.4, pp.199-230 https://doi.org/10.3743/KOSIM.2021.38.4.199
초록보기
초록

이 연구는 연구데이터 재이용에 대한 연구자 및 재이용 데이터를 조사를 통해 연구데이터 재이용 영향에 대한 분석 및 활성화 방안을 제시하는데 있다. 이를 위해 연구데이터를 재이용하여 뉴 연구결과물을 산출한 경험이 있는 국내 사회과학분야 학술 연구자를 대상으로 설문배포와 회수를 토대로 178부를 분석하였다. 그 결과, 1) 대부분의 연구자들은 데이터 리포지터리, 데이터관리시스템, 연구데이터 DB와 같은 시스템을 통해 재이용 데이터를 획득하고, 실험 및 관찰을 통해 생산된 분석데이터를 주로 재이용하는 것으로 나타났다. 또한 성공적으로 연구데이터를 재이용한 연구자임에도 불구하고 연구데이터 공유에 대한 인식이 낮을뿐더러 다양한 문제에 직면하여 공유를 하지 않았다. 2) 문헌 검토와 요인 분석을 통해 도출한 10가지 요인(학문적 유용성, 연구의 효율성, 연구자의 우려사항, 데이터 취약성, 직접적 노력, 간접적 노력, 재이용 적합성, 데이터 완전성, 데이터 유용성, 사회적 조건)의 신뢰성과 타당성을 검증하였다. 3) 상관 분석결과 연구 효율성, 사회적 조건은 연구데이터 재이용 의도와 양적 상관관계가, 연구자의 우려사항, 데이터 취약성, 직접적 노력은 연구데이터 재이용 의도와 음적 상관관계가 나타났다. 회귀 분석 결과 이 요인들은 모두 연구데이터 재이용 의도에 유의미한 영향을 미치는 것으로 나타났으며, 연구의 효율성, 사회적 조건, 직접적 노력, 연구자의 우려사항, 데이터 취약성 순서로 연구데이터 재이용 의도에 영향을 미치는 것으로 나타났다. 이를 토대로 연구데이터 재이용 활성화 방안을 제시하였다.

Abstract

This study is to present an analysis and activation plan for the effect of reuse of research data through investigation of researchers and reuse data on reuse of research data. To this end, 178 copies were analyzed based on the distribution and collection of surveys targeting academic researchers in the field of social science in Korea who have experience in calculating new research results by reusing research data. As a result, 1) Most researchers acquire reuse data through systems such as data repositories, data management systems, and research data DBs, and mainly reuse analysis data produced through experiments and observations. In addition, despite being a researcher who successfully reused research data, the awareness of research data sharing was low and did not share it in the face of various problems. 2) The reliability and validity of 10 factors derived through literature review and factor analysis (academic usefulness, research efficiency, researcher concerns, data vulnerability, direct effort, indirect effort, suitability for reuse, data completeness, data usefulness, and social conditions) were verified. 3) As a result of correlation analysis, research efficiency, social conditions showed a quantitative correlation with research data reuse intention, researcher concerns, data vulnerability, and direct effort showed a negative correlation with research data reuse intention. As a result of regression analysis, all of these factors had a significant effect on the intention to reuse research data, and in the order of research efficiency, social conditions, direct efforts, researchers’ concerns, and data vulnerability. Based on this, a plan to revitalize the reuse of research data was proposed.

2
남영준(중앙대학교 문헌정보학과 교수) 2021, Vol.38, No.3, pp.311-334 https://doi.org/10.3743/KOSIM.2021.38.3.311
초록보기
초록

이 연구의 목적은 합리적인 장서관리정책 수립을 위한 이론적 근거와 계량화된 객관적 기준점 제시이다. 본 연구의 연구결과를 요약하면 다음과 같다. 스테디셀러는 정기간행물 형태의 학습서가 대부분이었다. 또한, 현대소설로서 스테디셀러는 특정 작가에 의존하는 현상을 확인할 수 있었다. 베스트셀러는 출판사와 저자의 영향을 받는 것으로 조사되었다. 특히 만화와 아동용 교재를 출판하는 출판사의 도서는 베스트셀러 선정에 상당부분 상관성을 갖고 있었다. 추천된 도서 한 권당 추천 도서의 대출 수 평균은 14,871권이었으며, 베스트셀러로 선정된 도서 한 권당 평균 대출 수는 53,531권이었다. 한편 대출데이터를 기준으로 약 80~82%의 도서가 전체 상위권 대출의 90%를 감당하고 있고, 약 27~29%의 도서가 전체 상위권 대출의 50%를 감당하고 있었다. 이는 일련의 파레토법칙이 공공도서관 대출패턴에서도 굳건히 적용될 수 있음을 보여주고 있다. 문학의 대출은 전체 대출에서 50.6%를 차지하였으며, 문학 중에서 한국문학작품이 전체 51.3%를 차지하였다. 자연과학은 다른 주제분야에 비해 상대적으로 작은 수의 문헌으로 더 많은 대출을 발생시키고 있었다.

Abstract

The purpose of this study is to present the theoretical basis and quantified objective standards for the establishment of collection management policy. The study results are summarized as follows. Most of the study books were in the form of periodicals as a steady seller. Most of the steady sellers were textbooks which published periodically. As a modern novel, a steady seller was able to confirm the phenomenon of dependence on a specific author. Bestsellers were investigated to be influenced by publishers and authors. Books of publishers that publish comics and children’s textbooks had a significant correlation with the selection of bestsellers. The average number of recommended books borrowed per recommended book was 14,871. The average number of loans per book selected as a bestseller was 53,531. Based on the loan data, about 80-82% of all top-tier loans were covered by 90%, and about 27-29% of all top-ranked loans were covered by 50%. This shows that the Pareto Principle can be firmly applied to public library lending patterns. Loans in the field of literature accounted for 50.6% of the total loans. Among literature, Korean literature accounted for 51.3% of the total. The natural sciences were generating more loans with a relatively small pool of literature compared to other subject fields.

3
김동훈(성균관대학교 문헌정보학과 박사과정) ; 오찬희(성균관대학교 문헌정보학과 석사과정) ; 주영준(성균관대학교 문헌정보학과 조교수) 2021, Vol.38, No.3, pp.23-39 https://doi.org/10.3743/KOSIM.2021.38.3.023
초록보기
초록

본 연구에서는 국내 블록체인 연구의 전반적인 동향 및 시간에 따른 주제를 파악하기 위해 대학 및 기관 협력 네트워크 분석, 키워드 동시출현 네트워크 분석, 다이나믹 토픽모델링 기법을 활용한 시계열 주제 분석을 실시하였다. 대학 및 기관 협력 네트워크 분석 결과, 숭실대학교, 순천향대학교, 고려대학교, 한국과학기술원 등이 블록체인 연구의 주요 대학으로 나타났으며 대학 이외의 기관으로는 국방부, 한국철도기술연구원, 삼일회계법인, 한국전자통신연구원 등이 주요 연구기관으로 나타났다. 키워드 동시출현 네트워크 분석 결과, 가상자산(암호화폐, 비트코인, 이더리움, 가상화폐), 블록체인 기술(분산원장, 분산원장기술), 금융(스마트계약), 정보보안(보안, 프라이버시, 개인정보) 등에 대한 키워드들이 주요하게 나타났으며, 모든 네트워크 중심성 지표에서 스마트계약이 가장 높은 수치를 나타내어 주요한 주제임을 확인할 수 있었다. 마지막으로 시계열 주제분석 결과, 블록체인기술, 블록체인생태계, 블록체인 적용분야1(무역, 온라인투표, 부동산), 블록체인 적용분야2(식품, 관광, 유통, 미디어), 블록체인 적용분야3(경제, 금융) 등 다섯 개의 주요 주제들을 도출하였으며, 각 주제별 대표 키워드들의 비율변화를 통해 주제별 변화를 관찰할 수 있었다. 본 연구는 기존의 국내 블록체인 연구동향 연구들과 크게 세 가지 관점(데이터, 방법론, 해석)에서 차이점을 나타내고 있다. 1) 최근 2년 사이 급증한 블록체인 연구를 포함하였고, 2) 대학 및 기관 네트워크 분석과 시계열 주제분석이라는 새로운 분석기법 및 연구방법을 활용하였으며, 3) 이를 통해 블록체인 연구를 주도하는 대학 및 기관을 식별하고 국내 블록체인 연구 트렌드를 파악하였다. 끝으로, 연구결과가 블록체인 관련 연구 협력 및 정책 수립과 관련 기술 개발 계획에 활용될 수 있다는 점에서 실질적인 함의를 시사한다.

Abstract

This study aims to explore research trends in Blockchain studies in South Korea using dynamic topic modeling and network analysis. To achieve this goal, we conducted the university & institute collaboration network analysis, the keyword co-occurrence network analysis, and times series topic analysis using dynamic topic modeling. Through the university & institute collaboration network analysis, we found major universities such as Soongsil University, Soonchunhyang University, Korea University, Korea Advanced Institute of Science and Technology (KAIST) and major institutes such as Ministry of National Defense, Korea Railroad Research Institute, Samil PricewaterhouseCoopers, Electronics and Telecommunications Research Institute that led collaborative research. Next, through the analysis of the keyword co-occurrence network, we found major research keywords including virtual assets (Cryptocurrency, Bitcoin, Ethereum, Virtual currency), blockchain technology (Distributed ledger, Distributed ledger technology), finance (Smart contract), and information security (Security, privacy, Personal information). Smart contracts showed the highest scores in all network centrality measures showing its importance in the field. Finally, through the time series topic analysis, we identified five major topics including blockchain technology, blockchain ecosystem, blockchain application 1 (trade, online voting, real estate), blockchain application 2 (food, tourism, distribution, media), and blockchain application 3 (economy, finance). Changes of topics were also investigated by exploring proportions of representative keywords for each topic. The study is the first of its kind to attempt to conduct university & institute collaboration networks analysis and dynamic topic modeling-based times series topic analysis for exploring research trends in Blockchain studies in South Korea. Our results can be used by government agencies, universities, and research institutes to develop effective strategies of promoting university & institutes collaboration and interdisciplinary research in the field.

정보관리학회지