바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 빅데이터 분석, 검색결과: 19
11
선은택(중앙대학교 일반대학원 문헌정보학과 정보학전공 석사과정) ; 김학래(중앙대학교 문헌정보학과) 2023, Vol.40, No.4, pp.329-349 https://doi.org/10.3743/KOSIM.2023.40.4.329
초록보기
초록

정보통신 기술이 빠르게 발전하면서 데이터의 생산 속도가 급증하였고, 이는 빅데이터라는 개념으로 대표되고 있다. 단시간에 데이터 규모가 급격하게 증가한 빅데이터에 대해 품질과 신뢰성에 대한 논의도 진행되고 있다. 반면 스몰데이터는 품질이 우수한 최소한의 데이터로, 특정 문제 상황에 필요한 데이터를 의미한다. 문화예술 분야는 다양한 유형과 주제의 데이터가 존재하며 빅데이터 기술을 활용한 연구가 진행되고 있다. 하지만 문화예술기관의 기본정보가 정확하게 제공되고 활용되는지를 탐색한 연구는 부족하다. 기관의 기본정보는 대부분의 빅데이터 분석에서 사용하는 필수적인 근거일 수 있고, 기관을 식별하기 위한 출발점이 된다. 본 연구는 문화예술 기관의 기본정보를 다루는 데이터를 수집하여 공통 메타데이터를 정의하고, 공통 메타데이터를 중심으로 기관을 연계하는 지식그래프 형태로 스몰데이터를 구축하였다. 이는 통합적으로 문화예술기관의 유형과 특징을 탐색할 수 있는 방안이 될 수 있다.

Abstract

With the rapid development of information and communication technology, the speed of data production has increased rapidly, and this is represented by the concept of big data. Discussions on quality and reliability are also underway for big data whose data scale has rapidly increased in a short period of time. On the other hand, small data is minimal data of excellent quality and means data necessary for a specific problem situation. In the field of culture and arts, data of various types and topics exist, and research using big data technology is being conducted. However, research on whether basic information about culture and arts institutions is accurately provided and utilized is insufficient. The basic information of an institution can be an essential basis used in most big data analysis and becomes a starting point for identifying an institution. This study collected data dealing with the basic information of culture and arts institutions to define common metadata and constructed small data in the form of a knowledge graph linking institutions around common metadata. This can be a way to explore the types and characteristics of culture and arts institutions in an integrated way.

12
김미령(서울지방경찰청 사서) ; 노윤주(경찰청 사서) ; 김성훈(성균관대학교 문헌정보학과 초빙교수) 2019, Vol.36, No.4, pp.253-277 https://doi.org/10.3743/KOSIM.2019.36.4.253
초록보기
초록

4차 산업혁명시대를 맞아 데이터의 중요성은 심화되고 있으나, 개인정보보호 등의 문제로 데이터의 활용이 쉽지 않은 경우가 많이 있다. 형사사법정보는 범죄 예측 및 예방, 범죄수사 과학화, 양형합리화 등 다양한 활용가치가 예상됨에도 현재 개인정보보호와 형사사법정보 관련 법률적 해석 문제로 활용이 상당히 제한되고 있다. 본 연구는 형사사법정보의 구조화․범주화를 통해 ‘범죄데이터’로 전환하여 빅데이터로서 활용하도록 제안하였으며, ‘범죄데이터’ 활용시 법률적 문제, 활용가치, 데이터 생성 및 활용시 고려사항을 전문가를 통해 검증하고 향후 전략적 발전방안을 도출하였다. 연구결과, ‘범죄데이터’는 개인정보보호문제는 해결된 것으로 보여지나, 형사사법정보 관련법에 명시할 필요는 있으며, 빅데이터 활용을 위해 분석 가능하도록 표준화된 형태로 정리되는 것이 시급함이 밝혀졌다. 향후 진행방향으로는 데이터 요소 도출, 용어사전 시소러스 구축, 데이터 등급화를 위한 개인민감정보 정의 및 등급지정, 비정형데이터의 정형화를 위한 알고리즘 개발 등을 제시하였다.

Abstract

In the era of the 4th Industrial Revolution, the importance of data is intensifying, but there are many cases where it is not easy to use data due to personal information protection. Although criminal justice information is expected to have various useful values such as crime prediction and prevention, scientific investigation of criminal investigations, and rationalization of sentencing, the use of criminal justice information is currently limited as a matter of legal interpretation related to privacy protection and criminal justice information. This study proposed to convert criminal justice information into ‘crime data’ and use it as big data through the structuralization and categorization of criminal justice information. And when using “crime data,” legal issues, value in use, considerations for data generation and use were verified by experts, and future strategic development plans were identified. Finally we found that ‘crime data’ seems to have solved the privacy problem, but it is necessary to specify in the criminal justice information related law and it is urgent to be organized in a standardized form for analysis to use big data. Future directions are to derive data elements, construct a dictionary thesaurus, define and classify personal sensitive information for data grading, and develop algorithms for shaping unstructured data.

13
이혜경(대구가톨릭대학교 문헌정보학과 강사) ; 이용구(경북대학교 문헌정보학과) 2023, Vol.40, No.4, pp.429-450 https://doi.org/10.3743/KOSIM.2023.40.4.429
초록보기
초록

본 연구의 목적은 오픈 데이터 관련 연구의 최근 동향과 지적 구조를 고찰하는 것이다. 이를 위하여 본 연구는 Scopus에서 저자 키워드로 ‘open data’를 검색하여 1999년부터 2023년까지 총 6,543건의 논문을 수집하였으며, 데이터 전처리 이후 5,589편 논문의 저자 키워드를 대상으로 오픈 데이터 관련 연구 분야 및 링크드 오픈 데이터 관련 연구 분야의 중심성 도출과 네트워크 분석을 수행하였다. 그 결과, 오픈 데이터 관련 연구에서는 ‘big data’가 가장 높은 중심성을 보였으며, 주로 공공데이터 개념의 오픈 데이터로서의 활용 및 정책 적용 연구, 빅데이터와의 연관개념으로서의 오픈 데이터를 활용한 데이터 분석에 관한 연구, 오픈 데이터의 재생산이나 활용 및 접근과 같은 오픈 데이터의 이용과 관련한 주제의 연구가 이뤄지고 있음이 나타났다. 그리고 링크드 오픈 데이터 관련 연구는 삼각매개중심성 및 최근접이웃중심성에서 모두 ‘semantic web’이 가장 높은 것으로 나타났으며, 정부 정책의 공공데이터보다 데이터 연계와 관계 형성을 중점으로 한 연구가 많이 수행된 것으로 나타났다.

Abstract

The purpose of this study is to examine recent trends and intellectual structures in research related to open data. To achieve this, the study conducted a search for the keyword “open data” in Scopus and collected a total of 6,543 papers from 1999 to 2023. After data preprocessing, the study focused on the author keywords of 5,589 papers to perform network analysis and derive centrality in the field of open data research and linked open data research. As a result, the study found that “big data” exhibited the highest centrality in research related to open data. The research in this area mainly focuses on the utilization of open data as a concept of public data, studies on the application of open data in analysis related to big data as an associated concept, and research on topics related to the use of open data, such as the reproduction, utilization, and access of open data. In linked open data research, both triadic centrality and closeness centrality showed that “the semantic web” had the highest centrality. Moreover, it was observed that research emphasizing data linkage and relationship formation, rather than public data policies, was more prevalent in this field.

14
황금숙(대림대학교 도서관미디어정보과 교수) ; 배희숙(대림대학교 언어치료학과 조교수) ; 윤성은(대림대학교 방송음향영상학부 조교수) ; 황정현(서울특별시중부교육지원청 장학사) 2024, Vol.41, No.1, pp.1-30 https://doi.org/10.3743/KOSIM.2024.41.1.001
초록보기
초록

본 연구의 목적은 장애 아동․청소년의 독서역량을 강화하기 위하여 진단도구 프로토타입을 개발하고 그 타당도 및 신뢰도를 분석함으로써 독서역량 진단프로그램 개발의 기초 자료를 제시하는 데에 있다. 본 연구는 문헌 및 사례 연구를 바탕으로 문항을 개발하고, 델파이 조사 및 실제 장애 아동․청소년을 대상으로 한 예비조사를 실시하고 분석하였다. 연구 결과, 표본 수가 적어 타당도와 신뢰도 분석에 한계는 있었으나 장애 아동․청소년의 독서역량 진단도구 프로토타입 개발과 함께 기초 데이터를 확보하였다. 향후 개발될 독서역량 진단프로그램은 장애유형별 특성, 빅데이터를 통한 데이터 수집 및 활용 방안, 진단 절차 및 진단 시 유의사항을 다양한 변인을 고려하여 웹․모바일로 확장하여 개발할 것을 제안하였다.

Abstract

The purpose of this study is to develop a diagnostic tool to strengthen the reading competencies of children and adolescents with disabilities, analyze its validity and reliability, and present basic data for the development of a diagnostic program. For this study, it was conducted on literature and case studies, the Delphi Method, and a preliminary survey of actual disabled children/adolescents. As a result of the study, there were limitations in validity and reliability analysis due to the small number of samples, but basic data was secured along with the development of a prototype diagnostic tool for the reading ability of children and adolescents with disabilities. It was proposed to develop the future reading competency diagnostic program by expanding it to the web and mobile platforms, considering various variables such as the characteristics of each disability type, a plan for data collection and utilization through big data, diagnostic procedures, and precautions during the diagnosis.

15
한나은(한국과학기술정보연구원) 2023, Vol.40, No.1, pp.51-71 https://doi.org/10.3743/KOSIM.2023.40.1.051
초록보기
초록

본 연구는 공공데이터 품질관리 모델, 빅데이터 품질관리 모델, 그리고 연구데이터 관리를 위한 데이터 생애주기 모델을 분석하여 각 품질관리 모델에서 공통적으로 나타나는 구성 요인을 분석하였다. 품질관리 모델은 품질관리를 수행하는 객체인 대상 데이터의 특성에 따라 생애주기에 맞추어 혹은 PDCA 모델을 바탕으로 구축되고 제안되는데 공통적으로 계획, 수집 및 구축, 운영 및 활용, 보존 및 폐기의 구성요소가 포함된다. 이를 바탕으로 본 연구는 연구데이터를 대상으로 한 품질관리 프로세스 모델을 제안하였는데, 특히 연구데이터를 대상 데이터로 하여 서비스를 제공하는 연구데이터 서비스 플랫폼에서 데이터를 수집하여 서비스하는 일련의 과정에서 수행해야하는 품질관리에 대해 계획, 구축 및 운영, 활용단계로 나누어 논의하였다. 본 연구는 연구데이터 품질관리 수행 방안을 위한 지식 기반을 제공하는데 의의를 갖는다.

Abstract

This study analyzed the government data quality management model, big data quality management model, and data lifecycle model for research data management, and analyzed the components common to each data quality management model. Those data quality management models are designed and proposed according to the lifecycle or based on the PDCA model according to the characteristics of target data, which is the object that performs quality management. And commonly, the components of planning, collection and construction, operation and utilization, and preservation and disposal are included. Based on this, the study proposed a process model for research data quality management, in particular, the research data quality management to be performed in a series of processes from collecting to servicing on a research data platform that provides services using research data as target data was discussed in the stages of planning, construction and operation, and utilization. This study has significance in providing knowledge based for research data quality management implementation methods.

초록보기
초록

본 연구에서는 Y세대의 특징을 밝히고 Y세대가 요구하는 차세대디지털도서관서비스를 도출하고자 하였으며, 이들의 요구가 베이비붐세대와 어느 정도 차이를 보이는지를 비교하고자 하였다. 연구결과, 첫째, Y세대가 가장 많이 이용하는 디지털기기는 휴대폰 또는 스마트폰으로 나타났고, 다음으로 데스크탑 PC, 노트북 PC, 디지털 카메라 순으로 나타났으며, 사용비율에 있어서 약간의 차이는 있지만 그 순위는 베이비붐세대와 거의 유사하게 나타났다. 둘째, 이용하는 디지털서비스에 있어서 Y세대와 베이비붐세대는 상당한 차이를 보이고 있는 것으로 분석되었으며, Y세대는 인터넷 포털을 가장 많이 이용하고 베이비붐세대는 이메일서비스를 가장 많이 이용하는 것으로 나타났다. 셋째, Y세대와 베이비붐세대가 차세대디지털도서관에 요구하는 서비스를 클라우드서비스, 무한창조공간, 빅데이터, 증강현실, 구글글래스, 상황인식기술, 시맨틱서비스, SNS서비스, 디지털교과서서비스, RFID 및 QRCode 서비스, 도서관공간구성, 최첨단디스플레이기술, 기타 획기적인 서비스로 구분하여 조사한 결과, Y세대가 가장 높은 요구도를 보인 서비스는 빅데이터서비스였고, 베이비붐세대는 디지털교과서서비스였다.

Abstract

This study attempted to reveal the characteristics of the Y generation, to derive the services of the next generation digital library, and to compare differences between the demands of the baby boom generation and the Y generation to some extent. As a result, first, it is shown that the digital device the Y generation uses the most, was a cell phone or smartphone, followed by desktop PC, notebook PC, and digital camera. Although there were some differences, the Y generation’s use ratio of digital devices was substantially similar to the baby boomers’. Second, there was a significant difference between the Y generation and baby boom generation in terms of using digital services. While the Y generation used internet portals the most, the baby boom generation used e-mail service the most. Third, we surveyed the services which the Y generation and baby boom generation require for the next generation digital libraries, by grouping as follows: the cloud service, infinite creative space (maker space), big data, augmented reality, Google Glass, context-aware technologies, semantic services, SNS service, digital textbook service, RFID and QRCode service, library space configuration, a state-of-the-art display technology, and other innovative services. While the most demanded service by the Y generation was big data service, the baby boom generation most demanded digital textbook service.

17
이종욱(경북대학교 문헌정보학과) ; 강우진(경북대학교 일반대학원 문헌정보학과) ; 박중규(경북대학교 심리학과) 2021, Vol.38, No.4, pp.1-23 https://doi.org/10.3743/KOSIM.2021.38.4.001
초록보기
초록

본 연구에서는 베스트셀러 목록에 포함된 도서의 순위가 공공도서관에서의 평균 대출 건수에 미치는 영향을 패널분석을 통해 살펴보고자 하였다. 본 연구를 위해 문화 빅데이터 플랫폼을 통하여 국립중앙도서관이 제공하는 데이터를 바탕으로 2018년 1월 1일부터 2019년 12월 29일까지 총 104주 동안의 분석 대상 도서 179권의 공공도서관 대출 데이터 세트를 생성하였고, YES24 웹사이트를 통해 같은 기간 주간 베스트셀러 목록 데이터 세트를 구축하였다. 공공도서관 대출과 베스트셀러 도서 순위 간 정확한 관계를 확인하기 위해 패널자료의 특성을 활용한 분석 방식인 선형회귀모형, 고정효과모형, 확률효과모형 등 세 개의 모형을 비교한 결과, 고정효과모형이 가장 적합한 것으로 나타났다. 순위 데이터 결측값이 47주 미만인 179권의 도서의 자료를 고정효과모형으로 분석한 결과, 도서의 베스트셀러 순위가 한 단계 내려가면 공공도서관에서의 해당 도서 평균 대출 건수가 0.108권 유의미한 수준에서 감소한다는 것을 밝혀내었다. 또한, 베스트셀러 순위가 도서 평균 대출 건수에 미치는 효과가 도서의 내용분류에 따라 상이함을 알 수 있었다. 이 연구는 베스트셀러 순위가 사람들의 도서관 대출행태에 영향을 미치고 있음을 실증적으로 확인한 것으로, 공공도서관에서는 이용자의 요구를 예측하고, 장서 개발 정책 수립에 베스트셀러 목록을 비롯한 사회문화적 맥락을 고려할 필요가 있음을 시사한다.

Abstract

The purpose of this study is to analyze the effects of the bestseller ranks on the book circulations in public libraries. To achieve this goal, the weekly data sets of 179 books’ library circulation and bestseller list from January 1, 2018 to December 29, 2019 were constructed based on the data collected from BigData MarketC and YES24. Three methods for analyzing panel data including linear regression, fixed-effect, and random effect models were compared, and it turned out that fixed-effect model was better than other methods. The results show that the average ranks of bestsellers were associated with their public library circulations visually. Also, the analysis of fixed-effect model showed that the single rank decline of a book on the bestseller list decreases its average circulation of 0.108 while the size of effect varied depending on subject of books. The study empirically demonstrated the impact of a bestseller list on people’s book circulation behavior, suggesting that public libraries need to reference sociocultural context as well as bestseller book lists to predict library user needs and to formulate collection development policy.

초록보기
초록

본 연구에서는 최첨단기술을 적용한 디지털도서관서비스들을 발굴하고 이러한 기술과 서비스의 국내 도서관 적용가능성을 밝혀내고자 하였다. 이를 위해 차세대디지털도서관을 논하고 있는 주요 논문을 검토할 뿐만 아니라 기술관련 기사 및 논문 등 미래의 도서관에 응용될 수 있는 주요 기술들을 검토하였다. 그 결과 차세대디지털도서관의 핵심적인 기술, 개념, 도구는 클라우드서비스, 무한창조공간, 빅데이터, 증강현실, 상황인식기술, 구글글래스, 혁명적 디스플레이기술, 개방형의 연결된 콘텐츠제공방식이 될 것으로 분석되었다. 그리고 이러한 기술이나 개념을 적용한 구체적인 사례들도 나타나고 있는 것으로 조사되었다.

Abstract

This study proposes to identify digital library services applying cutting-edge technologies, and attempt to investigate the applicability of these technologies and services to domestic libraries. To this end, we reviewed main research which discusses next generation digital libraries, and examined thoroughly main technologies which can be applied to future libraries. As a result, the core technologies, concepts, and tools of the next generation of digital library are: cloud services, space for infinite creating (makerspace), big data, augmented reality, context-aware technologies, Google-glass, a revolutionary display technology, open linked-content-offering method, and so on. Specific cases of libraries already utilizing these technologies are also discussed.

초록보기
초록

본 연구는 국민들에게 불안감을 야기하고 전반적인 사회활동을 위축시키는 메르스와 같은 질병의 유행이 공공도서관의 이용에 어떠한 영향을 주는지 알아보고자 하였다. 이를 위해 국립세종도서관에 위치하고 있는 “공공도서관 빅데이터 수집 및 분석 플랫폼”을 통해 전국 303개 공공도서관에서 수집된 18,711,453건의 대출기록을 분석하였다. 분석 결과는 다음과 같다. 첫째, 메르스가 유행했던 2015년도는 64,645.05권으로 2014년보다 하루 평균 6,300권 가량 대출책수가 감소하였다. 둘째, 2014년의 경우 7월 5일부터 8월 19일까지의 일평균 대출책수가 4월 4일부터 5월 19일까지와 5월 20일부터 7월 4일까지보다 많은 것으로 나타났다. 이는 학생들의 여름방학이 공공도서관의 대출책수 증가에 영향을 주었을 것으로 파악할 수 있다. 셋째, 메르스가 발생했던 2015년의 경우 메르스 유행 후 기간의 일평균 대출책수가 메르스 유행기간인 5월 20일부터 7월 4일까지보다 많은 것으로 나타났으나 메르스 유행 전 기간과는 유의한 차이가 존재하지 않았다. 넷째, 2014년과 2015년의 메르스 유행 전 기간의 일평균 대출책수와 2014년과 2015년의 메르스 유행 기간의 일평균 대출책수에는 유의한 차이가 없었으나, 2014년과 2015년의 메르스 유행 후 기간의 일평균 대출책수에서는 유의한 차이가 있었다. 연구 결과 국민들에게 불안감을 가져다 준 메르스는 질병의 유행 기간 보다는 오히려 유행 후 기간 동안 공공도서관의 일평균 대출책수에 영향을 주었음을 확인할 수 있었다.

Abstract

This study aimed to investigate the impact of the epidemic disease including Middle East Respiratory Syndrome Coronavirus (MERS) on the usage of public libraries. Such disease yields anxiety throughout the nation and discourages social activities in general. 18,711,453 records from 303 public libraries were examined with “big data retrieval & analysis platform for public libraries” located in Sejong National Library. The results are as follows. First, in 2015, when MERS was prevalent, the daily mean of books checked out was 64,645.05, showing decrease of 6,300 per day compared to that of 2014. Second, in 2014, the daily mean of books checked out from July 5th to August 19th was greater than that of from April 4th to May 19th and that of from May 20th to July 4th, implying the impact of summer vacation on the increase in books checked out in public libraries. Third, in 2015, the daily mean of books checked out from July 5th was greater than during MERS outbreak(from May 20th to July 4th), while it did not show statistically significant difference with that of before the outbreak. Fourth, the daily mean of books checked out did not show statistically significant difference between 2014 and 2015 before and during the outbreak, while it showed statistically significant difference between 2014 and 2015 after the epidemic period. The results indicate that MERS and the anxiety it brought nationwide had an impact on the daily mean of books checked out in public libraries after the epidemic period rather than during the outbreak.

정보관리학회지