바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: big data analysis, 검색결과: 15
11
선은택(중앙대학교 일반대학원 문헌정보학과 정보학전공 석사과정) ; 김학래(중앙대학교 문헌정보학과) 2023, Vol.40, No.4, pp.329-349 https://doi.org/10.3743/KOSIM.2023.40.4.329
초록보기
초록

정보통신 기술이 빠르게 발전하면서 데이터의 생산 속도가 급증하였고, 이는 빅데이터라는 개념으로 대표되고 있다. 단시간에 데이터 규모가 급격하게 증가한 빅데이터에 대해 품질과 신뢰성에 대한 논의도 진행되고 있다. 반면 스몰데이터는 품질이 우수한 최소한의 데이터로, 특정 문제 상황에 필요한 데이터를 의미한다. 문화예술 분야는 다양한 유형과 주제의 데이터가 존재하며 빅데이터 기술을 활용한 연구가 진행되고 있다. 하지만 문화예술기관의 기본정보가 정확하게 제공되고 활용되는지를 탐색한 연구는 부족하다. 기관의 기본정보는 대부분의 빅데이터 분석에서 사용하는 필수적인 근거일 수 있고, 기관을 식별하기 위한 출발점이 된다. 본 연구는 문화예술 기관의 기본정보를 다루는 데이터를 수집하여 공통 메타데이터를 정의하고, 공통 메타데이터를 중심으로 기관을 연계하는 지식그래프 형태로 스몰데이터를 구축하였다. 이는 통합적으로 문화예술기관의 유형과 특징을 탐색할 수 있는 방안이 될 수 있다.

Abstract

With the rapid development of information and communication technology, the speed of data production has increased rapidly, and this is represented by the concept of big data. Discussions on quality and reliability are also underway for big data whose data scale has rapidly increased in a short period of time. On the other hand, small data is minimal data of excellent quality and means data necessary for a specific problem situation. In the field of culture and arts, data of various types and topics exist, and research using big data technology is being conducted. However, research on whether basic information about culture and arts institutions is accurately provided and utilized is insufficient. The basic information of an institution can be an essential basis used in most big data analysis and becomes a starting point for identifying an institution. This study collected data dealing with the basic information of culture and arts institutions to define common metadata and constructed small data in the form of a knowledge graph linking institutions around common metadata. This can be a way to explore the types and characteristics of culture and arts institutions in an integrated way.

12
김미령(서울지방경찰청 사서) ; 노윤주(경찰청 사서) ; 김성훈(성균관대학교 문헌정보학과 초빙교수) 2019, Vol.36, No.4, pp.253-277 https://doi.org/10.3743/KOSIM.2019.36.4.253
초록보기
초록

4차 산업혁명시대를 맞아 데이터의 중요성은 심화되고 있으나, 개인정보보호 등의 문제로 데이터의 활용이 쉽지 않은 경우가 많이 있다. 형사사법정보는 범죄 예측 및 예방, 범죄수사 과학화, 양형합리화 등 다양한 활용가치가 예상됨에도 현재 개인정보보호와 형사사법정보 관련 법률적 해석 문제로 활용이 상당히 제한되고 있다. 본 연구는 형사사법정보의 구조화․범주화를 통해 ‘범죄데이터’로 전환하여 빅데이터로서 활용하도록 제안하였으며, ‘범죄데이터’ 활용시 법률적 문제, 활용가치, 데이터 생성 및 활용시 고려사항을 전문가를 통해 검증하고 향후 전략적 발전방안을 도출하였다. 연구결과, ‘범죄데이터’는 개인정보보호문제는 해결된 것으로 보여지나, 형사사법정보 관련법에 명시할 필요는 있으며, 빅데이터 활용을 위해 분석 가능하도록 표준화된 형태로 정리되는 것이 시급함이 밝혀졌다. 향후 진행방향으로는 데이터 요소 도출, 용어사전 시소러스 구축, 데이터 등급화를 위한 개인민감정보 정의 및 등급지정, 비정형데이터의 정형화를 위한 알고리즘 개발 등을 제시하였다.

Abstract

In the era of the 4th Industrial Revolution, the importance of data is intensifying, but there are many cases where it is not easy to use data due to personal information protection. Although criminal justice information is expected to have various useful values such as crime prediction and prevention, scientific investigation of criminal investigations, and rationalization of sentencing, the use of criminal justice information is currently limited as a matter of legal interpretation related to privacy protection and criminal justice information. This study proposed to convert criminal justice information into ‘crime data’ and use it as big data through the structuralization and categorization of criminal justice information. And when using “crime data,” legal issues, value in use, considerations for data generation and use were verified by experts, and future strategic development plans were identified. Finally we found that ‘crime data’ seems to have solved the privacy problem, but it is necessary to specify in the criminal justice information related law and it is urgent to be organized in a standardized form for analysis to use big data. Future directions are to derive data elements, construct a dictionary thesaurus, define and classify personal sensitive information for data grading, and develop algorithms for shaping unstructured data.

13
황금숙(대림대학교 도서관미디어정보과 교수) ; 배희숙(대림대학교 언어치료학과 조교수) ; 윤성은(대림대학교 방송음향영상학부 조교수) ; 황정현(서울특별시중부교육지원청 장학사) 2024, Vol.41, No.1, pp.1-30 https://doi.org/10.3743/KOSIM.2024.41.1.001
초록보기
초록

본 연구의 목적은 장애 아동․청소년의 독서역량을 강화하기 위하여 진단도구 프로토타입을 개발하고 그 타당도 및 신뢰도를 분석함으로써 독서역량 진단프로그램 개발의 기초 자료를 제시하는 데에 있다. 본 연구는 문헌 및 사례 연구를 바탕으로 문항을 개발하고, 델파이 조사 및 실제 장애 아동․청소년을 대상으로 한 예비조사를 실시하고 분석하였다. 연구 결과, 표본 수가 적어 타당도와 신뢰도 분석에 한계는 있었으나 장애 아동․청소년의 독서역량 진단도구 프로토타입 개발과 함께 기초 데이터를 확보하였다. 향후 개발될 독서역량 진단프로그램은 장애유형별 특성, 빅데이터를 통한 데이터 수집 및 활용 방안, 진단 절차 및 진단 시 유의사항을 다양한 변인을 고려하여 웹․모바일로 확장하여 개발할 것을 제안하였다.

Abstract

The purpose of this study is to develop a diagnostic tool to strengthen the reading competencies of children and adolescents with disabilities, analyze its validity and reliability, and present basic data for the development of a diagnostic program. For this study, it was conducted on literature and case studies, the Delphi Method, and a preliminary survey of actual disabled children/adolescents. As a result of the study, there were limitations in validity and reliability analysis due to the small number of samples, but basic data was secured along with the development of a prototype diagnostic tool for the reading ability of children and adolescents with disabilities. It was proposed to develop the future reading competency diagnostic program by expanding it to the web and mobile platforms, considering various variables such as the characteristics of each disability type, a plan for data collection and utilization through big data, diagnostic procedures, and precautions during the diagnosis.

14
정도헌(덕성여자대학교) ; 주황수(덕성여자대학교) 2018, Vol.35, No.3, pp.77-100 https://doi.org/10.3743/KOSIM.2018.35.3.077
초록보기
초록

본 연구는 텍스트 마이닝 기법을 활용하여 대량의 데이터로부터 학제 간 융합 기술을 발굴하는 일련의 과정을 제시하는 것을 목표로 한다. 바이오공학 기술(BT) 분야와 정보통신 기술(ICT) 분야 간의 융합 연구를 위해 (1) BT 분야의 기술용어 목록을 작성하여 대량의 학술논문 메타데이터를 수집한 후 (2) 패스파인더 네트워크 척도 알고리즘을 이용해 유망 기술의 지식 구조를 생성하고 (3) 토픽 모델링 기법을 사용하여 BT분야 중심의 내용 분석을 수행하였다. 다음 단계인 BT-ICT 융합 기술 아이템 도출을 위해, (4) BT-ICT 관련 정보를 얻기 위해 BT 기술용어 목록을 상위 개념으로 확장한 후 (5) OpenAPI 서비스를 이용하여 두 분야가 관련된 학술 정보의 메타데이터를 자동 수집하여 (6) BT-ICT 토픽 모델의 내용 분석을 실시하였다. 연구를 통해 첫째, 융합 기술의 발굴을 위해서는 기술 용어 목록의 작성이 중요한 지식 베이스가 된다는 점과 둘째, 대량의 수집 문헌을 분석하기 위해서는 데이터의 차원을 줄여 분석을 용이하게 해주는 텍스트 마이닝 기법이 필요하다는 점을 확인하였다. 본 연구에서 제안한 데이터 처리 및 분석 과정이 학제 간 융합 연구의 가능성이 있는 기술 요소들을 발굴하는 데 효과적이었음을 확인할 수 있었다.

Abstract

The objectives of this study is to present a discovering process of interdisciplinary convergence technology using text mining of big data. For the convergence research of biotechnology(BT) and information communications technology (ICT), the following processes were performed. (1) Collecting sufficient meta data of research articles based on BT terminology list. (2) Generating intellectual structure of emerging technologies by using a Pathfinder network scaling algorithm. (3) Analyzing contents with topic modeling. Next three steps were also used to derive items of BT-ICT convergence technology. (4) Expanding BT terminology list into superior concepts of technology to obtain ICT-related information from BT. (5) Automatically collecting meta data of research articles of two fields by using OpenAPI service. (6) Analyzing contents of BT-ICT topic models. Our study proclaims the following findings. Firstly, terminology list can be an important knowledge base for discovering convergence technologies. Secondly, the analysis of a large quantity of literature requires text mining that facilitates the analysis by reducing the dimension of the data. The methodology we suggest here to process and analyze data is efficient to discover technologies with high possibility of interdisciplinary convergence.

초록보기
초록

본 연구는 국민들에게 불안감을 야기하고 전반적인 사회활동을 위축시키는 메르스와 같은 질병의 유행이 공공도서관의 이용에 어떠한 영향을 주는지 알아보고자 하였다. 이를 위해 국립세종도서관에 위치하고 있는 “공공도서관 빅데이터 수집 및 분석 플랫폼”을 통해 전국 303개 공공도서관에서 수집된 18,711,453건의 대출기록을 분석하였다. 분석 결과는 다음과 같다. 첫째, 메르스가 유행했던 2015년도는 64,645.05권으로 2014년보다 하루 평균 6,300권 가량 대출책수가 감소하였다. 둘째, 2014년의 경우 7월 5일부터 8월 19일까지의 일평균 대출책수가 4월 4일부터 5월 19일까지와 5월 20일부터 7월 4일까지보다 많은 것으로 나타났다. 이는 학생들의 여름방학이 공공도서관의 대출책수 증가에 영향을 주었을 것으로 파악할 수 있다. 셋째, 메르스가 발생했던 2015년의 경우 메르스 유행 후 기간의 일평균 대출책수가 메르스 유행기간인 5월 20일부터 7월 4일까지보다 많은 것으로 나타났으나 메르스 유행 전 기간과는 유의한 차이가 존재하지 않았다. 넷째, 2014년과 2015년의 메르스 유행 전 기간의 일평균 대출책수와 2014년과 2015년의 메르스 유행 기간의 일평균 대출책수에는 유의한 차이가 없었으나, 2014년과 2015년의 메르스 유행 후 기간의 일평균 대출책수에서는 유의한 차이가 있었다. 연구 결과 국민들에게 불안감을 가져다 준 메르스는 질병의 유행 기간 보다는 오히려 유행 후 기간 동안 공공도서관의 일평균 대출책수에 영향을 주었음을 확인할 수 있었다.

Abstract

This study aimed to investigate the impact of the epidemic disease including Middle East Respiratory Syndrome Coronavirus (MERS) on the usage of public libraries. Such disease yields anxiety throughout the nation and discourages social activities in general. 18,711,453 records from 303 public libraries were examined with “big data retrieval & analysis platform for public libraries” located in Sejong National Library. The results are as follows. First, in 2015, when MERS was prevalent, the daily mean of books checked out was 64,645.05, showing decrease of 6,300 per day compared to that of 2014. Second, in 2014, the daily mean of books checked out from July 5th to August 19th was greater than that of from April 4th to May 19th and that of from May 20th to July 4th, implying the impact of summer vacation on the increase in books checked out in public libraries. Third, in 2015, the daily mean of books checked out from July 5th was greater than during MERS outbreak(from May 20th to July 4th), while it did not show statistically significant difference with that of before the outbreak. Fourth, the daily mean of books checked out did not show statistically significant difference between 2014 and 2015 before and during the outbreak, while it showed statistically significant difference between 2014 and 2015 after the epidemic period. The results indicate that MERS and the anxiety it brought nationwide had an impact on the daily mean of books checked out in public libraries after the epidemic period rather than during the outbreak.

정보관리학회지