바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 빅데이터, 검색결과: 21
11
선은택(중앙대학교 일반대학원 문헌정보학과 정보학전공 석사과정) ; 김학래(중앙대학교 문헌정보학과) 2023, Vol.40, No.4, pp.329-349 https://doi.org/10.3743/KOSIM.2023.40.4.329
초록보기
초록

정보통신 기술이 빠르게 발전하면서 데이터의 생산 속도가 급증하였고, 이는 빅데이터라는 개념으로 대표되고 있다. 단시간에 데이터 규모가 급격하게 증가한 빅데이터에 대해 품질과 신뢰성에 대한 논의도 진행되고 있다. 반면 스몰데이터는 품질이 우수한 최소한의 데이터로, 특정 문제 상황에 필요한 데이터를 의미한다. 문화예술 분야는 다양한 유형과 주제의 데이터가 존재하며 빅데이터 기술을 활용한 연구가 진행되고 있다. 하지만 문화예술기관의 기본정보가 정확하게 제공되고 활용되는지를 탐색한 연구는 부족하다. 기관의 기본정보는 대부분의 빅데이터 분석에서 사용하는 필수적인 근거일 수 있고, 기관을 식별하기 위한 출발점이 된다. 본 연구는 문화예술 기관의 기본정보를 다루는 데이터를 수집하여 공통 메타데이터를 정의하고, 공통 메타데이터를 중심으로 기관을 연계하는 지식그래프 형태로 스몰데이터를 구축하였다. 이는 통합적으로 문화예술기관의 유형과 특징을 탐색할 수 있는 방안이 될 수 있다.

Abstract

With the rapid development of information and communication technology, the speed of data production has increased rapidly, and this is represented by the concept of big data. Discussions on quality and reliability are also underway for big data whose data scale has rapidly increased in a short period of time. On the other hand, small data is minimal data of excellent quality and means data necessary for a specific problem situation. In the field of culture and arts, data of various types and topics exist, and research using big data technology is being conducted. However, research on whether basic information about culture and arts institutions is accurately provided and utilized is insufficient. The basic information of an institution can be an essential basis used in most big data analysis and becomes a starting point for identifying an institution. This study collected data dealing with the basic information of culture and arts institutions to define common metadata and constructed small data in the form of a knowledge graph linking institutions around common metadata. This can be a way to explore the types and characteristics of culture and arts institutions in an integrated way.

초록보기
초록

본 연구는 국민들에게 불안감을 야기하고 전반적인 사회활동을 위축시키는 메르스와 같은 질병의 유행이 공공도서관의 이용에 어떠한 영향을 주는지 알아보고자 하였다. 이를 위해 국립세종도서관에 위치하고 있는 “공공도서관 빅데이터 수집 및 분석 플랫폼”을 통해 전국 303개 공공도서관에서 수집된 18,711,453건의 대출기록을 분석하였다. 분석 결과는 다음과 같다. 첫째, 메르스가 유행했던 2015년도는 64,645.05권으로 2014년보다 하루 평균 6,300권 가량 대출책수가 감소하였다. 둘째, 2014년의 경우 7월 5일부터 8월 19일까지의 일평균 대출책수가 4월 4일부터 5월 19일까지와 5월 20일부터 7월 4일까지보다 많은 것으로 나타났다. 이는 학생들의 여름방학이 공공도서관의 대출책수 증가에 영향을 주었을 것으로 파악할 수 있다. 셋째, 메르스가 발생했던 2015년의 경우 메르스 유행 후 기간의 일평균 대출책수가 메르스 유행기간인 5월 20일부터 7월 4일까지보다 많은 것으로 나타났으나 메르스 유행 전 기간과는 유의한 차이가 존재하지 않았다. 넷째, 2014년과 2015년의 메르스 유행 전 기간의 일평균 대출책수와 2014년과 2015년의 메르스 유행 기간의 일평균 대출책수에는 유의한 차이가 없었으나, 2014년과 2015년의 메르스 유행 후 기간의 일평균 대출책수에서는 유의한 차이가 있었다. 연구 결과 국민들에게 불안감을 가져다 준 메르스는 질병의 유행 기간 보다는 오히려 유행 후 기간 동안 공공도서관의 일평균 대출책수에 영향을 주었음을 확인할 수 있었다.

Abstract

This study aimed to investigate the impact of the epidemic disease including Middle East Respiratory Syndrome Coronavirus (MERS) on the usage of public libraries. Such disease yields anxiety throughout the nation and discourages social activities in general. 18,711,453 records from 303 public libraries were examined with “big data retrieval & analysis platform for public libraries” located in Sejong National Library. The results are as follows. First, in 2015, when MERS was prevalent, the daily mean of books checked out was 64,645.05, showing decrease of 6,300 per day compared to that of 2014. Second, in 2014, the daily mean of books checked out from July 5th to August 19th was greater than that of from April 4th to May 19th and that of from May 20th to July 4th, implying the impact of summer vacation on the increase in books checked out in public libraries. Third, in 2015, the daily mean of books checked out from July 5th was greater than during MERS outbreak(from May 20th to July 4th), while it did not show statistically significant difference with that of before the outbreak. Fourth, the daily mean of books checked out did not show statistically significant difference between 2014 and 2015 before and during the outbreak, while it showed statistically significant difference between 2014 and 2015 after the epidemic period. The results indicate that MERS and the anxiety it brought nationwide had an impact on the daily mean of books checked out in public libraries after the epidemic period rather than during the outbreak.

초록보기
초록

이 연구는 대학도서관의 웹사이트 실제 이용 데이터를 분석하여 이용자들의 이용행태를 분석하고, 웹사이트의 개선방안을 제안하는데 있다. 이 연구에서는 2018년 1월부터 2018년 12월까지 C대학교 웹사이트에서 이루어진 이용자들의 트래픽을 분석하여 이용행태를 분석하였다. 웹사이트의 분석 툴로는 ‘구글 애널리틱스’를 활용하였다. 웹 트래픽 변수는 세션, 사용자, 페이지뷰 수, 세션당 페이지수, 평균 세션 시간, 이탈률을 측정지표를 기준으로 이용자 일반적 특성, 사용자환경 분석, 방문 분석, 유입분석, 사이트 분석 5가지로 구분지어 분석하였다. 그 결과, 1) 이용자 일반적 특성을 분석 결과에서 웹사이트 접속 위치가 대한민국뿐만 아니라 중국에서도 일부 접속이 있었다. 2) 사용자 환경 분석에서는 주 이용 브라우저 유형은 인터넷 익스플로러로 나타났다. 다음 순위는 크롬이었으며, 3위와 4위인 Safari로 이탈률이 익스클로러나 크롬의 두 배에 달했다. 화면 해상도에서는 1920x1080 해상도가 가장 많은 비율을 차지하였으며 그 외에도 다양한 환경에서 접속하는 것으로 나타났다. 3) 유입 매체 분석에서는 직접 유입이 가장 높게 나타났다. 4) 사이트 분석에서는 총 페이지뷰 수인 4,534,084 페이지 중 최다 페이지뷰를 차지한 페이지는 메인페이지 다음으로 대출/연장/이력/예약 페이지, 학술DB 페이지, 소장자료 페이지 순으로 나타났다.

Abstract

This study analyzes the actual use data of the websites of university libraries, analyzes the users’ usage behavior, and proposes improvement measures for the websites. The study analyzed users’ traffic and analyzed their usage behavior from January 2018 to December 2018 on the C University website. The website’s analysis tool used ‘Google Analytics’. The web traffic variables were analyzed in five categories: user general characteristics, user environment analysis, visit analysis, inflow analysis, site analysis, and site analysis based on the metrics of sessions, users, page views, pages per session, average session time, and bounce rate. As a result, 1) In the analysis results of general characteristics of users, there was some access to the website not only in Korea but also in China. 2) In the user experience analysis, the main browser type appeared as Internet Explorer. The next place was Chrome, with a bounce rate of Safari, third and fourth, double that of the Explore or Chrome. In terms of screen resolution, 1920x1080 resolution accounted for the largest percentage, with access in a variety of other environments. 3) Direct inflow was the highest in the inflow media analysis. 4) The site analysis showed the most page views out of 4,534,084 pages, followed by the main page, followed by the lending/extension/history/booking page, the academic DB page, and the collection page.

14
진주영(명지대학교) ; 이해영(명지대학교) 2018, Vol.35, No.1, pp.183-203 https://doi.org/10.3743/KOSIM.2018.35.1.183
초록보기
초록

이용자 정보이용환경이 웹으로 변화하면서, 기록관리기관들도 종전보다 더 많은 서비스를 웹을 통해 제공하고 있다. 이 연구는 국가기록원 웹사이트를 이용하는 이용자의 최근 유입경로와 10년 반 동안 매달 상위 100개의 검색어 데이터를 분석하고 그에 맞는 기록정보서비스방안을 제시한다. 분석 결과 유입경로는 크게 포털 사이트별 접속, 국가별 접속, 유사기관별 접속 및 모바일 접속으로 분류할 수 있었다. 이용자들의 검색어를 분석한 결과 이용자들이 10년 반 동안 가장 많이 검색한 검색어는 ‘토지조사부’였으며, 꾸준한 관심을 갖고 검색한 검색어 또한 ‘토지조사부’였다. 그 외에 정부 기관에서 생산한 문서 또는 관보에 대한 관심도 높음을 확인하였다. 그리고 이용자들이 가장 많이 검색한 검색어와 꾸준히 등장한 검색어를 파악한 결과, 검색어들을 크게 토지, 일제강점기, 6․25 전쟁과 남북관계, 기록관리 및 이용으로 묶어볼 수 있었다. 분석결과를 토대로 포털 사이트 및 모바일 등을 활용한 국가기록원 웹사이트의 연계성 강화와 검색 서비스의 고도화 방안을 제안하였다. 이 연구는 이렇게 웹로그나 이용자 검색어 등을 분석하면 기록관리기관 이용자들에게 제공하는 서비스를 고도화할 수 있는 의미 있는 결과를 얻을 수 있음을 확인하였다.

Abstract

As the users’ information use environment changes to the Web, the archives are providing more services on the Web than before. This study analyzes the users’ recent inflow route and the highly ranked 100 search terms of each month for 10 and half years in the Web site of National Archives of Korea, and suggests suitable information services. As a result of the analysis, it was found out that the inflow route could be divided into access from portal site, by country, from related institutions, and via mobile platform. As a result of analyzing the search terms of users for the last 10 and half years, the most frequently searched term turned out to be ‘Land Survey Register’, which was also the search term that was searched for with steady interests for 10 and half years. Also, other government documents or official gazettes were of great interests to users. As results of identifying the most frequently searched and steadily searched terms, we were able to categorize the search terms largely in terms of land, Japanese colonial period, the Korean war and relationship of North Korea and South Korea, and records management and use. Based on the results of the analysis, we suggested strengthening connection of the National Archives Web site with portal sites and mobile, and upgrading and improving search services of the National Archives. This study confirmed that the analysis of Web log and user search terms would yield meaningful results that could enhance the user services in archives.

초록보기
초록

빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문 분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.

Abstract

As data management and processing techniques have been developed rapidly in the era of big data, nowadays a lot of business companies and researchers have been interested in long tail data which were ignored in the past. This study proposes methods for generating and controlling a network of technical terms based on text mining technique to enhance data utilization in the distribution of long tail theory. Especially, an edit distance technique of text mining has given us efficient methods to automatically create an interlinking network of technical terms in the scholarly field. We have also used linked open data system to gather experimental data to improve data utilization and proposed effective methods to use data of LOD systems and algorithm to recognize patterns of terms. Finally, the performance evaluation test of the network of technical terms has shown that the proposed methods were useful to enhance the rate of data utilization.

16
이혜경(대구가톨릭대학교 문헌정보학과 강사) ; 이용구(경북대학교 문헌정보학과) 2023, Vol.40, No.4, pp.429-450 https://doi.org/10.3743/KOSIM.2023.40.4.429
초록보기
초록

본 연구의 목적은 오픈 데이터 관련 연구의 최근 동향과 지적 구조를 고찰하는 것이다. 이를 위하여 본 연구는 Scopus에서 저자 키워드로 ‘open data’를 검색하여 1999년부터 2023년까지 총 6,543건의 논문을 수집하였으며, 데이터 전처리 이후 5,589편 논문의 저자 키워드를 대상으로 오픈 데이터 관련 연구 분야 및 링크드 오픈 데이터 관련 연구 분야의 중심성 도출과 네트워크 분석을 수행하였다. 그 결과, 오픈 데이터 관련 연구에서는 ‘big data’가 가장 높은 중심성을 보였으며, 주로 공공데이터 개념의 오픈 데이터로서의 활용 및 정책 적용 연구, 빅데이터와의 연관개념으로서의 오픈 데이터를 활용한 데이터 분석에 관한 연구, 오픈 데이터의 재생산이나 활용 및 접근과 같은 오픈 데이터의 이용과 관련한 주제의 연구가 이뤄지고 있음이 나타났다. 그리고 링크드 오픈 데이터 관련 연구는 삼각매개중심성 및 최근접이웃중심성에서 모두 ‘semantic web’이 가장 높은 것으로 나타났으며, 정부 정책의 공공데이터보다 데이터 연계와 관계 형성을 중점으로 한 연구가 많이 수행된 것으로 나타났다.

Abstract

The purpose of this study is to examine recent trends and intellectual structures in research related to open data. To achieve this, the study conducted a search for the keyword “open data” in Scopus and collected a total of 6,543 papers from 1999 to 2023. After data preprocessing, the study focused on the author keywords of 5,589 papers to perform network analysis and derive centrality in the field of open data research and linked open data research. As a result, the study found that “big data” exhibited the highest centrality in research related to open data. The research in this area mainly focuses on the utilization of open data as a concept of public data, studies on the application of open data in analysis related to big data as an associated concept, and research on topics related to the use of open data, such as the reproduction, utilization, and access of open data. In linked open data research, both triadic centrality and closeness centrality showed that “the semantic web” had the highest centrality. Moreover, it was observed that research emphasizing data linkage and relationship formation, rather than public data policies, was more prevalent in this field.

초록보기
초록

본 연구에서는 최첨단기술을 적용한 디지털도서관서비스들을 발굴하고 이러한 기술과 서비스의 국내 도서관 적용가능성을 밝혀내고자 하였다. 이를 위해 차세대디지털도서관을 논하고 있는 주요 논문을 검토할 뿐만 아니라 기술관련 기사 및 논문 등 미래의 도서관에 응용될 수 있는 주요 기술들을 검토하였다. 그 결과 차세대디지털도서관의 핵심적인 기술, 개념, 도구는 클라우드서비스, 무한창조공간, 빅데이터, 증강현실, 상황인식기술, 구글글래스, 혁명적 디스플레이기술, 개방형의 연결된 콘텐츠제공방식이 될 것으로 분석되었다. 그리고 이러한 기술이나 개념을 적용한 구체적인 사례들도 나타나고 있는 것으로 조사되었다.

Abstract

This study proposes to identify digital library services applying cutting-edge technologies, and attempt to investigate the applicability of these technologies and services to domestic libraries. To this end, we reviewed main research which discusses next generation digital libraries, and examined thoroughly main technologies which can be applied to future libraries. As a result, the core technologies, concepts, and tools of the next generation of digital library are: cloud services, space for infinite creating (makerspace), big data, augmented reality, context-aware technologies, Google-glass, a revolutionary display technology, open linked-content-offering method, and so on. Specific cases of libraries already utilizing these technologies are also discussed.

초록보기
초록

본 연구에서는 Y세대의 특징을 밝히고 Y세대가 요구하는 차세대디지털도서관서비스를 도출하고자 하였으며, 이들의 요구가 베이비붐세대와 어느 정도 차이를 보이는지를 비교하고자 하였다. 연구결과, 첫째, Y세대가 가장 많이 이용하는 디지털기기는 휴대폰 또는 스마트폰으로 나타났고, 다음으로 데스크탑 PC, 노트북 PC, 디지털 카메라 순으로 나타났으며, 사용비율에 있어서 약간의 차이는 있지만 그 순위는 베이비붐세대와 거의 유사하게 나타났다. 둘째, 이용하는 디지털서비스에 있어서 Y세대와 베이비붐세대는 상당한 차이를 보이고 있는 것으로 분석되었으며, Y세대는 인터넷 포털을 가장 많이 이용하고 베이비붐세대는 이메일서비스를 가장 많이 이용하는 것으로 나타났다. 셋째, Y세대와 베이비붐세대가 차세대디지털도서관에 요구하는 서비스를 클라우드서비스, 무한창조공간, 빅데이터, 증강현실, 구글글래스, 상황인식기술, 시맨틱서비스, SNS서비스, 디지털교과서서비스, RFID 및 QRCode 서비스, 도서관공간구성, 최첨단디스플레이기술, 기타 획기적인 서비스로 구분하여 조사한 결과, Y세대가 가장 높은 요구도를 보인 서비스는 빅데이터서비스였고, 베이비붐세대는 디지털교과서서비스였다.

Abstract

This study attempted to reveal the characteristics of the Y generation, to derive the services of the next generation digital library, and to compare differences between the demands of the baby boom generation and the Y generation to some extent. As a result, first, it is shown that the digital device the Y generation uses the most, was a cell phone or smartphone, followed by desktop PC, notebook PC, and digital camera. Although there were some differences, the Y generation’s use ratio of digital devices was substantially similar to the baby boomers’. Second, there was a significant difference between the Y generation and baby boom generation in terms of using digital services. While the Y generation used internet portals the most, the baby boom generation used e-mail service the most. Third, we surveyed the services which the Y generation and baby boom generation require for the next generation digital libraries, by grouping as follows: the cloud service, infinite creative space (maker space), big data, augmented reality, Google Glass, context-aware technologies, semantic services, SNS service, digital textbook service, RFID and QRCode service, library space configuration, a state-of-the-art display technology, and other innovative services. While the most demanded service by the Y generation was big data service, the baby boom generation most demanded digital textbook service.

19
황금숙(대림대학교 도서관미디어정보과 교수) ; 배희숙(대림대학교 언어치료학과 조교수) ; 윤성은(대림대학교 방송음향영상학부 조교수) ; 황정현(서울특별시중부교육지원청 장학사) 2024, Vol.41, No.1, pp.1-30 https://doi.org/10.3743/KOSIM.2024.41.1.001
초록보기
초록

본 연구의 목적은 장애 아동․청소년의 독서역량을 강화하기 위하여 진단도구 프로토타입을 개발하고 그 타당도 및 신뢰도를 분석함으로써 독서역량 진단프로그램 개발의 기초 자료를 제시하는 데에 있다. 본 연구는 문헌 및 사례 연구를 바탕으로 문항을 개발하고, 델파이 조사 및 실제 장애 아동․청소년을 대상으로 한 예비조사를 실시하고 분석하였다. 연구 결과, 표본 수가 적어 타당도와 신뢰도 분석에 한계는 있었으나 장애 아동․청소년의 독서역량 진단도구 프로토타입 개발과 함께 기초 데이터를 확보하였다. 향후 개발될 독서역량 진단프로그램은 장애유형별 특성, 빅데이터를 통한 데이터 수집 및 활용 방안, 진단 절차 및 진단 시 유의사항을 다양한 변인을 고려하여 웹․모바일로 확장하여 개발할 것을 제안하였다.

Abstract

The purpose of this study is to develop a diagnostic tool to strengthen the reading competencies of children and adolescents with disabilities, analyze its validity and reliability, and present basic data for the development of a diagnostic program. For this study, it was conducted on literature and case studies, the Delphi Method, and a preliminary survey of actual disabled children/adolescents. As a result of the study, there were limitations in validity and reliability analysis due to the small number of samples, but basic data was secured along with the development of a prototype diagnostic tool for the reading ability of children and adolescents with disabilities. It was proposed to develop the future reading competency diagnostic program by expanding it to the web and mobile platforms, considering various variables such as the characteristics of each disability type, a plan for data collection and utilization through big data, diagnostic procedures, and precautions during the diagnosis.

20
한나은(한국과학기술정보연구원) 2023, Vol.40, No.1, pp.51-71 https://doi.org/10.3743/KOSIM.2023.40.1.051
초록보기
초록

본 연구는 공공데이터 품질관리 모델, 빅데이터 품질관리 모델, 그리고 연구데이터 관리를 위한 데이터 생애주기 모델을 분석하여 각 품질관리 모델에서 공통적으로 나타나는 구성 요인을 분석하였다. 품질관리 모델은 품질관리를 수행하는 객체인 대상 데이터의 특성에 따라 생애주기에 맞추어 혹은 PDCA 모델을 바탕으로 구축되고 제안되는데 공통적으로 계획, 수집 및 구축, 운영 및 활용, 보존 및 폐기의 구성요소가 포함된다. 이를 바탕으로 본 연구는 연구데이터를 대상으로 한 품질관리 프로세스 모델을 제안하였는데, 특히 연구데이터를 대상 데이터로 하여 서비스를 제공하는 연구데이터 서비스 플랫폼에서 데이터를 수집하여 서비스하는 일련의 과정에서 수행해야하는 품질관리에 대해 계획, 구축 및 운영, 활용단계로 나누어 논의하였다. 본 연구는 연구데이터 품질관리 수행 방안을 위한 지식 기반을 제공하는데 의의를 갖는다.

Abstract

This study analyzed the government data quality management model, big data quality management model, and data lifecycle model for research data management, and analyzed the components common to each data quality management model. Those data quality management models are designed and proposed according to the lifecycle or based on the PDCA model according to the characteristics of target data, which is the object that performs quality management. And commonly, the components of planning, collection and construction, operation and utilization, and preservation and disposal are included. Based on this, the study proposed a process model for research data quality management, in particular, the research data quality management to be performed in a series of processes from collecting to servicing on a research data platform that provides services using research data as target data was discussed in the stages of planning, construction and operation, and utilization. This study has significance in providing knowledge based for research data quality management implementation methods.

정보관리학회지