바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 연구분야, 검색결과: 13
초록보기
초록

빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문 분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.

Abstract

As data management and processing techniques have been developed rapidly in the era of big data, nowadays a lot of business companies and researchers have been interested in long tail data which were ignored in the past. This study proposes methods for generating and controlling a network of technical terms based on text mining technique to enhance data utilization in the distribution of long tail theory. Especially, an edit distance technique of text mining has given us efficient methods to automatically create an interlinking network of technical terms in the scholarly field. We have also used linked open data system to gather experimental data to improve data utilization and proposed effective methods to use data of LOD systems and algorithm to recognize patterns of terms. Finally, the performance evaluation test of the network of technical terms has shown that the proposed methods were useful to enhance the rate of data utilization.

초록보기
초록

이 연구에서는 1999년 1월부터 2018년 6월 현재까지 약 20년 간의 기록관리를 주제로 한 뉴스 빅데이터 4,680 건을 ‘빅카인즈’에서 추출하여, 이를 대상으로 우리나라 언론의 기록관리 주제에 대해 시계열 기반으로 보도 특성을 분석하고자 하였다. 먼저, 기록관리에 대한 언론 보도량의 차이를 살펴보기 위해 시기별, 주제별, 언론사 유형별 보도량을 분석하였다. 또한 기록관리 주제에 대한 언론 보도 내용의 차이에 대한 특성을 분석하기 위해 단어빈도 기반 내용 분석과 언어 네트워크 분석을 수행하여 언론 보도 내용의 시기별, 주제별, 언론사 유형별 차이를 분석하였다. 분석 결과, 기록관리 분야 뉴스 보도는 보도량과 보도 내용에 있어 시기별, 주제별, 언론사별로 차이가 있는 것으로 나타났다. 뉴스 보도량은 2007년 대통령기록물관리법이 제정된 이후부터 증가하기 시작하여 2013년에 가장 많은 뉴스가 보도된 것으로 나타났으며, 정치와 사회 주제를 중심으로 중앙지와 경제지가 가장 많은 양의 뉴스를 보도한 것으로 나타났다. 또한 뉴스 보도 내용의 분석 결과, 기록관리가 도입된 처음 10년 동안은 기록관리의 현장 적용과 확산 과정에서 발생하는 이슈들을 중심으로 뉴스 주제가 형성되다가, 대통령기록물관리법 제정 이후로 기록관리가 정치적, 사회적 이슈의 주요 요인이 되면서 정치, 사회 분야의 뉴스가 많이 보도된 것으로 나타났다.

Abstract

The purpose of this study is to analyze the characteristics of Korean media on the topic of archives & records management based on time-series analysis. In this study, from January, 1999 to June, 2018, 4,680 news articles on archives & records management topics were extracted from BigKinds. In order to examine the characteristics of the media coverage on the archives & records management topic, this study was analyzed to the difference of the press coverage by period, subject, and type of the media. In addition, this study was conducted word-frequency based content analysis and semantic network analysis to investigate the content characteristics of media on the subject. Based on these results, this study was analyzed to the differences of media coverage by period, subject, and type of media. As a result, the news in the field of records management showed that there was a difference in the amount of news coverage and news contents by period, subject, and type of media. The amount of news coverage began to increase after the Presidential Records Management Act was enacted in 2007, and the largest amount of news was reported in 2013. Daily newspapers and financial newspapers reported the largest amount of news. As a result of analyzing news reports, during the first 10 years after 1999, news topics were formed around the issues arising from the application and diffusion process of the concept of archives & records management. However, since the enactment of the Presidential Records Management Act, archives & records management has become a major factor in political and social issues, and a large amount of political and social news has been reported.

13
이지원(대구가톨릭대학교) ; 이재윤(명지대학교) 2018, Vol.35, No.1, pp.205-229 https://doi.org/10.3743/KOSIM.2018.35.1.205
초록보기
초록

본 연구는 국내 대학도서관 서양서 장서 개발의 변화를 살펴보기 위해 2003년과 2013년에 출판된 서양서 소장 실태를 KERIS 종합목록을 통해 분석하였다. 이를 위해 새로운 장서 지표로 소장 h-지수, 장서 고유성 지수, 그리고 공통장서 확보율을 제안하고 기본 지표인 종수 및 책수, 그리고 종당 책수와 함께 활용하였다. 분석 결과 2003년에 비해서 2013년에 출판된 서양서의 전체 소장 종수는 16.1% 감소하고 소장 책수는 42.2% 감소하여 소장 책수가 더 크게 감소하였다. 여러 도서관이 공통적으로 소장하는 공통 장서, 또는 기본 장서의 규모를 나타내는 공통장서 확보율은 줄어들었고, 장서고유성은 증가하였다. DDC 주류 중에서는 컴퓨터 관련 도서가 급감한 0XX(총류) 분야의 감소율이 가장 컸다. 도서관별 장서량 측면에서는 2003년에 비해서 2013년 출판도서의 경우에 상위 도서관이 더욱 과점하는 빈익빈 부익부 현상이 심화되었다.

Abstract

This study analyzed Korean university libraries’ holdings of Western language books published in 2003 and 2013 using the KERIS union catalog with a view to investigating the changes in collection development of Western language books in the libraries. To do that, new collection indexes - holding h-index, CUI (Collection Uniqueness Index), and CCHR (Common Collection Holding Ratio) - were suggested, and they were used with basic indexes such as the number of titles, the number of books, and the number of books per title. The analysis reveals that compared to those published in 2003, the number of titles was decreased by 16.1% with those published in 2013, and the number of books dropped more sharply, by 42.2%. Also, in 2013, CCHR was decreased while CUI was increased. In terms of subject, among DDC main classes, 0XX (Generalities) showed the greatest decrease rate in both the number of titles and books because of the radical reduction of computer-related books. In terms of each library’s holdings, the number of Western language books held by top libraries has been increased with those published in 2013.

정보관리학회지