바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: data analysis, 검색결과: 195
초록보기
초록

Mendeley의 독자 정보는 학계 밖에서 학문의 결과물이 어떻게 소비되고 있는지 다각도로 파악하여 피인용도로는 해석할 수 없었던 미지의 세계를 예측하는데 활용될 수 있다. 본 연구는 Mendeley의 co-readership 데이터를 활용해 한국 관련 논문의 독자 국가 네트워크 분석을 수행하여 공통의 학문적 관심사를 공유하는 국가 군집을 이해하고 이들 국가가 네트워크 상에서 어떠한 영향력을 가지는지 확인하였다. 그 결과 전 분야에서 미국을 비롯한 선진국은 대체로 높은 전역중심성을 보여 한국 관련 연구에 대한 전반적인 협력과 잠재적 교류 가능성을 가지는 것으로 나타났으며, 일부 개발도상국은 높은 지역중심성을 보여 상호간 공통의 학문적 관심사로 연계되어 있는 것으로 확인되었다. 한편 의학과 사회과학 분야는 OECD 국가와 개발도상국이 분리된 독자층을 이루었으며, 공학 분야는 신흥경제개발국이 대규모 독자 군집으로 형성되는 특징을 보였다. 또한 공학은 네트워크 밀도가 상대적으로 높게 나타나 국가간 학문적 교류와 지식의 확산, 협력의 가능성이 높은 것으로 분석되었다.

Abstract

Mendeley readership data could be used to understand how research outcome be spent outside of academia in multi way. So it could be utilized to understand unknown world which citation rate could not explain still now. This study, by conducting a country network analysis using Mendeley’s co readership data about articles of Korea related research, clusters countries that share common academic interest. As a result, the US and other advanced countries in all fields showed high overall and regional centrality, indicating that they have overall cooperation and potential for exchange of Korea related studies. Some developing countries have shown high regional centrality and are linked to common academic interests. In the medical and social sciences, the OECD and developing countries have formed a separate group of readers, and the engineering sector has been characterized by emerging developing countries as a large community of readers. In addition, engineering science field has shown that network density is relatively high, so there might be high possibility of academic exchanges, knowledge dissemination and cooperation among countries.

32
송성전(독립연구자) ; 심지영(연세대학교 대학도서관발전연구소) 2022, Vol.39, No.3, pp.311-336 https://doi.org/10.3743/KOSIM.2022.39.3.311
초록보기
초록

본 연구는 도서관 정보서비스 환경에서 도서 이용자의 도서추천에 영향을 미치는 선호요인을 파악하기 위해 전 세계 도서 이용자의 참여로 이루어지는 사회적 목록 서비스인 Goodreads 리뷰 데이터를 대상으로 내용분석하였다. 이용자 선호의 내용을 보다 세부적인 관점에서 파악하기 위해 샘플 선정 과정에서 평점 그룹별, 도서별, 이용자별 하위 데이터 집합을 구성하였으며, 다양한 토픽을 고루 반영하기 위해 리뷰 텍스트의 토픽모델링 결과에 기반하여 층화 샘플링을 수행하였다. 그 결과, ‘내용’, ‘캐릭터’, ‘글쓰기’, ‘읽기’, ‘작가’, ‘스토리’, ‘형식’의 7개 범주에 속하는 총 90개 선호요인 관련 개념을 식별하는 한편, 평점에 따라 드러나는 일반적인 선호요인은 물론 호불호가 분명한 도서와 이용자에서 드러나는 선호요인의 양상을 파악하였다. 본 연구의 결과는 이용자 선호요인의 구체적 양상을 파악하여 향후 추천시스템 등에서 보다 정교한 추천에 기여할 수 있을 것으로 보인다.

Abstract

This study analyzed the contents of Goodreads review data, which is a social cataloging service with the participation of book users around the world, to identify the preference factors that affect book users’ book recommendations in the library information service environment. To understand user preferences from a more detailed point of view, sub-datasets for each rating group, each book, and each user were constructed in the sample selection process. Stratified sampling was also performed based on the result of topic modeling of review text data to include various topics. As a result, a total of 90 preference factors belonging to 7 categories(‘Content’, ‘Character’, ‘Writing’, ‘Reading’, ‘Author’, ‘Story’, ‘Form’) were identified. Also, the general preference factors revealed according to the ratings, as well as the patterns of preference factors revealed in books and users with clear likes and dislikes were identified. The results of this study are expected to contribute to more sophisticated recommendations in future recommendation systems by identifying specific aspects of user preference factors.

33
황성욱(전북대학교 기록관리학과) ; 정예용(전북대학교 기록관리학과) ; 김수정(전북대학교 문헌정보학과) ; 오효정(전북대학교 문헌정보학과) 2020, Vol.37, No.2, pp.23-45 https://doi.org/10.3743/KOSIM.2020.37.2.023
초록보기
초록

최근 ‘코로나19’라는 초유의 재난 사태를 맞이하여 대한민국 정부의 투명한 정보 공개를 통한 적극적 대응에 전 세계가 주목하고 있다. 이렇듯 공공데이터 개방은 특정 정보에 대한 국민의 인지도와 접근성을 높임으로써 다양한 사회적, 경제적 가치를 상승시키는 데 필수적이다. 본 연구는 정부차원에서 주도적으로 수집하고 공개하고 있는 공공데이터포털의 이용 활성화를 위해 각국에서 운영하고 있는 SNS 현황과 그에 따른 개선방안을 제안하고자 한다. 이를 위해 국내․외 공공데이터포털 SNS 운용현황을 살펴보고, 그 중 선진 사례 3국(인도, 미국, 한국)의 서비스를 선정하여 계량 분석, 피드백 분석, 시계열 분석, 정보유형 분석을 실시하였다. 분석결과를 통해 정보유형 및 이용요구를 파악하고 시사점을 도출하여 공공데이터 이용 활성화를 위한 구체적인 개선방안을 제언하였다.

Abstract

The world is paying attention to the South Korean government’s aggressive COVID-19 response, key of which is transparency and openness in sharing information. Opening up government information is essential to enhancing its social and economic value through increased awareness and accessibility. The purpose of this study is to investigate the current status of SNS operated by national open data portals in which government-collected and -disclosed data is available and to suggest improvements for the use of open data portals. To do this, the study compared 3 national open data portals, each from India, U.S.A, and Korea, by performing quantitative analysis, user feedback analysis, time-series analysis, and information type analysis. Based on the identified information types and user needs, the study suggests concrete ways to facilitate the use of open data portals.

34
백지연(전북대학교 일반대학원 기록관리학과) ; 오효정(전북대학교 문헌정보학과 부교수, 문화융복합아카이빙연구소 연구원) 2019, Vol.36, No.4, pp.183-205 https://doi.org/10.3743/KOSIM.2019.36.4.183
초록보기
초록

이용자의 정보요구를 파악하기 위한 다양한 방법 중 로그 분석 방법은 이용자의 실제 검색 행위를 사실적으로 반영하고, 대다수 이용자의 전반적인 이용행태를 분석할 수 있다. 이에 본 연구에서는 국가기록원 웹 포털서비스를 통해 입수된 대량의 질의로그 빅데이터를 기반으로 이용자의 정보요구를 파악하기 위해 1) 질의에 내포된 정보요구 유형별과 2) 검색결과로 제공한 기록 유형별 분석을 진행하였다. 분석에 활용한 질의로그는 국가기록원이 웹을 통해 검색서비스를 제공한 2007년부터 2018년 12월까지, 총 141개월 동안 수집된 월별 상위 100개 질의어 1,571,547개를 대상으로 하였다. 나아가 분석결과를 토대로 이용자 검색 만족도를 향상시킬 수 있는 개선방안을 제안하였다. 본 연구의 결과는 국가기록원 검색 서비스 개선 및 고도화를 위한 구체적이고 실질적 방안을 제시했다는 점에서 의의가 있다.

Abstract

Among the various methods for identifying users’s information needs, Log analysis methods can realistically reflect the users’ actual search behavior and analyze the overall usage of most users. Based on the large quantity of query log big data obtained through the portal service of the National Archives of Korea, this study conducted an analysis by the information type and search result type in order to identify the users’ information needs. The Query log used in analysis were based on 1,571,547 query data collected over a total of 141 months from 2007 to December 2018, when the National Archives of Korea provided search services via the web. Furthermore, based on the analysis results, improvement methods were proposed to improve user search satisfaction. The results of this study could actually be used to improve and upgrade the National Archives of Korea search service.

초록보기
초록

이 연구에서는 1990년부터 2018년까지 29년간의 도서관을 주제로 한 뉴스 기사 37,818 건을 대상으로 양적 분석과 내용분석을 통해 도서관에 대한 언론 보도 경향을 분석하였다. 이를 위해 먼저, 시기별, 주제별, 언론사 유형별 기준에 따라 언론 보도의 양적 변화 추이를 분석한 후, 키워드 빈도 분석과 언어 네트워크 분석을 통해 시기별 보도 내용의 변화 추이와 기사에 내재된 언론 프레임을 분석하였다. 분석 결과, 언론은 도서관의 정보제공 기능과 교육적 기능, 그리고 문화적 기능에 주된 관심을 보였으며, 언론의 관심 주제 변화 추이는 사서직 처우 문제를 제외하고는 대체적으로 도서관계 이슈의 변화 추이와 일치하는 것으로 나타났다. 마지막으로, 언론이 도서관 기사 보도에 대해 취하는 주된 태도는 보도기능과 광고기능인 것으로 나타났다.

Abstract

In this study, quantitative and content analysis was conducted on 37,818 news articles that were reported on the subject of ‘library’ for 29 years from 1990 to 2018 in order to analyze the tendency of media coverage about ‘library’. First, the quantitative change in media coverage was analyzed according to the criteria by time, subject and media type. In addition, keyword frequency analysis and semantic network analysis were conducted to analyze the trends of the contents of the press and the frames inherent in the press. The results showed that the media showed a major interest in the library’s informational, educational, and cultural functions, and the trend of the subject’s interest was generally consistent with that of the library community, except for the issue of librarianship. Lastly, the main attitudes that the media take toward the reporting of library articles were the reporting and advertising functions.

36
이정연(이화여자대학교 이화사회과학원) ; 전수현(우아한형제들 데이터애널리스트) 2020, Vol.37, No.2, pp.171-195 https://doi.org/10.3743/KOSIM.2020.37.2.171
초록보기
초록

본 연구는 대표적인 온라인 협업커뮤니티인 한국 위키피디아의 초기 2002년부터 2019년까지의 편집로그 빅데이터를 해체하여 공동협업과정을 시계열적으로 분석하였다. 공개된 오픈데이터의 표준화된 XML 문서편집 기록을 활용해 Phython과 R을 이용하여 분석 요소를 추출하여 이를 활용하였다. 연구 분석 결과 한국 위키피디아 편집자의 참여 방법, 데이터 내용의 특징, 문서 생성의 추이 등을 설명할 수 있었다. 소수 편집자들의 적극적 활동과 대다수 편집자들의 느슨한 참여도 밝혀졌으며, 온라인에서도 나타나는 사회 문화적 특징이 한국 위키피디아에서도 나타났다. 집단지성을 지속화시키기 위해서는 새롭고 다양한 외부자원이 필수인데 신규 진입자들이 공동편집 커뮤니티에 안착하기 위한 다각적인 고려가 필요하며, 관리자 그룹의 고착화를 탈피하여 순환구조를 통한 개방성이 필요함을 제언하였다.

Abstract

This study analyzed the collaborative process in time series by dismantling the edit log big data of Wikipedia Korea, a representative online collaboration community, from early 2002 to 2019. Analysis elements were extracted from the document edit records, formatted in standardized XML, and analyzed using Python and R. The ways of editors’ contribution, the characteristics of data contents, and the trend of document creation were explained by the analysis. An active contribution of a small set of editors and a loose participation of the majority were revealed. In addition, sociocultural characteristics that appear in online communities were also found in Wikipedia Korea. A new, diverse set of external resources is necessary to sustain the collective intelligence. An effort to settle new editors into the wikipedia community and an openness through circulation structure to avoid the exclusiveness of the management group are suggested.

37
이종욱(경북대학교 문헌정보학과) ; 강우진(경북대학교 일반대학원 문헌정보학과) ; 박중규(경북대학교 심리학과) 2021, Vol.38, No.4, pp.1-23 https://doi.org/10.3743/KOSIM.2021.38.4.001
초록보기
초록

본 연구에서는 베스트셀러 목록에 포함된 도서의 순위가 공공도서관에서의 평균 대출 건수에 미치는 영향을 패널분석을 통해 살펴보고자 하였다. 본 연구를 위해 문화 빅데이터 플랫폼을 통하여 국립중앙도서관이 제공하는 데이터를 바탕으로 2018년 1월 1일부터 2019년 12월 29일까지 총 104주 동안의 분석 대상 도서 179권의 공공도서관 대출 데이터 세트를 생성하였고, YES24 웹사이트를 통해 같은 기간 주간 베스트셀러 목록 데이터 세트를 구축하였다. 공공도서관 대출과 베스트셀러 도서 순위 간 정확한 관계를 확인하기 위해 패널자료의 특성을 활용한 분석 방식인 선형회귀모형, 고정효과모형, 확률효과모형 등 세 개의 모형을 비교한 결과, 고정효과모형이 가장 적합한 것으로 나타났다. 순위 데이터 결측값이 47주 미만인 179권의 도서의 자료를 고정효과모형으로 분석한 결과, 도서의 베스트셀러 순위가 한 단계 내려가면 공공도서관에서의 해당 도서 평균 대출 건수가 0.108권 유의미한 수준에서 감소한다는 것을 밝혀내었다. 또한, 베스트셀러 순위가 도서 평균 대출 건수에 미치는 효과가 도서의 내용분류에 따라 상이함을 알 수 있었다. 이 연구는 베스트셀러 순위가 사람들의 도서관 대출행태에 영향을 미치고 있음을 실증적으로 확인한 것으로, 공공도서관에서는 이용자의 요구를 예측하고, 장서 개발 정책 수립에 베스트셀러 목록을 비롯한 사회문화적 맥락을 고려할 필요가 있음을 시사한다.

Abstract

The purpose of this study is to analyze the effects of the bestseller ranks on the book circulations in public libraries. To achieve this goal, the weekly data sets of 179 books’ library circulation and bestseller list from January 1, 2018 to December 29, 2019 were constructed based on the data collected from BigData MarketC and YES24. Three methods for analyzing panel data including linear regression, fixed-effect, and random effect models were compared, and it turned out that fixed-effect model was better than other methods. The results show that the average ranks of bestsellers were associated with their public library circulations visually. Also, the analysis of fixed-effect model showed that the single rank decline of a book on the bestseller list decreases its average circulation of 0.108 while the size of effect varied depending on subject of books. The study empirically demonstrated the impact of a bestseller list on people’s book circulation behavior, suggesting that public libraries need to reference sociocultural context as well as bestseller book lists to predict library user needs and to formulate collection development policy.

38
정재민(한국과학기술정보연구원 오픈액세스센터 AccessON개발팀) ; 김완종(한국과학기술정보연구원 오픈액세스센터 AccessON개발팀) 2022, Vol.39, No.4, pp.75-97 https://doi.org/10.3743/KOSIM.2022.39.4.075
초록보기
초록

전통적인 학술 커뮤니케이션 체제의 문제점을 해결하기 위한 대안으로 오픈액세스 패러다임에 대한 국제적 관심과 확산이 지속되고 있다. 하지만 데이터 기반의 정량적인 방법을 통해 오픈액세스 분야의 글로벌한 동향이나 성장 추세를 파악하려는 노력은 아직까지 부족한 실정이다. 본 연구는 오픈액세스 분야의 학술논문 데이터에 토픽 모델링을 적용하여 세부 연구토픽을 식별하고, 성장곡선을 적합하여 각 연구토픽의 성숙도와 예상 잔여수명을 계산한다. 본 연구는 오픈 사이언스의 세 가지 핵심요소인 오픈액세스, 오픈데이터, 오픈협업과 관련된 14개 토픽들을 식별하였으며, 오픈액세스 분야가 앞으로 약 65년간 꾸준히 성장할 것으로 예상하였다. 본 연구의 분석 결과는 연구자들과 정책 의사결정자들이 오픈액세스 분야의 동향과 성장 추세를 이해하는 데 도움을 줄 수 있을 것으로 기대된다.

Abstract

To solve the problems of the traditional scholarly communication system, global interest in the open access paradigm continues. Nevertheless, there is still a lack of research to understand global research and growth trends in the field of open access through data-based quantitative methods. This study aims to identify which sub-fields exist in open access and analyze how long each research field will grow in the future. To this end, topic modeling and growth curve analysis were applied to global academic papers in the field of open access. This study identified 14 research topics related to open access, open data, and open collaboration, which are three key elements of open science, and foresaw that the field of open access will grow over the next 65 years. The results of this study are expected to support researchers and policymakers in understanding global research trends of open access.

39
박주현(전남대학교 문헌정보학과 조교수) ; 박현지(전남대학교 문헌정보학과 박사과정) ; 김영범(연세대학교 문헌정보학과 박사과정) 2024, Vol.41, No.1, pp.107-132 https://doi.org/10.3743/KOSIM.2024.41.1.107
초록보기
초록

이 연구에서는 한국언론진흥재단의 빅카인즈에서 제공하는 1990년부터 2022년까지 약 30년간의 5․18 관련 뉴스데이터를 빈도분석과 네트워크 분석하였다. 구체적으로 시기별과 지역별 기사량을 분석하여 양적 변화 추이를 살펴보았으며 동시 출현 키워드를 활용한 정부별 네트워크 분석을 통해 정부별 주요 키워드 간의 연결 구조를 탐색하였다. 분석 결과, 시기적으로는 사회적 이슈가 많았던 2019년의 보도량이 가장 많은 것으로 나타났으며 지역적으로는 전라권의 보도량이 가장 많은 것으로 나타났다. 그리고 네트워크 분석 결과, 정권이 5․18을 바라보는 인식과 정책에 따라 뉴스데이터 내 5․18과 관련된 단어에 차이가 있었다. 5․18 뉴스데이터 분석을 종합한 결과, 5․18이 지역과 상관없이 시간이 지남에 따라 민주화운동으로 자리매김해 나가고 있었으나 동시에 5․18에 대한 왜곡이 해소되지 못하고 있음을 확인하였다.

Abstract

This study attempted to analyze newspaper articles related to May 18 through frequency analysis and network analysis using news data related to May 18 for about 30 years from 1990 to 2022 at the Korea Press Foundation’s Big Kinds. Specifically, quantitative change trends were examined by analyzing the amount of articles by period and region, and the connection structure between major keywords by the regime was explored through network analysis by regime using co-appearance keywords. As a result of the analysis, it was found that 2019 had the largest amount of coverage, which had many social issues in time, and the Jeolla-do region had the largest amount of coverage in the region. And as a result of network analysis, there were differences in words related to May 18 in news data according to the perception and policy of the regime toward May 18. As a result of synthesizing the analysis of May 18 news data, it was confirmed that May 18 was becoming a democratic movement over time regardless of region, but at the same time, the distortion of May 18 was not resolved.

초록보기
초록

본 연구는 2004년에서 2014년까지 11년간의 KERIS 상호대차 트랜잭션 데이터를 대상으로 서비스 현황과 기간별 변화를 분석하였다. 연구 결과 발견한 주요 사실은 다음과 같다. 첫째, 4년제 대학도서관의 신청과 제공건수 사이에는 밀접한 상관관계가 있었으며, 타 관종의 경우 거의 관련이 없게 나타났다. 둘째, 상호대차 대상 자료는 주제별로 살펴보면 사회과학 분야 및 문학 분야가 상위를 차지하고 있었다. 언어별로는 영어 자료가 절반 가까이 차지하고 있었다. 셋째, 신청건수가 제공건수보다 많은 기관이 전체 중에서 약 60%를 차지하였으나, 4년제 대학도서관의 경우는 비교적 균형을 이루고 있었다. 넷째, 2012년을 기점으로 KERIS 상호대차 서비스는 모든 면에서 지속적으로 성장하고 있음을 보여주고 있다.

Abstract

This study aims to illustrate the current status and changes of interlibrary loan service in Korea. Transaction data of KERIS Interlibrary Loan (ILL) Service from 2004 to 2014 were analyzed and key findings include the following: 1) In case 4 year college libraries, there is a close correlation between requests and responses in the interlibrary loan, but there is none for other type of libraries. 2) Social science and literature were the most responded subject area of interlibrary loan materials. In the aspect of language, responses for English materials occupied almost half of all responses. 3) 60 percent of libraries, the number of outgoing requests exceeded the number of their responses to incoming requests. 4) After 2012, KERIS ILL service showed a steady progress in all aspects.

정보관리학회지