바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 데이터 요소, 검색결과: 54
초록보기
초록

디지털자원의 영구보존을 효율적으로 수행하기 위해서는 디지털자원의 고유의 속성과 변화를 설명해주는 지적 정보 즉 보존 메타데이터가 구조적으로 그리고 체계적으로 표기되어야 한다. 보존 메타데이터는 외부적/내부적 변화와 상관없이 사용자가 보다 쉽게 원하는 진본 데이터에 접근하여 검색할 수 있도록 하며 관리자는 보다 효율적으로 정보자원을 관리하고 보존할 수 있도록 한다. 따라서 202년 OAIS 참조모형(ISO 14721 )이 보존 메타데이터 표준을 권고한 이후 외국의 여러 국가 디지털도서관에서는 각 나라의 실정에 맞게 보존 메타데이것이다. 본 연구는 먼저 OAIS가 권고한 정보모델과 디지털자원의 장기적 보존을 위해서 외국 도서관에서 개발된 보존 메타데이터 요소세트에 대해서 비교 분석하였고, 우리나라 대학도서관에서는 어떻게 보존 메타데이터를 구축하고 활용하고 있으며, 어떠한 보존 메타데이터 요소들이 대학도서관에 적합한지를 조사하였다. 이를 기반으디지털자원의 보존 메타데이터 요소세트를 제안하였다.

Abstract

The preservation metadata which is defined the property and his tory of changes must be describes logically and structurally for implementing long-term digital preservation. The thentic digital resources and the managers of digital archives to manage and preserve more ef fectively the digital resources. his paper is review of recent developments relating to digital preservation metadata including f OAIS and outlines some library-based projects. Next, the paper investigates how to dev elop and use the preservation metadata in university libraries and what is the core preservat ion metadata elements. Finally, reservation metadata elements with broad aplicability to digital preservation in university libraries.

32
이용구(계명대학교) ; 김병규(한국과학기술정보연구원) 2011, Vol.28, No.1, pp.309-326 https://doi.org/10.3743/KOSIM.2011.28.1.309
초록보기
초록

기존 메타데이터의 품질 측정 방법은 오류가 발생한 레코드를 단순히 계수하여 그 비율로 품질을 측정하였다. 이러한 한계를 극복하기 위해 메타데이터 요소별로 상대적 중요 정도를 나타내는 가중치를 적용함으로서, 메타데이터 품질을 체계적으로 계량화 하는 측정 방법을 제시하고자 하였다. 구체적인 가중치 부여 방법으로 엔트로피, 이용자 과업, 그리고 이용 통계를 활용하였다. 또한 이들을 결합하여 통합 가중치를 제시하고 실제 서비스 되고 있는 학술지 기사 메타데이터에 적용하였다. 실험 결과, 엔트로피 가중치 방법은 데이터 자체의 특성을 잘 반영하며, 이용자 과업을 적용한 방법은 이용자의 정보요구를 해결하는 필요한 메타데이터 요소를 제시하며, 통합 가중치는 특정 메타데이터 요소의 오류에 영향을 받지 않으면서 균형 잡힌 측정값을 제시하여 계량화 방법에 적합한 것으로 나타났다.

Abstract

Most metadata quality measurement employ simple techniques by counting error records. This study presents a new quantitative measurement of metadata quality using advanced weighting schemes in order to overcome the limitations of exiting measurement techniques. Entropy, user tasks, and usage statistics were used to calculate the weights. Integrated weights were presented by combining these weights and were applied to actual journal article metadata. Entropy weights were found to reflect the characteristics of the data itself. User tasks presented the required metadata elements to solve user's information need. Integrated weights showed balanced measures without being affected by the influence of error elements, This finding indicates the new method being suitable for quantitative measurement of metadata quality.

33
고영만(성균관대학교) ; 조수련(성균관대학교) ; 박지영(성균관대학교) 2013, Vol.30, No.4, pp.111-131 https://doi.org/10.3743/KOSIM.2013.30.4.111
초록보기
초록

본 연구에서는 ‘학술지의 피인용횟수 순위’를 적용한 tapered h-지수의 변형지표 Kor-hT를 고안하여 제안하였다. Kor-hT의 의미를 평가하기 위하여 Kor-hT 지수 값의 중복률 및 지수 값과 평가요소 사이의 연관성 변화를 다른 학술지 평가지표인 h-지수, tapered h-지수 및 IF와 비교 분석하였다. 지수 값의 중복률 분석은 지표의 변별력을 살펴보기 위한 것이며, 지수 값과 평가요소와의 상관관계 분석은 지표의 평가요소인 피인용횟수 및 논문 수가 지수 값에 각각 어떻게 반영되는지를 알아보기 위한 것이다. 분석을 위해 2008년부터 2010년까지의 한국학술지인용색인(KCI) 3개년 데이터를 사용하였다. 분석 결과 본 연구에서 제안한 Kor-hT가 비교 대상 지표에 비해 지수 값의 중복률이 가장 낮아 높은 변별력을 보였으며, 지수 값과 평가요소와의 상관관계에 있어서도 피인용횟수와 논문 수 모두에서 상관관계가 가장 높은 것으로 나타났다.

Abstract

This study describes the meaning of and the formula for Kor-hT, which is a modified index built on the tapered h-index by applying ‘the ranking according to the number of citations of journals’. This study evaluated the de-duplication rate of index values of Kor-hT and analyzed the change in the correlation between the index values and evaluation elements using the Korea Citation Index data from 2008 to 2010. Kor-hT is compared with h-index, tapered h-index, and IF. As a result, Kor-hT appeared to be superior to other indexes on de-duplication rate. It is also shown that there is a very strong positive correlation between the evaluation elements, the number of citations and the number of articles of journals, and the index values of Kor-hT.

34
정재민(한국과학기술정보연구원 오픈액세스센터 AccessON개발팀) ; 김완종(한국과학기술정보연구원 오픈액세스센터 AccessON개발팀) 2022, Vol.39, No.4, pp.75-97 https://doi.org/10.3743/KOSIM.2022.39.4.075
초록보기
초록

전통적인 학술 커뮤니케이션 체제의 문제점을 해결하기 위한 대안으로 오픈액세스 패러다임에 대한 국제적 관심과 확산이 지속되고 있다. 하지만 데이터 기반의 정량적인 방법을 통해 오픈액세스 분야의 글로벌한 동향이나 성장 추세를 파악하려는 노력은 아직까지 부족한 실정이다. 본 연구는 오픈액세스 분야의 학술논문 데이터에 토픽 모델링을 적용하여 세부 연구토픽을 식별하고, 성장곡선을 적합하여 각 연구토픽의 성숙도와 예상 잔여수명을 계산한다. 본 연구는 오픈 사이언스의 세 가지 핵심요소인 오픈액세스, 오픈데이터, 오픈협업과 관련된 14개 토픽들을 식별하였으며, 오픈액세스 분야가 앞으로 약 65년간 꾸준히 성장할 것으로 예상하였다. 본 연구의 분석 결과는 연구자들과 정책 의사결정자들이 오픈액세스 분야의 동향과 성장 추세를 이해하는 데 도움을 줄 수 있을 것으로 기대된다.

Abstract

To solve the problems of the traditional scholarly communication system, global interest in the open access paradigm continues. Nevertheless, there is still a lack of research to understand global research and growth trends in the field of open access through data-based quantitative methods. This study aims to identify which sub-fields exist in open access and analyze how long each research field will grow in the future. To this end, topic modeling and growth curve analysis were applied to global academic papers in the field of open access. This study identified 14 research topics related to open access, open data, and open collaboration, which are three key elements of open science, and foresaw that the field of open access will grow over the next 65 years. The results of this study are expected to support researchers and policymakers in understanding global research trends of open access.

35
이정연(이화여자대학교 이화사회과학원) ; 전수현(우아한형제들 데이터애널리스트) 2020, Vol.37, No.2, pp.171-195 https://doi.org/10.3743/KOSIM.2020.37.2.171
초록보기
초록

본 연구는 대표적인 온라인 협업커뮤니티인 한국 위키피디아의 초기 2002년부터 2019년까지의 편집로그 빅데이터를 해체하여 공동협업과정을 시계열적으로 분석하였다. 공개된 오픈데이터의 표준화된 XML 문서편집 기록을 활용해 Phython과 R을 이용하여 분석 요소를 추출하여 이를 활용하였다. 연구 분석 결과 한국 위키피디아 편집자의 참여 방법, 데이터 내용의 특징, 문서 생성의 추이 등을 설명할 수 있었다. 소수 편집자들의 적극적 활동과 대다수 편집자들의 느슨한 참여도 밝혀졌으며, 온라인에서도 나타나는 사회 문화적 특징이 한국 위키피디아에서도 나타났다. 집단지성을 지속화시키기 위해서는 새롭고 다양한 외부자원이 필수인데 신규 진입자들이 공동편집 커뮤니티에 안착하기 위한 다각적인 고려가 필요하며, 관리자 그룹의 고착화를 탈피하여 순환구조를 통한 개방성이 필요함을 제언하였다.

Abstract

This study analyzed the collaborative process in time series by dismantling the edit log big data of Wikipedia Korea, a representative online collaboration community, from early 2002 to 2019. Analysis elements were extracted from the document edit records, formatted in standardized XML, and analyzed using Python and R. The ways of editors’ contribution, the characteristics of data contents, and the trend of document creation were explained by the analysis. An active contribution of a small set of editors and a loose participation of the majority were revealed. In addition, sociocultural characteristics that appear in online communities were also found in Wikipedia Korea. A new, diverse set of external resources is necessary to sustain the collective intelligence. An effort to settle new editors into the wikipedia community and an openness through circulation structure to avoid the exclusiveness of the management group are suggested.

36
박진호(주식회사 리스트 사업개발본부장) ; 고영만(성균관대학교 문과대학 문헌정보학과 교수) ; 김현수(성균관대학교 정보관리연구소 연구원) 2019, Vol.36, No.4, pp.129-159 https://doi.org/10.3743/kosim.pub.36.4.129001
초록보기
초록

본 연구의 목적은 연구데이터 서비스 자체의 유용성과 연구데이터에 대한 사용경험 기반의 유용성 측면에서 평가 모형을 개발하는 것이다. 다양한 사례에서 도출한 데이터 서비스의 유용성 평가 요소로부터 연구데이터에 내재된 평가척도인 검색성, 접근성, 상호운용성, 재활용성 4개와 각각의 측정지표 총 20개를 도출하였다. 그리고 Google Analytics, YouTube 광고료 책정 기준, 서울특별시, Altmetrics의 사례를 분석하여 연구데이터에 대한 이용자 경험 기반의 유용성 측정지표 12개를 도출하였다. 평가척도와 측정지표에 대한 타당성과 신뢰성 검정을 위해 연구데이터의 잠재적 이용자 164명을 대상으로 설문조사를 실시하였다. 평가척도의 타당성 검정을 위해 KMO Bartlett 분석을 하였으며, 측정지표의 성분분석을 위해 주성분 분석과 베리맥스 회전분석법을 사용하였다. 내재적 평가척도의 경우 4개 척도 모두 KMO Bartlett의 타당성 값을 충족시켰으며, 평가척도에 대한 측정지표의 성분분석 결과 모두 단일 성분으로 나타나 현재의 척도로 해당 지표에 대한 설명이 가능하였다. 그러나 이용자 경험 기반의 12개 측정지표의 성분분석 결과는 2개 성분으로 나누어지는 것으로 나타나 각각을 활용도와 참여도라는 개념의 2개 평가척도로 구분하였다. Cronbach’s alpha 계수에 의한 신뢰도 측정 결과 6개의 평가척도 모두 0.6 이상의 측정치를 충족시키는 것으로 나타났다.

Abstract

The Purpose of this study is to develop an evaluation model for usability of research data service from the angles of evaluating usefulness of research data service itself and research data use experience-based usability. First, the various cases of evaluating usability of data services are examined and 4 rating scales and 20 measuring indicators for research data service are derived as a result of comparative analysis. In order to verify validity and reliability of the rating scale and the measuring indicators, the study conducted a survey of 164 potential research data users. KMO Bartlett Analysis was performed for validity test, and Principle Component Analysis and Verimax Rotating Method were used for component analysis on measuring indicators. The result shows that the 4 intrinsic rating scales satisfy the validity criteria of KMO Barlett; A single component was determined from component analysis, which verifies the validity of measuring indicators of the current rating scale. However, the result of 12 user experience-based measuring indicators analysis identified 2 components that are each classified as rating scale of utilization level and that of participation level. Cronbach’s alpha of all 6 rating scales was 0.6 or more for the overall scale.

37
정우진(성균관대학교 문헌정보학과) ; 김규리(성균관대학교 문헌정보학과) ; 유승희(성균관대학교) ; 주영준(성균관대학교) 2021, Vol.38, No.4, pp.113-128 https://doi.org/10.3743/KOSIM.2021.38.4.113
초록보기
초록

본 연구는 코로나바이러스감염증-19(이하 코로나바이러스) 백신에 대한 사회적 의견을 파악하기 위해 트위터에서 작성된 백신 관련 게시물들을 분석하였다. 2020년 3월 16일부터 2021 3월 15일까지 1년간 트위터에서 작성된 코로나바이러스 백신 이름을 키워드로 포함한 45,413개의 게시물을 수집하여 분석하였다. 데이터 수집을 위해 활용된 코로나바이러스 백신 키워드는 총 12개이며, 수집된 게시물 수순으로 ‘화이자’, ‘아스트라제네카’, ‘모더나’, ‘얀센’, ‘노바백스’, ‘시노팜’, ‘시노백’, ‘스푸트니크’, ‘바라트’, ‘캔시노’, ‘추마코프’, ‘벡토르’이다. 수집된 게시물들은 수기와 자동화된 방법을 동시 활용하여 키워드 분석, 감성 분석, 및 토픽모델링을 통하여 백신들에 대한 의견을 탐색하였다. 연구결과에 따르면 전반적으로 백신에 대한 부정적인 반응이 많았으며, 백신 접종 후유증에 대한 불안 및 백신의 효능에 대한 불신이 백신들에 대한 부정적인 주요 요소로 파악되었다. 이와는 반대로, 백신 접종에 따른 코로나바이러스 확산 억제에 대한 기대감이 백신에 대한 긍정적인 사회적 요소인 것을 확인할 수 있었다. 본 연구는 기존의 선행연구들이 뉴스 등 대중매체 데이터를 통해 코로나바이러스 백신에 대한 사회적 분위기를 파악하고자 했던 것과 달리, 소셜 미디어 데이터 수집 및 이를 활용한 키워드 분석, 감성 분석, 토픽 모델링 등의 여러 분석방법들을 사용하여 대중들의 의견을 파악하는 것으로 학술적 의의를 지닌다. 또한, 본 연구의 결과는 백신에 대한 사회적 분위기를 반영한 백신 접종 권장 정책 수립 기여라는 실질적 함의를 시사한다.

Abstract

In this study, we aimed to understand the public opinion on COVID-19 vaccine. To achieve the goal, we analyzed COVID-19 vaccine-related Twitter posts. 45,413 tweets posted from March 16, 2020 to March 15, 2021 including COVID-19 vaccine names as keywords were collected. The 12 vaccine names used for data collection included ‘Pfizer’, ‘AstraZeneca’, ‘Modena’, ‘Jansen’, ‘NovaVax’, ‘Sinopharm’, ‘SinoVac’, ‘Sputnik V’, ‘Bharat’, ‘KhanSino’, ‘Chumakov’, and ‘VECTOR’ in the order of the number of collected posts. The collected posts were analyzed manually and automatedly through keyword analysis, sentiment analysis, and topic modeling to understand the opinions for the investigated vaccines. According to the results, there were generally more negative posts about vaccines than positive posts. Anxiety about the aftereffects of vaccination and distrust in the efficacy of vaccines were identified as major negative factors for vaccines. On the contrary, the anticipation for the suppression of the spread of coronavirus following vaccination was identified as a positive social factor for vaccines. Different from previous studies that investigated opinions about COVID-19 vaccines through mass media data such as news articles, this study explores opinions of social media users using keyword analysis, sentiment analysis, and topic modeling. In addition, the results of this study can be used by governmental institutions for making policies to promote vaccination reflecting the social atmosphere.

38
이원경(한성대학교 지식정보학부) ; 서은경(한성대학교) 2016, Vol.33, No.2, pp.77-102 https://doi.org/10.3743/KOSIM.2016.33.2.077
초록보기
초록

공연예술 콘텐츠의 효과적인 검색은 특화된 메타데이터를 근간으로 다양한 접근점을 제공할 때 이루어진다. 본 연구는 이용자가 찾고자하는 공연예술 콘텐츠에 대한 정확한 지식이 없더라도 쉽게 콘텐츠를 효율적으로 찾을 수 있는 검색 시스템을 개발하는데 목적이 있다. 이를 위하여 본 연구는 공연예술 국내외 사이트가 제공하고 있는 접근점 요소와 내비게이션 요소를 파악하고 연극, 무용 음악을 전공하는 대학생들이 원하는 공연예술 검색 접근점 및 브라우징 요소를 분석하였다. 이와 같은 분석을 토대로 공연예술 콘텐츠 검색에 적합한 9개 패싯요소 즉, ‘공연예술장르’, ‘공연예술가’, ‘공연예술단체’, ‘자료유형’, ‘언어’, ‘주대상관객’, ‘이벤트’, ‘장소’, ‘시기’를 제안하였다. 또한, 다각적인 패싯 내비게이션이 가능하도록 공연예술 콘텐츠 기술요소 27개를 선정하였고 내비게이션이 이루어질 수 있는 인터페이스를 설계하였다. 이를 근거로 하여 3,360건의 실험 데이터를 구축하고 실제 검색 시스템을 구축하였다. 마지막으로 전문가의 심층 인터뷰 결과, 본 연구에서 구축한 시스템이 이용자가 원하는 패싯을 제공하여 만족스러운 브라우징을 수행할 수 있었으며 정보조우가 가능한 인터페이스임을 증명하였다. 공연예술 도메인에서 패싯 내비게이션 검색 기법의 응용은 이용자의 요구를 충족시키며 더 나아가 공연예술 정보에의 접근 및 활용에 도움을 줄 수 있을 것으로 본다.

Abstract

The effective searching for performing arts contents can be achieved by providing various access points and searching methods based on specialized metadata. The purpose of this study is to develop a faceted navigation interface which user could effectively and efficiently retrieve performing arts contents even if the users do not know accurate descriptive information about them. Therefore, the study, first, investigated search access points and navigation items providing by other the performing arts retrieval systems and to analyze information seeking behaviors of university students who major in music, dance and theater. And then, the study proposed the 36 facets with the 9 main facet categories suitable for performing arts and also proposed 27 descriptive elements suitable for performing arts contents. Finally, the study developed the performing arts contents retrieval system based faceted navigation interface with 3,360 experimental data and conducted an in-depth interview in terms of usability, serendipity, and efficiency. The applying the faceted navigations for searching performing arts contents will help users access and utilize them in the retrieval system and moreover satisfy user demands.

초록보기
초록

본 연구는 공공도서관에서 어린이를 대상으로 진행하는 독서프로그램의 성과를 측정하기 위한 프레임워크 개발을 목적으로 한다. 프레임워크 개발을 위한 이론적 토대로 성과 평가에 기반 한 로직모델을 적용하였다. 로직모델의 요소로 제안된 6개 요소 중에서 가정과 외부적 요인을 제외한 투입, 활동, 산출, 성과 요인을 중심으로 프로그램 평가 프레임워크를 개발하였다. 연구결과로, 서울 시내 한 공공도서관에서 연구기간 동안 진행된 4개의 프로그램에 대한 평가 프레임워크와 성과측정을 위한 지표를 제안하였다. 프로그램별로 다양한 성과지표의 개발이 가능하지만 본 연구에서는 도서관 데이터를 기반으로 측정 가능한 지표를 중심으로 제안하였다. 본 연구 결과가 사례 연구로 진행되었지만 대상 프로그램이 공공도서관에서 일반적으로 진행하는 프로그램이라는 점에서 타 도서관의 어린이 대상 프로그램의 평가 프레임워크로 활용될 수 있을 것으로 기대된다.

Abstract

The purpose of this study is to develop frameworks for evaluating reading programs for children provided by a public library. Logic Model based on outcome evaluations was applied for the framework development. While the logic model is generally composed of six factors, the frameworks developed in this study has four factors including input, activity, output, and outcome. Additionally, this study suggests outcome indicators which were driven from library data. Even though the evaluation frameworks were developed from specific programs operated by a public library, those might be able to be used to evaluate other libraries’ programs for children since the target programs are commonly provided by public libraries.

초록보기
초록

국내 학술연구의 동향을 구체적으로 파악하여 연구개발 활동의 체계적인 지원 및 평가는 물론 현재와 미래의 연구 방향을 설정할 수 있는 기초 데이터로서, 개별 학술지 논문에 표준화된 주제 범주(통제키워드)를 부여할 수 있는 효율적인 방안을 모색하였다. 이를 위해 한국연구재단 「학술연구분야분류표」 상의 분류 범주를 국내 학술지 논문에 자동 할당하는 과정에서, 자질선정 기법을 중심으로 자동분류의 성능에 영향을 미치는 주요 요소들에 대한 다각적인 실험을 수행하였다. 그 결과, 실제 환경의 불균형 데이터세트(imbalanced dataset)인 국내 학술지 논문의 자동분류에서는 보다 단순한 분류기와 자질선정 기법, 그리고 비교적 소규모의 학습집합을 사용하여 상당히 좋은 수준의 성능을 기대할 수 있는 것으로 나타났다.

Abstract

As basic data that can systematically support and evaluate R&D activities as well as set current and future research directions by grasping specific trends in domestic academic research, I sought efficient ways to assign standardized subject categories (control keywords) to individual journal papers. To this end, I conducted various experiments on major factors affecting the performance of automatic classification, focusing on feature selection techniques, for the purpose of automatically allocating the classification categories on the National Research Foundation of Korea’s Academic Research Classification Scheme to domestic journal papers. As a result, the automatic classification of domestic journal papers, which are imbalanced datasets of the real environment, showed that a fairly good level of performance can be expected using more simple classifiers, feature selection techniques, and relatively small training sets.

정보관리학회지