바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Data Quality, 검색결과: 35
초록보기
초록

본 연구에서는 공기업의 지식관리 영향요인, 지식관리 활동과 그 성과 간의 구조적 관계를 파악하고자 하였다. 이를 위해 본 연구는 정부기관 중 지식관리를 최초로 도입한 기관이자 공공부문 지식관리의 선도기관으로 평가받고 있는 한국철도공사 직원들을 대상으로 한 설문조사를 통해 실증분석을 시도하였다. 가설검증 결과, 지식관리 영향요인으로는 학습지향문화와 지식품질, KMS 품질 등이 지식창출 및 공유 활동 모두에 유의미한 영향요인으로 검증되었으며, 개인태도는 지식창출 활동에만 유의미한 영향을 미치는 것으로 나타났다. 또한 지식창출은 지식공유 활동에 유의미한 영향을 미치는 것으로 나타났으며, 지식창출과 지식공유 모두 성과에 유의미한 영향을 미치는 것으로 나타났다. 이러한 분석결과를 토대로 본 연구에서는 지식창출 및 공유 활성화 방안을 제시하였다.

Abstract

The purpose of this study is to examine the causal relationships among knowledge management(KM) influence factors(leadership, learning culture, member' attitude, reward, knowledge quality, KMS quality), KM activities(knowledge creation, knowledge sharing), KM performance in public enterprise. The results of data analysis by structured equation model(SEM) indicate that learning culture, knowledge quality and KMS quality significantly influence the knowledge creation and sharing. Member' attitude has significant influences on the knowledge creation. And knowledge creation and sharing have a significant affect on KM performance. Based on the results, the potential implications of the strategy for effective knowledge management are discussed.

12
김인후(중앙대학교 문헌정보학과 대학원) ; 김성희(중앙대학교 문헌정보학과) 2022, Vol.39, No.3, pp.293-310 https://doi.org/10.3743/KOSIM.2022.39.3.293
초록보기
초록

본 연구에서는 한국어 데이터로 학습된 BERT 모델을 기반으로 문헌정보학 분야의 문서를 자동으로 분류하여 성능을 분석하였다. 이를 위해 문헌정보학 분야의 7개 학술지의 5,357개 논문의 초록 데이터를 학습된 데이터의 크기에 따라서 자동분류의 성능에 어떠한 차이가 있는지를 분석, 평가하였다. 성능 평가척도는 정확률(Precision), 재현율(Recall), F 척도를 사용하였다. 평가결과 데이터의 양이 많고 품질이 높은 주제 분야들은 F 척도가 90% 이상으로 높은 수준의 성능을 보였다. 반면에 데이터 품질이 낮고 내용적으로 다른 주제 분야들과 유사도가 높고 주제적으로 확실히 구별되는 자질이 적을 경우 유의미한 높은 수준의 성능 평가가 도출되지 못하였다. 이러한 연구는 미래 학술 문헌에서 지속적으로 활용할 수 있는 사전학습모델의 활용 가능성을 제시하기 위한 기초자료로 활용될 수 있을 것으로 기대한다.

Abstract

In this study, we analyzed the performance of the BERT-based document classification model by automatically classifying documents in the field of library and information science based on the KoBERT. For this purpose, abstract data of 5,357 papers in 7 journals in the field of library and information science were analyzed and evaluated for any difference in the performance of automatic classification according to the size of the learned data. As performance evaluation scales, precision, recall, and F scale were used. As a result of the evaluation, subject areas with large amounts of data and high quality showed a high level of performance with an F scale of 90% or more. On the other hand, if the data quality was low, the similarity with other subject areas was high, and there were few features that were clearly distinguished thematically, a meaningful high-level performance evaluation could not be derived. This study is expected to be used as basic data to suggest the possibility of using a pre-trained learning model to automatically classify the academic documents.

13
이용구(계명대학교) ; 김병규(한국과학기술정보연구원) 2011, Vol.28, No.1, pp.309-326 https://doi.org/10.3743/KOSIM.2011.28.1.309
초록보기
초록

기존 메타데이터의 품질 측정 방법은 오류가 발생한 레코드를 단순히 계수하여 그 비율로 품질을 측정하였다. 이러한 한계를 극복하기 위해 메타데이터 요소별로 상대적 중요 정도를 나타내는 가중치를 적용함으로서, 메타데이터 품질을 체계적으로 계량화 하는 측정 방법을 제시하고자 하였다. 구체적인 가중치 부여 방법으로 엔트로피, 이용자 과업, 그리고 이용 통계를 활용하였다. 또한 이들을 결합하여 통합 가중치를 제시하고 실제 서비스 되고 있는 학술지 기사 메타데이터에 적용하였다. 실험 결과, 엔트로피 가중치 방법은 데이터 자체의 특성을 잘 반영하며, 이용자 과업을 적용한 방법은 이용자의 정보요구를 해결하는 필요한 메타데이터 요소를 제시하며, 통합 가중치는 특정 메타데이터 요소의 오류에 영향을 받지 않으면서 균형 잡힌 측정값을 제시하여 계량화 방법에 적합한 것으로 나타났다.

Abstract

Most metadata quality measurement employ simple techniques by counting error records. This study presents a new quantitative measurement of metadata quality using advanced weighting schemes in order to overcome the limitations of exiting measurement techniques. Entropy, user tasks, and usage statistics were used to calculate the weights. Integrated weights were presented by combining these weights and were applied to actual journal article metadata. Entropy weights were found to reflect the characteristics of the data itself. User tasks presented the required metadata elements to solve user's information need. Integrated weights showed balanced measures without being affected by the influence of error elements, This finding indicates the new method being suitable for quantitative measurement of metadata quality.

14
문병석(성균관대학교) ; 이건창(성균관대학교) ; 조창현(성균관대학교) ; 강신장(성균관대학교) 2007, Vol.24, No.1, pp.227-250 https://doi.org/10.3743/KOSIM.2007.24.1.227
초록보기
초록

온라인 커뮤니티 사이트는 최근 크게 발전하고 있다. 그 이유는 인터넷이 개인생활 속에 깊숙이 침투하면서 사회 연결망, 즉 social networking 현상이 활성화되고 그에 따라 많은 사용자들이 특정 온라인 커뮤니티 사이트에서 다양한 정보활동을 하고 있기 때문이다. 본 연구에서는 이러한 온라인 커뮤니티 사이트에 대한 중개자 신뢰와 시스템 신뢰가 해당 커뮤니티 내에서의 포럼활동에 대한 신뢰 및 정보품질 만족에 미치는 영향에 관한 실증분석을 하고자 한다. 실증분석을 위한 자료수집은 삼성경제연구소의 온라인 커뮤니티 사이트인 SERI ( HYPERLINK "http://www.seri.org" www.seri.org)를 대상으로 하였으며, 해당 SERI 사이트 내에서 SERI 포럼활동을 하고 있는 사용자들을 대상으로 하여 591명의 유의한 설문자료를 수집하였다. 실증분석결과 다음과 같은 결과를 얻을 수 있었다. 첫째, SERI의 중개자 신뢰와 시스템 신뢰는 해당 SERI 포럼의 정보품질과 시스템품질, 그리고 인지효과성에 긍정적인 영향을 준다. 둘째, SERI의 중개자 신뢰는 해당 SERI 포럼의 인지위험을 줄이는데 기여를 한다. 반면, SERI의 시스템 신뢰는 해당 SERI 포럼의 인지위험에는 유의한 영향을 주지 못한다. 이는 아무리 온라인 커뮤니티 사이트의 지명도가 높다고 하더라도 이는 해당 온라인 커뮤니티 내의 포럼 사용자가 느끼는 인지위험에는 유의한 영향을 주지 못하다는 것을 의미한다. 셋째, 그러나 SERI의 중개자 신뢰와 시스템 신뢰가 높을수록 해당 SERI 포럼의 신뢰와 정보품질만족에는 긍정적인 영향을 준다.

Abstract

With the advent of social networking activity on the Internet, online community sites are becoming more popular. The main purpose of this study is to empirically investigate the influence of intermediary trust and system trust on the forum activity trust and information quality satisfaction. We assume that the intermediary trust and system trust come from the online community site itself, while the forum activity is made within a specific forum allowed on the online community site, and therefore forum activity trust and information quality satisfaction are related to a specific forum. The 591 valid questionnaire data were gathered from the users acting in forums allowed on the Samsung Economic Research Institute (SERI) (www.seri.org). The empirical results are as follows. First, the SERI intermediary trust and its system trust have positive influence on the SERI forum information quality system quality, and perceived effectiveness. Second, the SERI intermediary trust contributes to reducing the SERI forum perceived risks, while the SERI system quality does not. Third, the higher the SERI intermediary trust is, the higher the SERI forum trust and information quality satisfaction increase.

15
정은경(이화여자대학교 사회과학대학 문헌정보학과 교수) 2020, Vol.37, No.1, pp.153-177 https://doi.org/10.3743/KOSIM.2020.37.1.153
초록보기
초록

오픈과학의 흐름에서 데이터 공유와 재이용은 중요한 연구자의 활동이 되어가고 있다. 데이터 공유와 재이용에 관한 여러 논의 중에서 데이터학술지와 데이터논문의 발간이 가시적인 결과를 보여주고 있다. 데이터학술지는 여러 학문 분야에서 발간되고 있으며, 논문의 수도 점차 증가하고 있다. 데이터논문은 데이터 자체와는 다르게 인용을 주고 받는 활동이 포함되어, 따라서 이들이 형성하는 고유한 지적구조가 생겨나게 된다. 본 연구는 데이터학술지와 데이터논문이 학술커뮤니티에서 구성하는 지적구조를 규명하고자 Web of Science에 색인된 14종의 데이터학술지와 6,086건의 데이터논문과 인용된 참고문헌 84,908건을 분석하였다. 저자사항과 함께 동시인용분석과 서지결합분석을 네트워크로 시각화하여 데이터논문이 형성한 세부 주제 분야를 규명하였다. 분석결과, 저자, 저자소속기관, 국가를 추출하여 출현빈도를 살펴보면, 전통적인 학술지 논문과 다른 양상을 보인다. 이러한 결과는 데이터의 생산이 용이한 기관과 국가에 주로 데이터논문을 출간하기 때문이라고 해석될 수 있다. 동시인용분석와 서지결합분석 모두 분석도구, 데이터베이스, 게놈구성 등이 주된 세부 주제 영역으로 나타났다. 동시인용분석결과는 9개의 군집으로 형성되었는데, 특정 주제 분야로 나타난 영역은 수질과 기후 등의 분야이다. 서지결합분석은 총 27개의 컴포넌트로 구성되었는데, 수질, 기후 이 외에도 해양, 대기 등의 세부 주제 영역이 파악되었다. 특기할만한 사항으로는 사회과학 분야의 주제 영역도 나타났다는 점이다.

Abstract

In the context of open science, data sharing and reuse are becoming important researchers’ activities. Among the discussions about data sharing and reuse, data journals and data papers shows visible results. Data journals are published in many academic fields, and the number of papers is increasing. Unlike the data itself, data papers contain activities that cite and receive citations, thus creating their own intellectual structures. This study analyzed 14 data journals indexed by Web of Science, 6,086 data papers and 84,908 cited references to examine the intellectual structure of data journals and data papers in academic community. Along with the author’s details, the co-citation analysis and bibliographic coupling analysis were visualized in network to identify the detailed subject areas. The results of the analysis show that the frequent authors, affiliated institutions, and countries are different from that of traditional journal papers. These results can be interpreted as mainly because the authors who can easily produce data publish data papers. In both co-citation and bibliographic analysis, analytical tools, databases, and genome composition were the main subtopic areas. The co-citation analysis resulted in nine clusters, with specific subject areas being water quality and climate. The bibliographic analysis consisted of a total of 27 components, and detailed subject areas such as ocean and atmosphere were identified in addition to water quality and climate. Notably, the subject areas of the social sciences have also emerged.

16
김성훈(성균관대학교) ; 오삼균(성균관대학교) 2015, Vol.32, No.2, pp.193-219 https://doi.org/10.3743/KOSIM.2015.32.2.193
초록보기
초록

온톨로지의 평가는 잘 구축된 기존 온톨로지와 비교하는 방법, 활용될 애플리케이션에 적용해보는 방법, 원천데이터와의 적합성․관련성을 판단해보는 방법을 통해 이뤄지고 있다. 이와 같은 방법론은 온톨로지를 통해 얻게 된 결과에 치중되어 온톨로지의 체계, 의미표현, 상호운용성과 같은 내재적인 영역의 평가에 어려움이 있다. 본 연구는 온톨로지 전문가를 통해 온톨로지 품질평가를 위한 항목을 도출하였다. 문헌조사를 통해 온톨로지의 내재적 평가를 위한 범주를 추출하였고, 각 범주에 대한 평가항목을 델파이조사를 통해 전문가들에게 수집한 뒤, 수집된 평가항목을 재검증하였다. 그 결과, 처음 수집된 70개의 평가 항목에서 최종적으로 53개의 평가항목을 선정하였다. 또한 수집된 평가항목을 온톨로지 평가에 활용하여 봄으로써 평가항목의 신뢰도를 측정하였다.

Abstract

The focus of traditional evaluations of ontologies is largely performance-based. A comparison of a new ontology with well-established ones, testing of ontologies in different applications, as well as any judgment of an ontology’s appropriateness and relatedness to source data heavily rely on what results that ontology seems to manifest. This study, on the other hand, is an attempt to evaluate the quality of a particular ontology as manifested by its structure, representation, and interoperability. To that end, major categories of quality evaluations were first identified through an extensive survey of literature. Evaluation questions were formulated from these categories using the Delphi method and were validated by ontology experts. The entire process produced a set of 53 evaluation questions, which was then employed to test the quality of a newly-developed smartphone ontology.

17
김희섭(경북대학교) ; 박용재(한국전자통신연구원) 2004, Vol.21, No.4, pp.153-171 https://doi.org/10.3743/KOSIM.2004.21.4.153
초록보기
초록

정보시스템 효과측정은 시스템 운영과 투자에 대한 가치와 효율을 이해하는데 있어서 매우 중요한 것이며, 이를 위한 방법 중의 하나는 이용자 만족지수 측정이다. 본 연구의 목적은 정보시스템의 이용자만족지수를 측정하기 위한 적정한 모형을 제안하고 개발된 모형을 사용하여 이용자만족지수를 측정하는 것이다. 마케팅 분야와 정보시스템 분야의 대표적인 이론들과 모형들을 근간으로 정보시스템의 이용자만족지수 측정모형을 제안하고 구조방정식 모형 분석을 통해 모형을 검증하였다. 이 모형은 정보품질, 서비스품질, 시스템품질, 이용자만족의 네 가지 기본적인 차원과 이용자충성도와 이용자불평의 두 가지 부가적인 차원으로 구성하였다. 제안된 모형을 사용하여 정보통신부 산하 기관인 정보통신연구진흥원(IITA) 기술정책정보단에서 운영되고 있는 ITFIND의 이용자를 대상으로 이용자만족지수를 직접 측정하였고, 그 결과를 토대로 향후의 시스템 개선을 위한 몇몇 전략 및 방안들을 제시하였다.

Abstract

The measurement of information system (IS) effectiveness is critical to understanding of the value and efficacy of IS actions and IS investments. In this paper, we propose a new model of the user satisfaction index for ISs and present the user satisfaction index which is measured by the proposed model. Based on the representative theories and models in the field of marketing and IS, we propose a new user satisfaction index model and verify the new model through the analysis of structural equation model. The proposed model consists of four basic dimensions: information quality, service quality, systems quality, and user satisfaction. Also, users' royalty and complaint are adopted as the additional dimension in this model. Data was collected from the ITFIND users to measure their satisfaction index. We, then, suggest some strategic guidelines for the better ITFIND which may useful when the system designers consider upgrading of the system in the future.

초록보기
초록

본 연구에서는 셀프 아카이빙(self-archiving)을 기본으로 메타데이터가 구축되는 기관 리포지터리의 인명 검색 문제점을 해결하고자, 인명 접근점제어 데이터를 구축하였다. 이를 위해 기존 도서관의 전거데이터를 활용하면서도 전거형을 인정하지 않고, 정보원에 기재된 형식을 모두 접근점으로 사용하는 그룹화 방법을 사용하고, 동명이인 처리를 위해 저작자의 주제분야와 저작정보를 확장해서 사용하는 새로운 방법을 토대로 인명 접근점제어 데이터를 구축하고 시스템에 적용하여 검색의 기능이 향상되었다. 향후 기관 리포지터리 외에 도서관이 총괄하는 모든 메타데이터의 검색 기능 향상을 위해서도 활용할 수 있을 것이다.

Abstract

This study developed a name access point control system for better performance of information retrieval from institutional repositories, which are equipped with author- generated metadata processes for self-archiving. In developing name access point control data for the system, the primary data were created from the existing authority. However, unlike the existing authority data, the primary data did not use any authority forms. Instead, the data utilized all the forms provided by the resources as access points. Specifically, field of activity(subject) and title information on authorship were used to distinguish between persons who have the same name. The result showed that the system improved the performance of the information retrieval. The system has been also expected to be utilized over other metadata provided by libraries, in addition to the institutional repositories, in order to provide better quality information.

초록보기
초록

본 연구에서는 KMS의 지속적 사용에 영향을 미치는 요인을 분석하기 위해 KMS 품질, 지각된 사용 용이성과 지각된 유용성, 태도 및 KMS의 지속적 사용 간의 구조적 관계를 실증적으로 분석하고자 하였다. 이를 위해 본 연구는 경찰공무원들을 대상으로 한 설문조사를 통해 실증분석을 시도하였다. 가설검증 결과, 외부요인인 KMS 품질은 지각된 사용 용이성과 지각된 유용성에 유의미한 긍정적 영향을 미치고, 지각된 사용 용이성은 지각된 유용성에 긍정적인 영향을 미치는 것으로 검증되었다. 그리고 KMS에 대한 사용자의 지각된 사용 용이성과 지각된 유용성 모두 KMS 태도에 긍정적인 영향을 미치고, 태도요인을 매개로 KMS 사용행위에 긍정적인 영향을 미치는 것으로 나타났다. 이러한 분석결과를 토대로 본 연구에서는 KMS의 지속적인 수용과정을 설명하고, 그 함의를 제시하였다.

Abstract

The purpose of this study is to examine the causal relationships among knowledge management system(KMS) quality, perceived ease of use, perceived usefulness, attitude, and continuance use of KMS. The results of data analysis by structured equation model(SEM) indicate that KMS quality significantly influences individual's perceived ease of use and perceived usefulness. Perceived ease of use affects individual's perceived usefulness on KMS. Individual's perceived ease of use and perceived usefulness affect on the creation of a positive attitude, and attitude affects continuance use of KMS. Based on the results, theoretical and practical implications of this study are discussed.

초록보기
초록

본 연구에서는 국립중앙도서관 링크드 데이터를 대상으로 인물 정보가 표현되고 연계되는 방식을 분석하고, 이를 확장하기 위한 방안을 제안하였다. 분석 결과, 저자로서의 인물 정보는 링크드 데이터에서도 인물을 표현하는 어휘와 연계되어 기술되고 있는 반면에, 주제로 표현된 인물은 개념으로만 취급되고 있었다. 또한 링크드 데이터 구축과정에서 기존의 전거 정보를 변환한 것 외에는 별도의 부가 정보를 추가했는지를 확인할 수 없었다. 이에 본 연구에서는 저자로서의 인물 정보뿐 아니라 주제로서의 인물 정보도 서지 정보에 포함시키고, 저자로서의 인물 정보와 주제로서의 인물 정보를 연계할 때 링크드 데이터의 품질을 제고할 수 있다고 판단하였다. 그리고 이와 더불어 인물과 관련된 부가 링크 정보를 함께 구축하고 이를 활용하여 서지데이터 검색의 접근점을 확장하는 방안도 함께 제안하였다.

Abstract

This study analyzed the methods for representing and linking personal information in the linked data of National Library of Korea and provided suggestions for expanding the scope of identifying and linking of the personal information. As a result, the personal information as a subject has been dealt with a concept, where the personal information as a contributor has been linked with a vocabulary of personal name. In addition, there have not been assured of including additional information except existing authority data in the process of building the linked data. Therefore, this study suggested that linking personal information as a subject and personal information as a contributor was essential for the quality of linked data. In addition, we proposed to provide additional information related to the person in linked data for expanding the scope of access points in information discovery.

정보관리학회지