바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 데이터모델, 검색결과: 39
21
이현실(원광대학교) ; 한성국(원광대학교) 2004, Vol.21, No.2, pp.249-267 https://doi.org/10.3743/KOSIM.2004.21.2.249
초록보기
초록

MARC는 목록 데이터를 상세하게 정의할 수 있는 장점이 있지만, 개념요소가 구조화 되어 있지 않고 표현체계가 복잡하기 때문에 단순 계층구조의 의미 어휘 체계를 지원하는 XML DTD나 RDF/S로는 그 구조를 모델화하기가 어렵다. 본 연구에서는 MARC의 데이터 요소를 추상화하여 목록 데이터의 개념 구조를 표현하는 서지 온톨로지를 구축하였으며, 개념간의 논리 관계와 프로퍼티의 카디널리티 및 프로퍼티 값에 대한 논리적 제한을 부가할 수 있는 OWL을 이용하여 MRAC 필드의 복합 구조를 모델링하여 구축한 목록 온톨로지를 구현하였다. 온톨로지 언어를 이용한 MARC 데이터를 기술 방법은 목록 데이터에 대한 메타데이터 구성과 목록의 호환성 문제를 해결할 수 있는 기초적 방안이 되며, 시맨틱 웹 서비스를 기반으로 하는 차세대 문헌 정보서비스 시스템 구현의 토대가 될 것이다.

Abstract

Although MARC can define the detail cataloguing data, it has complex structures and frameworks to represent bibliographic information. On account of these idiosyncratic features of MARC, XML DTD or RDF/S that supports simple hierarchy of conceptual vocabularies cannot capture MARC formalism effectively. This study implements bibliographic ontology by means of abstracting conceptual relationships between bibliographic vocabularies of MARC. The bibliographic ontology is formalized with OWL that can represent the logical relations between conceptual elements and specify cardinality and property value restrictions. The bibliographic ontology in this study will provide metadata for cataloguing data and resolve compatibility problems between cataloguing systems. And it can also contribute the development of next generation bibliographic information system using semantic Web services.

22
한상은(성균관대학교 사서교육원 강사) ; 도슬기(한성대학교 크리에이티브인문학부 조교수) 2024, Vol.41, No.1, pp.509-536 https://doi.org/10.3743/KOSIM.2024.41.1.509
초록보기
초록

본 연구의 목적은 소규모의 디지털 아카이브인 국채보상운동 디지털 아카이브의 개인과 단체 전거데이터를 관리하기 위한 메타데이터 AP를 개발하는 것이다. 도서관과 기록관의 개인/단체 메타데이터 표준, 구축 사례 및 지침을 분석하여 설계 원칙과 핵심적인 메타데이터 요소를 도출하였으며, 국채보상운동 개인/단체명 시소러스 데이터, 위키데이터 연계 메타데이터 모델과 매핑하여 최종적으로 식별영역 10개 요소, 내용영역 14개 요소, 관계영역 8개 요소, 통제영역 4개 요소를 도출하였다. 소규모의 기관에서도 적용할 수 있도록 단순 구조 스키마를 적용하였고, 상호운용성을 위해 DublinCore, SKOS 스킴을 참고하여 스키마를 제안하였고 실제 데이터를 토대로 적용가능성을 확인하였다. 본 연구의 결과는 데이터 관리의 중요성은 알지만, 실제적인 적용이 어려운 기관에서 전거데이터 관리 체계를 마련하고자 할 때, 기초자료로 활용할 수 있을 것이다.

Abstract

The purpose of this study is to develop a metadata AP for managing the person and organization name authority data in the National Debt Redemption Movement Digital Archive, a small-scale digital archive. The design principles and core metadata elements were derived by analyzing person/ organization(group or corporateBody) metadata standards, implementation practices, and guidelines of libraries and archives, and mapped to the National Debt Redemption Movement person/organization name thesaurus data and the Wikidata Linked Metadata Model, resulting in 10 elements in the identification area, 14 elements in the content area, 8 elements in the relationship area, and 4 elements in the control area. A simple structure schema was applied so that it can be applied even in small organizations, and for interoperability, the schema was proposed with reference to DublinCore and SKOS schemes, and the applicability was confirmed based on actual data. The results of this study can be utilized as a basis for institutions that recognize the importance of data management but have difficulty in applying it in practice, when they want to prepare a system for managing their own authority data.

초록보기
초록

본 연구는 공공도서관에서 운영하는 프로그램의 성과를 로직모델을 기반으로 개발된 평가 프레임워크를 적용하여 측정하고자 하였다. 성과 측정을 위해 서울 소재 한 공공도서관에서 운영하는 여러 프로그램 중 어린이 독서 프로그램을 선정하였다. 성과 측정 과정은 어린이 독서 프로그램의 계획, 진행, 평가 등의 업무 과정 일체를 분석하여 로직 모델을 구현하였으며 이에 의거하여 예상되는 성과를 측정하였다. 데이터는 KOLAS를 통해 회원정보, 서지정보, 대출정보 등을 수집하였고, 프로그램 운영 현황에 대한 데이터는 프로그램 진행 후 작성된 보고서에서 추출하였다. 측정 결과 어린이 독서 프로그램에 참여한 회원들의 대출빈도가 상승하였고, 프로그램의 주제에 따라 대출 장서의 주제가 변화하는 것을 볼 수 있었다. 본 연구를 통해 독서 프로그램이 갖는 효과와 의미를 확인할 수 있었으며, 성과평가가 도서관에서 운영하는 타 프로그램 및 도서관 업무 등의 효과성을 측정하는데 유용한 도구가 될 수 있음을 보여주었다.

Abstract

The purpose of this study is to measure the outcomes of a program provided by a public library using the evaluation framework based on Logic Model. A reading program for children which was operated by a public library in Seoul was selected. The outcome evaluation was started with the analysis of the reading program process including planning, operation, and evaluation. Based on the analysis, a logic model framework for outcome evaluation was developed. For evaluation, user, bibliography, and circulation data were collected from the library KOLAS system. Additionally, the participant information were extracted from the final report drafted after the program. The research results show that the number of circulation of program participants was increased after the program. In addition, the range of reading topic was expanded. These findings indicate that the reading program is an effective program for promoting children’s reading habit and that outcome evaluation might be a valid tool to measure the effectiveness of public library programs.

24
한유경(정보통신정책연구원) ; 최원석(정보통신정책연구원) ; 이민철(카카오엔터프라이즈) 2023, Vol.40, No.2, pp.115-135 https://doi.org/10.3743/KOSIM.2023.40.2.115
초록보기
초록

본 연구는 단행본, 학술지, 보고서 등 다양한 종류의 발간물로 구성된 연구보고서의 참고문헌 데이터베이스를 효율적으로 구축하기 위한 것으로 딥러닝 언어 모델을 이용하여 참고문헌의 자동추출 성능을 비교 분석하고자 한다. 연구보고서는 학술지와는 다르게 기관마다 양식이 상이하여 참고문헌 자동추출에 어려움이 있다. 본 연구에서는 참고문헌 자동추출에 널리 사용되는 연구인 메타데이터 추출과 더불어 참고문헌과 참고문헌이 아닌 문구가 섞여 있는 환경에서 참고문헌만을 분리해내는 원문 분리 연구를 통해 이 문제를 해결하였다. 자동 추출 모델을 구축하기 위해 특정 연구기관의 연구보고서 내 참고문헌셋, 학술지 유형의 참고문헌셋, 학술지 참고문헌과 비참고문헌 문구를 병합한 데이터셋을 구성했고, 딥러닝 언어 모델인 RoBERTa+CRF와 ChatGPT를 학습시켜 메타데이터 추출과 자료유형 구분 및 원문 분리 성능을 측정하였다. 그 결과 F1-score 기준 메타데이터 추출 최대 95.41%, 자료유형 구분 및 원문 분리 최대 98.91% 성능을 달성하는 등 유의미한 결과를 얻었다. 이를 통해 비참고문헌 문구가 포함된 연구보고서의 참고문헌 추출에 대한 딥러닝 언어 모델과 데이터셋 유형별 참고문헌 구축 방향을 제안하였다.

Abstract

The purpose of this study is to assess the effectiveness of using deep learning language models to extract references automatically and create a reference database for research reports in an efficient manner. Unlike academic journals, research reports present difficulties in automatically extracting references due to variations in formatting across institutions. In this study, we addressed this issue by introducing the task of separating references from non-reference phrases, in addition to the commonly used metadata extraction task for reference extraction. The study employed datasets that included various types of references, such as those from research reports of a particular institution, academic journals, and a combination of academic journal references and non-reference texts. Two deep learning language models, namely RoBERTa+CRF and ChatGPT, were compared to evaluate their performance in automatic extraction. They were used to extract metadata, categorize data types, and separate original text. The research findings showed that the deep learning language models were highly effective, achieving maximum F1-scores of 95.41% for metadata extraction and 98.91% for categorization of data types and separation of the original text. These results provide valuable insights into the use of deep learning language models and different types of datasets for constructing reference databases for research reports including both reference and non-reference texts.

초록보기
초록

본 연구는 남북합작으로 건립하는 PUST에 설치될 도서관과 디지털도서관 모델 제시를 위해 수행되었다. 우선 이론적 연구를 통해 디지털도서관의 문제와 PUST 디지털도서관의 이슈를 파악하였다. 그 결과, 저작권법하의 공정사용 미흡 등으로 현 단계에서 디지털도서관만 운영하는 것은 문제가 있는 것으로 파악되었다. 또 남북의 언어와 지적기반의 차이 등으로 홈페이지 접근·데이터베이스 구축·자료의 검색 등에 문제가 있는 것으로 파악되었다. 이에 연구자는 디지털도서관과 하이브리드 도서관을 병행 운영할 것과, 디지털도서관 관련 하여 유니코드를 통한 홈페이지의 이중화·NCHAR 데이터타입 설정을 통한 다국어 저장, 전거 데이터베이스 구축 등을 제안하였다.

Abstract

This study was conducted under the premise of providing the model for the construction of the library and the digital library in PUST, the joint construction from South and North Korea. First, we determined the problems in the construction of digital libraries as well as possible issues that may rise from the construction of the digital library in PUST. The results of the research showed that there were imminent problems from the operation of a digital library with the inadequate progress in the field of copyright. In addition, the difference in the language system and the knowledge foundations of the two countries will produce problems in the homepage access, database construction, and information retrieval. In order to overcome these predictable problems, this research proposes the following: (1) parallel operation of both digital and high-drive libraries; (2) duplexing the homepage through the application of unicode concerning the digital library; (3) development and application of converted letter codes through the establishment of NCHAR data type; and (4) construction of an authority database.

26
장정인(성균관대학교 문헌정보학과 석사졸업) ; 이용정(성균관대학교 문헌정보학과 부교수) 2021, Vol.38, No.1, pp.243-262 https://doi.org/10.3743/KOSIM.2021.38.1.243
초록보기
초록

본 연구는 후기수용모델을 통해 병원정보탐색 어플리케이션(이하 병원 앱)의 지속적인 이용과 이용 중단에 영향을 미치는 요인을 파악하고자 하였다. 병원 앱을 사용한 경험이 있는 이용자를 대상으로 2019년 10월 11일부터 18일까지 설문조사를 실시하여 125개의 유효한 데이터를 수집하였고 구조방정식 모형을 사용하여 데이터를 분석하였다. 연구 결과, 병원 앱 사용자의 만족도와 기대일치도는 지속적 이용의도와 지각된 유용성에 각각 유의미한 영향을 미치는 것으로 나타났다. 하지만 지각된 유용성은 지속적 이용의도에 유의미한 영향을 미치지 않는 것으로 나타났다. 본 연구는 기존에 많이 조명되지 않았던 병원 앱에 관한 연구를 통해 이러한 혁신적 기술의 지속적 사용여부에 영향을 미치는 변인들을 파악하였다. 연구 결과는 병원앱의 수용과 이용을 관찰하여 후기수용모델을 재검증하였으며, 응급상황과 같은 긴급한 도움탐색이나 신속함이 강조되는 정보요구를 만족시키는 병원앱의 특수성을 논의함으로써 이론적 확장을 도모하였다. 또한 소비자가 보고한 병원 앱의 유익성과 한계점을 바탕으로 병원 앱 개발자나 운영자들에게 보다 이용자 친화적인 앱을 제공하기 위한 실질적인 시사점을 제공하였다.

Abstract

The present study aims to identify the factors that affect the continuous use and discontinuance of the hospital information seeking applications(hospital apps thereafter) by employing the post acceptance model. The surveys were conducted with people who used the hospital apps from October 11 to 18, 2019. Researchers collected 125 valid data and analyzed them by using the structural equation model. The study found that the satisfaction and confirmation of expectation for the hospital apps users had significant effects on intention for continuous use and perceived usefulness, respectively. However, the perceived usefulness did not have a significant effect on the intention for continue use. The present study has identified the variables that influence the continuous use of these innovative technologies. The findings of the study confirmed the post acceptance model by observing the adoption and use of the hospital apps and extended the literature of the post acceptance model by discussing the unique characteristics of the hospital apps that satisfy the urgent help-seekers under emergency situations or the information needs emphasizing promptness. In addition, based on the benefits and limitations of hospital apps reported by consumers, the study provided practical implications for designing more user-friendly apps to hospital app developers or managers.

27
이창열(동의대학교) ; 정의석(고려대학교) 2006, Vol.23, No.4, pp.165-177 https://doi.org/10.3743/KOSIM.2006.23.4.165
초록보기
초록

한국정보문화진흥원이 관리하는 국가 지식정보자원은 여러 기관에 분산되어 있으며, 메타데이터 규격은 통합이 아니라 검색을 위한 개념적 수준의 권고 표준이었다. 그래서 데이터를 연계하거나 통합하는데 많은 문제가 발생하고 있다. 본 논문에서는 여러 기관에 분산된 지식정보자원에 대한 통합을 위하여 기존에 여러 기관에 분산된 메타데이터를 분석하여 문제점을 도출하고 이를 보완하며, 지속적으로 연계 및 통합할 수 있는 표준 모델을 제시하고자 한다.

Abstract

National Knowledge and Information Resources of KADO(Korea Agency for Digital Opportunity and Promotion) were distributed to the several data centers. The metadata for the resources was the conceptual level recommended standard. It was not for the integration, but the retrieval. So it is not easy to integrate to the central metadata DB or connect metadata among the data centers. In this paper, we analysed the metadata of the several data centers and provided the integrated standard model for the central metadata DB.

초록보기
초록

기존의 연구자 유형 구분 모델은 대부분 연구성과 지표를 활용해왔다. 이 연구에서는 인용 영향력이 공동연구와 관련이 있다는 점을 감안하여 인용 데이터를 활용하지 않고 공동연구 지표만으로 연구자 유형을 분석하는 새로운 방법을 모색해보았다. 공동연구 패턴과 공동연구 범위를 기준으로 연구자를 Sparse & Wide (SW) 유형, Dense & Wide (DW) 유형, Dense & Narrow (DN) 유형, Sparse & Narrow (SN) 유형의 4가지로 구분하는 모델을 제안하였다. 제안된 모델을 양자계측 분야에 적용해본 결과, 구분된 연구자 유형별로 인용지표와 공저 네트워크 지표에 차이가 있음이 통계적으로 검증되었다. 이 연구에서 제시한 공동연구 특성에 따른 연구자 유형 구분 모델은 인용정보를 필요로 하지 않으므로 연구관리 정책과 연구지원서비스 측면에서 폭넓게 활용할 수 있을 것으로 기대된다.

Abstract

Traditional models for categorizing researcher types have mostly utilized research output metrics. This study proposes a new model that classifies researchers based on the characteristics of research collaboration. The model uses only research collaboration indicators and does not rely on citation data, taking into account that citation impact is related to collaborative research. The model categorizes researchers into four types based on their collaborative research pattern and scope: Sparse & Wide (SW) type, Dense & Wide (DW) type, Dense & Narrow (DN) type, Sparse & Narrow (SN) type. When applied to the quantum metrology field, the proposed model was statistically verified to show differences in citation indicators and co-author network indicators according to the classified researcher types. The proposed researcher type classification model does not require citation information. Therefore, it is expected to be widely used in research management policies and research support services.

29
정도헌(덕성여자대학교) ; 주황수(덕성여자대학교) 2018, Vol.35, No.3, pp.77-100 https://doi.org/10.3743/KOSIM.2018.35.3.077
초록보기
초록

본 연구는 텍스트 마이닝 기법을 활용하여 대량의 데이터로부터 학제 간 융합 기술을 발굴하는 일련의 과정을 제시하는 것을 목표로 한다. 바이오공학 기술(BT) 분야와 정보통신 기술(ICT) 분야 간의 융합 연구를 위해 (1) BT 분야의 기술용어 목록을 작성하여 대량의 학술논문 메타데이터를 수집한 후 (2) 패스파인더 네트워크 척도 알고리즘을 이용해 유망 기술의 지식 구조를 생성하고 (3) 토픽 모델링 기법을 사용하여 BT분야 중심의 내용 분석을 수행하였다. 다음 단계인 BT-ICT 융합 기술 아이템 도출을 위해, (4) BT-ICT 관련 정보를 얻기 위해 BT 기술용어 목록을 상위 개념으로 확장한 후 (5) OpenAPI 서비스를 이용하여 두 분야가 관련된 학술 정보의 메타데이터를 자동 수집하여 (6) BT-ICT 토픽 모델의 내용 분석을 실시하였다. 연구를 통해 첫째, 융합 기술의 발굴을 위해서는 기술 용어 목록의 작성이 중요한 지식 베이스가 된다는 점과 둘째, 대량의 수집 문헌을 분석하기 위해서는 데이터의 차원을 줄여 분석을 용이하게 해주는 텍스트 마이닝 기법이 필요하다는 점을 확인하였다. 본 연구에서 제안한 데이터 처리 및 분석 과정이 학제 간 융합 연구의 가능성이 있는 기술 요소들을 발굴하는 데 효과적이었음을 확인할 수 있었다.

Abstract

The objectives of this study is to present a discovering process of interdisciplinary convergence technology using text mining of big data. For the convergence research of biotechnology(BT) and information communications technology (ICT), the following processes were performed. (1) Collecting sufficient meta data of research articles based on BT terminology list. (2) Generating intellectual structure of emerging technologies by using a Pathfinder network scaling algorithm. (3) Analyzing contents with topic modeling. Next three steps were also used to derive items of BT-ICT convergence technology. (4) Expanding BT terminology list into superior concepts of technology to obtain ICT-related information from BT. (5) Automatically collecting meta data of research articles of two fields by using OpenAPI service. (6) Analyzing contents of BT-ICT topic models. Our study proclaims the following findings. Firstly, terminology list can be an important knowledge base for discovering convergence technologies. Secondly, the analysis of a large quantity of literature requires text mining that facilitates the analysis by reducing the dimension of the data. The methodology we suggest here to process and analyze data is efficient to discover technologies with high possibility of interdisciplinary convergence.

30
최광남(한국과학기술정보연구원) ; 조현양(경기대학교) ; 안세필(Kins,Inc) 2002, Vol.19, No.4, pp.77-94 https://doi.org/10.3743/KOSIM.2002.19.4.077
초록보기
초록

본 연구에서는 한국과학기술정보연구원에서 구축중인 한국과학기술인용색인을 바탕으로 국내 주요 과학기술계 학술지에 수록된 연구 논문을 중심으로 연구자들의 인용현황을 분석하였다. 또한 기계공학 분야를 실험 대상으로 선정하여 현재 SCI의 기계공학 분야의 인용 순위와 비교한 결과 SCI의 JCR과는 실질적인 차이가 있음을 발견하였다. 본 연구는 국내 연구자에게 분야별 필수적인 연구 정보원의 제공과 국내 기관별, 분야별 과학기술 수준을 파악하고 평가하기 위한 도구로서 활용이 가능한 한국인용색인데이터베이스의 효율적인 구축방안 및 서비스모델을 제안한다.

Abstract

In this study we analyze the present situation of cited and citing references among researchers, based on Korean Science Citation Index developed by Korea Institute of Science & Technology Information. There are some differences on the rank of frequently cited journals between JCR of ISI and KSCI, especially in the field of mechanical engineering. The purpose of this study is to find an efficient way of constructing KSCI database and to propose a service model which can be available as a tool to evaluate research activities and to provide researcher with basic information resources.

정보관리학회지