바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 데이터 기반, 검색결과: 115
초록보기
초록

과학기술분야 전문학술지의 학술논문 투고와 심사처리 전과정에 대한 영문전용의 웹기반 시스템을 설계하기 위하여 국내외의 대표적인 사례로 Elsevier Editorial System과 KISTI-ACOMS를 조사하고 분석하였다. 이를 통하여 해양과학기술분야 전문학술지 Ocean Science Journal에 적용할 수 있는 웹기반 논문투고심사시스템이 구현되었다. 웹기반 시스템은 기존의 오프라인 논문심사과정에서 발생하는 원고관리, 심사기간의 지연과 원고분실 등의 문제점을 해결할 수 있을 뿐만 아니라 e-journal 전자출판의 기반이 자연스럽게 조성되어 효율적이고 신속한 학술정보 유통환경이 구축된다. 이러한 시스템의 개발과 활용은 과학기술분야 전문학술지의 수준제고 및 국제화 과정에 크게 기여할 것이다.

Abstract

In order to design a web-based English Article Submission & Management System for science and technology research papers, Elsevier Editorial System and KISTI-ACOMS, international and domestic models--respectively--are studied and analysed. Through this analysis, a web-based paper submission and review system which can be applied to Ocean Science Journal, a research journal in the field of Oceanography, is developed. The web-based system is not only able to solve problems such as complex manuscript management, delays in the reviewing process, and loss of manuscripts that occur often in off-line paper review processes, but also is able to construct the basis for e-journal electronic publication. As a result, an effective and rapid scholarly communication environment can be made. The development and utilization of this system can improve the reputation and the globalization of science and technology research journals.

22
박성은(성균관대학교 문헌정보학과 박사과정) ; 고영만(성균관대학교 문헌정보학과) 2022, Vol.39, No.2, pp.159-202 https://doi.org/10.3743/KOSIM.2022.39.2.159
초록보기
초록

‘국가 연구데이터플랫폼’과 ‘바이오 연구데이터플랫폼’은 비교적 최근 구축되어 활발하게 각각의 생태계를 만들어 가고 있다. 따라서 다른 메타데이터 표준을 기반으로 독립적으로 구축되어 향후 상호운용성의 문제가 발생할 수 있다. 본 연구의 목적은 각 플랫폼의 메타데이터 요소를 매핑하고, 이를 검증하여 상호운용성을 확보하기 위한 기반을 제안하는 것이다. 이를 위해 각 플랫폼의 메타데이터 표준을 분석하고 크로스워크 대상을 선정하여 매핑한 후, 바이오 분야 전문가를 통해 매핑된 요소의 적합성을 검증하고 더 적절한 매핑 요소를 추천받아 데이터셋 및 파일에 대한 메타데이터 요소를 도출하였다. 이를 통해 각 플랫폼의 메타데이터가 의미적으로 연결될 수 있는 가능성과 상호운용성 확보를 위한 기반을 확인할 수 있었다.

Abstract

The ‘National Research Data Platform’ and the ‘Bio Research Data Platform’ were recently built and each is actively creating an ecosystem. It is built independently based on other metadata standards, which may cause future interoperability issues. The purpose of this study is to propose a basis for metadata interoperability between the two platforms. To this end, the metadata standards of each platform were analyzed, crosswork targets were selected and mapped, and the suitability of the mapped elements was verified through experts in the bio field. And more appropriate mapping elements were recommended to derive metadata elements for datasets and files. Through this, it was possible to confirm the possibility that the metadata of each platform could be semantically linked and the basis for securing interoperability.

23
곽지영곽지영(법원도서관 사서) 2023, Vol.40, No.3, pp.143-162 https://doi.org/10.3743/KOSIM.2023.40.3.143
초록보기
초록

본 연구는 법원도서관 법마루 도서대출 데이터를 분석하여 이용자 대출 패턴을 파악하고 분석 결과를 향후 이용자 서비스에 반영하는 방안을 제안하였다. 2022년 법마루의 소장 도서는 212,608권이었으며, 법률서가 73%를 차지하고 있었다. 그러나 실제 대출은 일반서가 83%의 비중을 차지하고 있었다. 주제별 이용계수를 살펴보면 문학 분야가 5.85로 가장 활발히 이용되고 있었고 법학 분야가 0.23으로 가장 저조하게 이용되고 있었다. 상호대차의 경우, KERIS 가입 회원기관과 대한변호사협회 모두 제법 분야, 민법 분야, 사법소송절차 분야 순으로 대출 비율이 높았다. 다만, 법학계인 KERIS 가입 회원기관이 실무계인 대한변호사협회에 비해 더 다양한 주제 분야의 법률서를 대출하고 있었다. 법률정보의 접근권 향상을 위해 법마루 대국민 대출서비스를 시행했지만 실제로는 열람 공간의 이용이 높았고, 대출 역시 일반서의 비중이 월등히 높다는 것을 확인할 수 있었다. 이를 개선하기 위해서는 법마루 대출 서비스 홍보 강화 및 개인화 서비스 제공, 도서대출 규정 정비 온라인서비스 강화 및 협력네트워크 구축 등이 필요할 것으로 보인다.

Abstract

This study analyzed the Beopmaru, Supreme Court Library of Korea, circulation data to identify user lending patterns and proposed a plan to reflect the analysis results in future user services. In 2022, Beopmaru's collection of books was 212,608, with law books accounting for 73%. However, general books accounted for 83% of actual circulation. Looking at the usage coefficient by topic, the literature field was the most actively used at 5.85, and the law field was the least used at 0.23. In the case of interlibrary loan, both KERIS member institutions and the Korean Bar Association had the highest loan ratios in the legal field, civil law field, and judicial litigation procedure field, in that order. However, member institutions affiliated with KERIS, a legal academic community, were lending law books on a wider range of subject areas than the Korean Bar Association, a practical organization. To improve access to legal information, the Beopmaru public service was implemented, but in reality, the use of reading space was high, and the proportion of general books loaned was much higher. In order to improve this, it seems necessary to strengthen the promotion of Beopmaru loan services, provide personalized services, improve book lending regulations, strengthen online services, and establish a cooperative network.

24
박진호(주식회사 리스트 사업개발본부장) ; 고영만(성균관대학교 문과대학 문헌정보학과 교수) ; 김현수(성균관대학교 정보관리연구소 연구원) 2019, Vol.36, No.4, pp.129-159 https://doi.org/10.3743/kosim.pub.36.4.129001
초록보기
초록

본 연구의 목적은 연구데이터 서비스 자체의 유용성과 연구데이터에 대한 사용경험 기반의 유용성 측면에서 평가 모형을 개발하는 것이다. 다양한 사례에서 도출한 데이터 서비스의 유용성 평가 요소로부터 연구데이터에 내재된 평가척도인 검색성, 접근성, 상호운용성, 재활용성 4개와 각각의 측정지표 총 20개를 도출하였다. 그리고 Google Analytics, YouTube 광고료 책정 기준, 서울특별시, Altmetrics의 사례를 분석하여 연구데이터에 대한 이용자 경험 기반의 유용성 측정지표 12개를 도출하였다. 평가척도와 측정지표에 대한 타당성과 신뢰성 검정을 위해 연구데이터의 잠재적 이용자 164명을 대상으로 설문조사를 실시하였다. 평가척도의 타당성 검정을 위해 KMO Bartlett 분석을 하였으며, 측정지표의 성분분석을 위해 주성분 분석과 베리맥스 회전분석법을 사용하였다. 내재적 평가척도의 경우 4개 척도 모두 KMO Bartlett의 타당성 값을 충족시켰으며, 평가척도에 대한 측정지표의 성분분석 결과 모두 단일 성분으로 나타나 현재의 척도로 해당 지표에 대한 설명이 가능하였다. 그러나 이용자 경험 기반의 12개 측정지표의 성분분석 결과는 2개 성분으로 나누어지는 것으로 나타나 각각을 활용도와 참여도라는 개념의 2개 평가척도로 구분하였다. Cronbach’s alpha 계수에 의한 신뢰도 측정 결과 6개의 평가척도 모두 0.6 이상의 측정치를 충족시키는 것으로 나타났다.

Abstract

The Purpose of this study is to develop an evaluation model for usability of research data service from the angles of evaluating usefulness of research data service itself and research data use experience-based usability. First, the various cases of evaluating usability of data services are examined and 4 rating scales and 20 measuring indicators for research data service are derived as a result of comparative analysis. In order to verify validity and reliability of the rating scale and the measuring indicators, the study conducted a survey of 164 potential research data users. KMO Bartlett Analysis was performed for validity test, and Principle Component Analysis and Verimax Rotating Method were used for component analysis on measuring indicators. The result shows that the 4 intrinsic rating scales satisfy the validity criteria of KMO Barlett; A single component was determined from component analysis, which verifies the validity of measuring indicators of the current rating scale. However, the result of 12 user experience-based measuring indicators analysis identified 2 components that are each classified as rating scale of utilization level and that of participation level. Cronbach’s alpha of all 6 rating scales was 0.6 or more for the overall scale.

25
한나은(한국과학기술정보연구원) ; 서수정(한국과학기술정보연구원) ; 엄정호(한국과학기술정보연구원) 2023, Vol.40, No.3, pp.77-98 https://doi.org/10.3743/KOSIM.2023.40.3.077
초록보기
초록

본 연구는 지금까지 제안된 거대언어모델 가운데 LLaMA 및 LLaMA 기반 모델과 같이 연구데이터를 주요 사전학습데이터로 활용한 모델의 데이터 품질에 중점을 두어 현재의 평가 기준을 분석하고 연구데이터의 관점에서 품질 평가 기준을 제안하였다. 이를 위해 데이터 품질 평가 요인 중 유효성, 기능성, 신뢰성을 중심으로 품질 평가를 논의하였으며, 거대언어모델의 특성 및 한계점을 이해하기 위해 LLaMA, Alpaca, Vicuna, ChatGPT 모델을 비교하였다. 현재 광범위하게 활용되는 거대언어모델의 평가 기준을 분석하기 위해 Holistic Evaluation for Language Models를 중심으로 평가 기준을 살펴본 후 한계점을 논의하였다. 이를 바탕으로 본 연구는 연구데이터를 주요 사전학습데이터로 활용한 거대언어모델을 대상으로 한 품질 평가 기준을 제시하고 추후 개발 방향을 논의하였으며, 이는 거대언어모델의 발전 방향을 위한 지식 기반을 제공하는데 의의를 갖는다.

Abstract

Large Language Models (LLMs) are becoming the major trend in the natural language processing field. These models were built based on research data, but information such as types, limitations, and risks of using research data are unknown. This research would present how to analyze and evaluate the LLMs that were built with research data: LLaMA or LLaMA base models such as Alpaca of Stanford, Vicuna of the large model systems organization, and ChatGPT from OpenAI from the perspective of research data. This quality evaluation focuses on the validity, functionality, and reliability of Data Quality Management (DQM). Furthermore, we adopted the Holistic Evaluation of Language Models (HELM) to understand its evaluation criteria and then discussed its limitations. This study presents quality evaluation criteria for LLMs using research data and future development directions.

초록보기
초록

교육인적자원부에서는 학교간의 자원공유와 상호대차 기반 조성, 단위 학교 데이터베이스 구축의 효율성 도모, 단위 학교 목록 데이터 입력 및 시스템 관리 부담 경감 등을 목적으로 인터넷 기반 학교도서관 정보시스템(IBSLIS)을 구축 운영 중에 있다. IBSLIS 정보시스템을 성공적으로 구축, 운영하기 위해서는 시스템의 기능과 운영 실태를 분석함으로써 향후 개선 및 발전 방안을 모색할 필요가 있다. 이에 본 연구는 2001년도에 시범적으로 설치한 부산시교육청의 IBSLIS 정보시스템을 평가함으로써 향후 개선방안을 제시하고자 한다.

Abstract

The Ministry of Education and Human Resources Development is propelling the establishment project of IBSLIS, Internet-based School Library Information System for prepares a foundation of resource sharing and inter-school library loan, to improvement of DB construction's efficiency and to reduces a maintenance's burden of local information system. There is a necessity which it will evaluate demonstrative operating IBSLIS system for maximize to educational effect and to establish efficiently. Thus, this study is prepares to improvement devices of school library informationization as evaluation an operational status and functions of IBSLIS system which are established in 2001 year.

초록보기
초록

빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문 분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.

Abstract

As data management and processing techniques have been developed rapidly in the era of big data, nowadays a lot of business companies and researchers have been interested in long tail data which were ignored in the past. This study proposes methods for generating and controlling a network of technical terms based on text mining technique to enhance data utilization in the distribution of long tail theory. Especially, an edit distance technique of text mining has given us efficient methods to automatically create an interlinking network of technical terms in the scholarly field. We have also used linked open data system to gather experimental data to improve data utilization and proposed effective methods to use data of LOD systems and algorithm to recognize patterns of terms. Finally, the performance evaluation test of the network of technical terms has shown that the proposed methods were useful to enhance the rate of data utilization.

28
이현실(원광대학교) ; 한성국(원광대학교) 2004, Vol.21, No.2, pp.249-267 https://doi.org/10.3743/KOSIM.2004.21.2.249
초록보기
초록

MARC는 목록 데이터를 상세하게 정의할 수 있는 장점이 있지만, 개념요소가 구조화 되어 있지 않고 표현체계가 복잡하기 때문에 단순 계층구조의 의미 어휘 체계를 지원하는 XML DTD나 RDF/S로는 그 구조를 모델화하기가 어렵다. 본 연구에서는 MARC의 데이터 요소를 추상화하여 목록 데이터의 개념 구조를 표현하는 서지 온톨로지를 구축하였으며, 개념간의 논리 관계와 프로퍼티의 카디널리티 및 프로퍼티 값에 대한 논리적 제한을 부가할 수 있는 OWL을 이용하여 MRAC 필드의 복합 구조를 모델링하여 구축한 목록 온톨로지를 구현하였다. 온톨로지 언어를 이용한 MARC 데이터를 기술 방법은 목록 데이터에 대한 메타데이터 구성과 목록의 호환성 문제를 해결할 수 있는 기초적 방안이 되며, 시맨틱 웹 서비스를 기반으로 하는 차세대 문헌 정보서비스 시스템 구현의 토대가 될 것이다.

Abstract

Although MARC can define the detail cataloguing data, it has complex structures and frameworks to represent bibliographic information. On account of these idiosyncratic features of MARC, XML DTD or RDF/S that supports simple hierarchy of conceptual vocabularies cannot capture MARC formalism effectively. This study implements bibliographic ontology by means of abstracting conceptual relationships between bibliographic vocabularies of MARC. The bibliographic ontology is formalized with OWL that can represent the logical relations between conceptual elements and specify cardinality and property value restrictions. The bibliographic ontology in this study will provide metadata for cataloguing data and resolve compatibility problems between cataloguing systems. And it can also contribute the development of next generation bibliographic information system using semantic Web services.

29
김나연(이화여자대학교 일반대학원 문헌정보학과 석사) ; 정은경(이화여자대학교 문헌정보학과 교수) 2020, Vol.37, No.4, pp.1-26 https://doi.org/10.3743/KOSIM.2020.37.4.001
초록보기
초록

오늘날 점차 데이터 집약적으로 변모하는 학문 환경 속에서 데이터는 연구부산물이 아닌 연구성과물로써 학술 커뮤니케이션의 기반으로 자리 잡아가고 있다. 그러나 데이터 공급의 확대나 접근가능성의 확보만으로는 실제적인 데이터 재이용을 담보하는 데 한계가 있다. 이를 극복하기 위해서는 학술연구자의 데이터 재이용 행위와 데이터요구를 심층적으로 파악할 필요성이 있다. 따라서 본 연구는 연구자의 주요 데이터 재이용 행위와 데이터요구를 규명하고자 하였다. 이를 위해 한국사회과학자료원(KOSSDA)의 최근 3개년 데이터 재이용문헌 중 KCI 등재 논문의 저자를 연구대상으로 선정하고, 인터뷰를 수락한 연구자 12명과의 심층면담을 수행하였다. 심층면담 분석결과, 데이터를 재이용하는 요인은 개인적, 경제적, 기술적, 사회적 측면 모두에서 나타났으며, 데이터 재이용 목적에 따라 데이터 그 자체를 이용하거나 데이터가 지닌 맥락정보를 활용하였다. 웹 기반의 정보원으로부터 데이터를 주로 습득하였으나 비공식적인 커뮤니케이션을 통해 파악하는 경우도 있었다. 한편 데이터 재이용 시에 발생하는 학술연구자의 데이터요구를 살펴보면 생산 단위는 기관을, 언어는 영어를, 국가로는 미국을 선호하였다. 또한 조사원 기입식 대인면접 조사 방식으로 수집된 양적 데이터를 우선시하였다. 메타데이터와 식별정보를 충분히 포함한 원자료 수준의 데이터를 긍정적으로 인식하였으나, 접근 및 이용이 통제된 데이터는 데이터가 지닌 가치에 대한 확신을 갖기 어려워 부정적으로 받아들였다. 그러나 데이터의 규모나 최신성과 관련된 선호는 뚜렷하게 나타나지 않았는데 이는 선택 가능한 유사 데이터가 부재하였기 때문이었다.

Abstract

In today’s increasingly data-intensive academic environment, data is becoming the foundation of academic communication as a research outcome rather than a research by-product. However, there is a limit to guaranteeing actual data reuse only by expanding the data supply or securing accessibility. In order to overcome this, it is necessary to understand the data reuse behavior and data needs in-depth. Therefore, this study attempted to identify the major data reuse behavior and data needs among researchers. To this end, the authors of KCI papers among the data reuse documents of the Korea Social Science Data Archive (KOSSDA) for the past 3 years were targeted. An in-depth interview was conducted with 12 researchers who accepted the interview. As a result, factors considered when reusing data were personal, economic, technical, and social aspects, and it was found that the data itself was used or contextual information of the data was used depending on the purpose of data reuse. The path to acquiring data is a web-based source of information, and a path through informal communication can also be found. In terms of the data needs, it was found that they prefer English, the United States, and institutional producers. Also they have a clear preference for quantitative data from an interviewer-filled interpersonal interview survey method, rich metadata along with raw data, and data that contains identification information. However, due to the lack of confidence in the value, it is negative for the use of data with controlled access and use, and it is difficult to confirm a clear preference because there is no similar data available for selection in terms of size and freshness.

30
사공복희(전남대학교) 2003, Vol.20, No.3, pp.81-110 https://doi.org/10.3743/KOSIM.2003.20.3.081
초록보기
초록

웹기반 온라인목록의 이용자 인터페이스는 이용자에게 더욱 친근하게 개선되었는가. 웹기반 온라인목록이 제공하는 탐색관련 기능은 어떠한가. 이용자들은 웹기반 온라인목록을 이용하는 데 어려움은 없는가. 이용자들은 웹기반 온라인목록에 대하여 어떤 인식을 가지고 있는가. 이런 문제에 대한 답을 통하여 웹기반 온라인목록의 검색도구로서의 문제점을 파악하고 개선방안을 제시하였다. 실험연구를 수행하였으며, 30명의 탐색자가 실험에 참여하였다. 탐색자가 웹기반 온라인목록을 실제로 탐색하는 과정중에 보이는 행태를 분석하여 데이터를 입수하였고, 탐색 후 질문지를 통하여 시스템에 대한 인식을 측정하였다.

Abstract

The primary questions addressed by this research are the followings : Has the interface of a Web-based OPAC been improved more user-friendly; How about its searching abilities; What difficulties have Web-based OPAC searchers experienced in using a Web OPAC; How do they perceive the system after use of it. Finding the answers of those questions the problems of a Web OPAC as a searching tool have been grasped and recommendations have been suggested in order to improve the system. An experiment was conducted and 30 university students performed 8 searching tasks. The searching behavior of Web OPAC searchers has been analyzed thoroughly. The data of their perceptions about the system was collected through a questionnaire after completing the tasks.

정보관리학회지