바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: research data, 검색결과: 169
41
김조아(명지대학교 대학원 문헌정보학과) ; 이재윤(명지대학교) 2016, Vol.33, No.2, pp.201-225 https://doi.org/10.3743/KOSIM.2016.33.2.201
초록보기
초록

학제적 분야의 연구 전선을 분석하는 새로운 기법으로 인용 이미지 구축자 프로파일링 기법을 제안하였다. 인용 이미지 구축자 프로파일링은 해당 문헌을 인용한 문헌의 표제어를 단서로 사용하여 문헌 간의 주제관계를 파악하는 방법이다. 이 연구에서는 시험적으로 국내 여성학 연구를 대상으로 인용 이미지 구축자 프로파일링 기법을 적용하여 연구 전선과 주요 연구 주제를 파악해보았다. 분석 대상은 KCI의 2015년 기준 여성학분야 인용빈도 10회 이상에 해당하는 핵심문헌 집합이다. 여성학 분야에 문헌동시인용 기법을 적용한 결과 인용 데이터 부족 때문에 어려움이 있었던 반면에, 인용 이미지 구축자 프로파일링 기법을 적용한 결과 성공적으로 2개 대분야 및 6개 소분야를 파악할 수 있었다. 이 연구에서 제안한 인용 이미지 구축자 프로파일링 기법은 학제적 연구분야의 동향을 파악하는데 기여할 수 있을 것으로 기대된다.

Abstract

A new technique for revealing the research fronts of a interdisciplinary discipline has been developed. Citation image makers profiling (CIMP) determines the relationships between research papers with the title words of the citing documents. We adapted this new technique to analyze the research fronts and hot topics in women’s studies of Korea. By Korean Citation Index (KCI) data in 2015, we selected 148 papers cited more than 9 times as the core documents of women’s studies. Analysis of intellectual structure using citation image makers profiling was performed with the 148 core documents and those citing papers. Document co-citation analysis was hindered by citation data sparsity, while CIMP method successfully revealed the structure of research fronts of Korean women’s studies including 2 divisions and 6 subdivisions. The CIMP method suggested in this study has good potential to discover the characteristics of research fronts of interdisciplinary research domains.

42
한상우(광주대학교 문헌정보학과 조교수) 2020, Vol.37, No.1, pp.179-195 https://doi.org/10.3743/KOSIM.2020.37.1.179
초록보기
초록

데이터의 중요성이 높아짐에 따라 최근 데이터 리터러시가 중요한 개념으로 등장하였다. 본 연구는 인문학 기반 데이터 리터러시 모형을 설계하는 것을 목적으로 한다. 이를 위해 데이터 리터러시 관련 연구를 분석하여 도출한 데이터 리터러시 세부 역량과 디지털 인문학 교육 프로그램의 주요 내용을 분석하여 인문학의 주요한 교육 내용을 결합하여 데이터 리터러시 모형을 설계하였다. 본 연구의 결과인 데이터 리터러시 모형을 적용하여 대학에서 데이터 리터러시 교과 운영시 적용이 가능할 것이며, 향후 데이터 리터러시의 효과성을 평가하는 후속연구를 제안하고자 한다.

Abstract

As data becomes more important, data literacy has recently emerged as an significant term. The purpose of this study is to design data literacy model based on digital humanities. To attain this end, data literacy model was designed by combining the main contents derived from the digital humanities education program with specific capabilities extracted from research related to data literacy. By applying the data literacy model, which is the result of this study, it will be applicable to the data literacy courses in universities, and I would like to propose a follow-up study to evaluate the effectiveness of data literacy in the future.

43
한유경(정보통신정책연구원) ; 최원석(정보통신정책연구원) ; 이민철(카카오엔터프라이즈) 2023, Vol.40, No.2, pp.115-135 https://doi.org/10.3743/KOSIM.2023.40.2.115
초록보기
초록

본 연구는 단행본, 학술지, 보고서 등 다양한 종류의 발간물로 구성된 연구보고서의 참고문헌 데이터베이스를 효율적으로 구축하기 위한 것으로 딥러닝 언어 모델을 이용하여 참고문헌의 자동추출 성능을 비교 분석하고자 한다. 연구보고서는 학술지와는 다르게 기관마다 양식이 상이하여 참고문헌 자동추출에 어려움이 있다. 본 연구에서는 참고문헌 자동추출에 널리 사용되는 연구인 메타데이터 추출과 더불어 참고문헌과 참고문헌이 아닌 문구가 섞여 있는 환경에서 참고문헌만을 분리해내는 원문 분리 연구를 통해 이 문제를 해결하였다. 자동 추출 모델을 구축하기 위해 특정 연구기관의 연구보고서 내 참고문헌셋, 학술지 유형의 참고문헌셋, 학술지 참고문헌과 비참고문헌 문구를 병합한 데이터셋을 구성했고, 딥러닝 언어 모델인 RoBERTa+CRF와 ChatGPT를 학습시켜 메타데이터 추출과 자료유형 구분 및 원문 분리 성능을 측정하였다. 그 결과 F1-score 기준 메타데이터 추출 최대 95.41%, 자료유형 구분 및 원문 분리 최대 98.91% 성능을 달성하는 등 유의미한 결과를 얻었다. 이를 통해 비참고문헌 문구가 포함된 연구보고서의 참고문헌 추출에 대한 딥러닝 언어 모델과 데이터셋 유형별 참고문헌 구축 방향을 제안하였다.

Abstract

The purpose of this study is to assess the effectiveness of using deep learning language models to extract references automatically and create a reference database for research reports in an efficient manner. Unlike academic journals, research reports present difficulties in automatically extracting references due to variations in formatting across institutions. In this study, we addressed this issue by introducing the task of separating references from non-reference phrases, in addition to the commonly used metadata extraction task for reference extraction. The study employed datasets that included various types of references, such as those from research reports of a particular institution, academic journals, and a combination of academic journal references and non-reference texts. Two deep learning language models, namely RoBERTa+CRF and ChatGPT, were compared to evaluate their performance in automatic extraction. They were used to extract metadata, categorize data types, and separate original text. The research findings showed that the deep learning language models were highly effective, achieving maximum F1-scores of 95.41% for metadata extraction and 98.91% for categorization of data types and separation of the original text. These results provide valuable insights into the use of deep learning language models and different types of datasets for constructing reference databases for research reports including both reference and non-reference texts.

44
Hae-Young Kim(Yonsei University) ; 정영미(연세대학교) ; Ji-Hye Lee(Yonsei University) 2008, Vol.25, No.2, pp.143-155 https://doi.org/10.3743/KOSIM.2008.25.2.143
초록보기
초록

Abstract

Authoritative as well as objective information on ranking or dominant research areas of academic departments/schools in a certain discipline is essential for the graduate school applicants. In this study, we performed an informetric analysis to identify dominant research areas in the top 10 U.S. LIS schools. We used two different datasets of research productivity and research interests of the LIS faculty. The correspondence analysis method was employed to graphically display the association between research areas and the LIS schools. We found that the research productivity data collected from SSCI database generated a very informative map presenting which research areas were dominant in which LIS schools. We also found that for the two most productive subject areas in LIS over the past 10-year period, the proportion of research articles in information retrieval decreased to a great extent in the recent 5-year period, whereas that of information seeking behavior showed an almost same degree of increase.

45
이세라(광주전남연구원) ; 김지현(전남대학교 문헌정보학과) 2019, Vol.36, No.1, pp.73-94 https://doi.org/10.3743/KOSIM.2019.36.1.073
초록보기
초록

이 연구는 지방연구원 소속 전문도서관의 서비스 품질 평가를 통하여 실제 이용자 만족에 영향을 주는 서비스 품질을 파악하고 전문도서관의 기능과 역할을 더욱 효율적으로 개선하기 위한 방향을 제시하고자 하였다. 이를 위해 지방연구원 소속 6개의 전문도서관 이용자 111명을 대상으로 LibQUAL+을 기반으로 수정된 설문조사와 심층인터뷰를 실시하였다. 연구결과, 인력품질이 공간품질과 정보품질 보다 전반적 만족도에 미치는 영향이 더 큰 것으로 확인되었고, 서비스 품질 하위변수 중에서는 인력품질의 서비스 태도, 공간품질의 공간 편의성, 정보품질의 정보 유용성이 이용자의 전반적 만족도에 영향을 미치는 것으로 나타났다. 인터뷰 결과로 자료부족, 디지털 자료의 비활성화, 도서관 공간개념의 환경, 타 기관과의 자료공유 비활성화, 인력부족 등의 문제점이 지적되었다. 이 연구는 이러한 분석 결과를 바탕으로 지방연구원 소속 전문도서관의 서비스 품질에 대한 개선방안을 제시하였다.

Abstract

The purpose of this study is to investigate the quality of service that affects satisfaction of special library users and to suggest ways to improve the function and role of special library. The data were collected by survey and interview method conducted with 111 library users in 6 local research institute using modified questionnaires based on LibQUAL+. The results revealed that human quality factor had more influence on library service satisfaction than space and information quality factor. Also, there were statistically significant influence between library service satisfaction and three sub service factors, such as service attitude, space convenience, and information usability. The interviewers indicated problems of special library service in lack of data, inactivation of digital data, space problem, data sharing problem, and lack of experts. Finally this study proposed several suggestions to improve service quality of special library of local autonomous entity research institution.

초록보기
초록

빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문 분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.

Abstract

As data management and processing techniques have been developed rapidly in the era of big data, nowadays a lot of business companies and researchers have been interested in long tail data which were ignored in the past. This study proposes methods for generating and controlling a network of technical terms based on text mining technique to enhance data utilization in the distribution of long tail theory. Especially, an edit distance technique of text mining has given us efficient methods to automatically create an interlinking network of technical terms in the scholarly field. We have also used linked open data system to gather experimental data to improve data utilization and proposed effective methods to use data of LOD systems and algorithm to recognize patterns of terms. Finally, the performance evaluation test of the network of technical terms has shown that the proposed methods were useful to enhance the rate of data utilization.

초록보기
초록

최근 다양한 학문 분야는 대내외적 요인으로 인해 학제적 연구 흐름에 영향을 받고 있는 추세이다. 본 연구는 문헌정보학 분야를 대상으로 학제성과 연구 영향력의 상관관계를 분석하고자 하였다. 이를 위해 2011년 JCR(Journal Citation Reports)의 학술지 영향력 지수 상위에 해당하는 문헌정보학 학술지 10종을 선정하여 WoS(Web of Science) 인용색인 DB에서 2006년부터 2010년까지 1,873편의 논문의 참고문헌 데이터를 대상으로 분석하였다. 동시인용 네트워크 분석과 선정된 4가지 학제성 지수를 사용하여 문헌정보학 분야의 학제적 구조를 파악하고 학제성과 연구 영향력 사이의 상관관계를 분석하였다. 분석 결과를 통해 문헌정보학의 학제적 구조를 제시하였으며, 학제성 지수 중 매개중심성은 학술지 영향력 지수(5년) 그리고 논문당 영향도(Article Influence Score)와 통계적으로 유의한 상관관계가 있음이 밝혀졌다.

Abstract

As interdisciplinary research has been dominant in various fields, the purpose of this study is to analyze the relationship between interdisciplinarity and research impact in the field of Library and Information Science. For a data set, ten journals ranked as the top of 2011 JCR’s in terms of JIF (Journal Impact Factor) were selected. The citation data of 1,873 articles from the ten journals were collected from the WoS during the period from 2006 to 2010. In order to achieve the purpose of this study, as network analysis was conducted to investigate the interdisciplinarity of LIS field, interdisciplinarity indicators, and research impact factors were statistically analyzed. The findings of this study confirmed the interdisciplinary knowledge structure of the LIS field as previous studies identified. More importantly, this study demonstrated that a positive correlation existed between interdisciplinarity represented as betweenness centrality and research impact.

초록보기
초록

Abstract

The purpose of this study is to identify topic areas of academic library research using two informetric methods; word clustering and Pathfinder network. For the data analysis, 139 articles published in major library and information science journals from 2005 to 2009 were collected from the Korean Science Citation Index database. The keywords that represent research topics were gathered from two sections: an abstract and titles in references. Results showed that reference titles usefully represent topics in detail, and combining abstracts and reference titles can produce an expanded topic map.

초록보기
초록

본 연구는 최근 열린 정부 데이터에 대한 다차원 척도, 모델 개발 연구가 시작되고 있으나, 도서관에서는 관련 연구가 부족하다는 점을 고려하여 도서관에 적용할 수 있는 오픈 데이터 품질측정 모델개발을 목적으로 하였다. 본 연구는 모델개발과 모델평가 두 단계로 수행하였다. 모델개발은 델파이 기법을 적용하였으며, 모델평가는 도서관 오픈 데이터 이용자를 대상으로 설문조사를 실시하여 모델의 타당도와 신뢰도를 측정하였다. 모델개발은 델파이 기법을 적용하여 총 4차례 수행하여 3개 차원, 18개 요인, 133개 측정요소로 구성된 모델을 도출하였다. 모델평가는 델파이 기법으로 완성한 모델을 도서관 오픈 데이터 이용자인 국내․외 사서, 개발자, 오픈 데이터 활동가를 대상으로 적합성 설문조사를 실시하여 모델의 타당도와 신뢰도를 검증하였다. 그 결과 당초 18개 요인, 133개 측정요소는 15개 요인, 54개 측정요소가 타당성을 확보한 것으로 나타났다. 신뢰도는 차원별, 측정요인별로 모두 기준치인 0.6 이상의 결과를 보여주고 있어 높은 신뢰도를 확보한 것으로 나타났다. 모델평가를 통한 이용자 타당도, 신뢰도 분석으로 전문가가 구성한 평가모델은 현장에서 즉시 활용될 수 있을 정도로 정제되었다.

Abstract

This study draws on the current momentum to diversify open government data research through multidimensional scaling and model development. It formulates a quality assessment model applicable to library open data, taking into consideration the paucity of such research in the field. The model was developed using the Delphi method and verified for validity and reliability on the basis of a survey administered to library open data users. The results of the fourth round exhibited an average of 4.00 for all measured elements and a minimum validity of .75, rendering the model appropriate for use in quality assessments of library open data. The convergence and stability results provided by the expert panel fell below .50, confirming that there was no need to conduct further surveys in order to establish the validity of the Delphi method. The model's reliability likewise garnered results of .60 and above in all three dimensions. This Model completed with the input of the Delphi panel was put through a verification process in which library open data users such as domestic and international librarians, developers, and open data activists reviewed the model for validity and reliability. The model scored low on validity on account of its failure to load all measure factors and elements pertaining to the three dimensions. Reliability results, on the other hand, were at 0.6 and above for all dimensions and measured elements.

초록보기
초록

This study proposes the analysis method in sentence semantics that can be automatically identified and processed as appropriate items in the system according to the composition of the sentences contained in the data corresponding to the logical semantic structure metadata of the research papers. In order to achieve the purpose, the structure of sentences corresponding to ‘Research Objectives’ and ‘Research Outcomes’ among the semantic structure metadata was analyzed based on the number of words, the link word types, the role of many-appeared words in sentences, and the end types of a word. As a result of this study, the number of words in the sentences was 38 in ‘Research Objectives’ and 212 in ‘Research Outcomes’. The link word types in ‘Research Objectives’ were occurred in the order such as Causality, Sequence, Equivalence, In-other-word/Summary relation, and the link word types in ‘Research Outcomes’ were appeared in the order such as Causality, Equivalence, Sequence, In-other-word/Summary relation. Analysis target words like ‘역할(Role)’, ‘요인(Factor)’ and ‘관계(Relation)’ played a similar role in both purpose and result part, but the role of ‘연구(Study)’ was little different. Finally, the verb endings in sentences were appeared many times such as ‘∼고자’, ‘∼였다’ in ‘Research Objectives’, and ‘∼었다’, ‘∼있다’, ‘∼였다’ in ‘Research Outcomes’. This study is significant as a fundamental research that can be utilized to automatically identify and input the metadata element reflecting the common logical semantics of research papers in order to support researchers’ scholarly sensemaking.

Abstract

정보관리학회지