바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 수집가능성, 검색결과: 7
1
유호선(전북대학교) ; 오효정(전북대학교) 2018, Vol.35, No.2, pp.115-139 https://doi.org/10.3743/KOSIM.2018.35.2.115
초록보기
초록

재난 웹 기록물의 가치와 보존의 중요성으로 인해 전 세계적으로 재난 아카이브의 구축은 국가적인 과제가 되어가고 있다. 본 연구는 재난 아카이브의 웹 기록물 수집에 있어서 이슈 생존 주기 모형에 기반한 수집 방안을 제시하는 것을 목적으로 한다. 이를 위해 먼저 국내외 재난 아카이브의 웹 기록물 수집 현황, 수집 방법 및 기간에 대하여 분석하였다. 또한, 최근 10년간 발생한 재난 이슈를 수집 및 분석하여 이슈 생존 주기 모형을 도출하였다. 이슈 생존 주기 모형은 재난의 특성에 따라 돌발형 및 주기형으로 구분되며, 각 모형에 따른 웹 기록물 수집 방안을 제시하였고 적용 가능성을 검증하였다.

Abstract

Due to the value and the importance of preservation of disaster web records, to build disaster archives is globally becoming a national challenge. This study proposes a acquisition methods based on the issue life cycle model for collecting disaster web records. We firstly analyzed web records acquisition status, methods and period of domestic and foreign disaster archives. In addition, the issue life cycle model was derived by collecting and analyzing the disaster issues in the last 10 years. As the results of the analysis, the issue life cycle model was divided into the sudden type and periodic type according to the characteristics of the disaster. In conclusion, this study propose a method to collect web records according to each model and verify its applicability.

2
정도헌(덕성여자대학교) ; 주황수(덕성여자대학교) 2018, Vol.35, No.3, pp.77-100 https://doi.org/10.3743/KOSIM.2018.35.3.077
초록보기
초록

본 연구는 텍스트 마이닝 기법을 활용하여 대량의 데이터로부터 학제 간 융합 기술을 발굴하는 일련의 과정을 제시하는 것을 목표로 한다. 바이오공학 기술(BT) 분야와 정보통신 기술(ICT) 분야 간의 융합 연구를 위해 (1) BT 분야의 기술용어 목록을 작성하여 대량의 학술논문 메타데이터를 수집한 후 (2) 패스파인더 네트워크 척도 알고리즘을 이용해 유망 기술의 지식 구조를 생성하고 (3) 토픽 모델링 기법을 사용하여 BT분야 중심의 내용 분석을 수행하였다. 다음 단계인 BT-ICT 융합 기술 아이템 도출을 위해, (4) BT-ICT 관련 정보를 얻기 위해 BT 기술용어 목록을 상위 개념으로 확장한 후 (5) OpenAPI 서비스를 이용하여 두 분야가 관련된 학술 정보의 메타데이터를 자동 수집하여 (6) BT-ICT 토픽 모델의 내용 분석을 실시하였다. 연구를 통해 첫째, 융합 기술의 발굴을 위해서는 기술 용어 목록의 작성이 중요한 지식 베이스가 된다는 점과 둘째, 대량의 수집 문헌을 분석하기 위해서는 데이터의 차원을 줄여 분석을 용이하게 해주는 텍스트 마이닝 기법이 필요하다는 점을 확인하였다. 본 연구에서 제안한 데이터 처리 및 분석 과정이 학제 간 융합 연구의 가능성이 있는 기술 요소들을 발굴하는 데 효과적이었음을 확인할 수 있었다.

Abstract

The objectives of this study is to present a discovering process of interdisciplinary convergence technology using text mining of big data. For the convergence research of biotechnology(BT) and information communications technology (ICT), the following processes were performed. (1) Collecting sufficient meta data of research articles based on BT terminology list. (2) Generating intellectual structure of emerging technologies by using a Pathfinder network scaling algorithm. (3) Analyzing contents with topic modeling. Next three steps were also used to derive items of BT-ICT convergence technology. (4) Expanding BT terminology list into superior concepts of technology to obtain ICT-related information from BT. (5) Automatically collecting meta data of research articles of two fields by using OpenAPI service. (6) Analyzing contents of BT-ICT topic models. Our study proclaims the following findings. Firstly, terminology list can be an important knowledge base for discovering convergence technologies. Secondly, the analysis of a large quantity of literature requires text mining that facilitates the analysis by reducing the dimension of the data. The methodology we suggest here to process and analyze data is efficient to discover technologies with high possibility of interdisciplinary convergence.

3
김성훈(성균관대학교 문헌정보학과) ; 오삼균(성균관대학교 문헌정보학과) 2018, Vol.35, No.2, pp.141-165 https://doi.org/10.3743/KOSIM.2018.35.2.141
초록보기
초록

본 연구의 목적은 연구데이터 관리서비스 구현 시 성공적인 서비스를 위한 고려사항을 도출하는 것이다. 이를 위해 선행연구를 활용하여 연구데이터 관리서비스의 영역을 파악하였고, 미국, 독일, 호주에서 연구데이터 관리서비스를 시행중인 대학도서관 6곳과 1개의 기관에서 담당자 8명을 대상으로 연구데이터 서비스에 관한 질문의 답변을 이메일을 통해 수집하였다. 또 해외서비스를 대상으로 수집한 고려사항이 국내에 적용가능한지 국내 연구데이터 관리서비스 전문가와 검토하였다. 연구데이터 서비스 영역은 총 9개의 카테고리로 구분하여 분석하였는데, 연구서비스와 연구데이터 관리서비스 연계, 국가/대학/기관 차원의 협약, 메타데이터 입력주체 및 필수 요소, 직원의 전문화 방안, 이용자 요구분석을 통한 주요서비스 영역 선정, 연구데이터와 연구결과물의 효과적인 연결방안, 이용자와 유관기관과 긴밀한 공조 등의 연구데이터 관리서비스 구축 시 고려사항을 도출할 수 있었다.

Abstract

The purpose of this study is to determine crucial factors of consideration in ensuring the successful implementation of research data management services. The study begins by extracting a range of service areas from their equivalent in existing research on data management services. It then collects relevant information via e-mail survey from eight individuals respectively overseeing research data management services at six university libraries and one institution located throughout the United States, Germany, and Australia. Having originated in overseas cases, the resulting factors of consideration were reviewed by domestic experts in research data management services. The finalized areas of research data management services consist of nine categories. The crucial factors of consideration in RDM services are connection between research services and research data management services; national/university-level/institutional agreements; metadata entry personnel and required elements; strategies for the provision of specialized staff; major service area selection through user demand analysis; effective linkage between research data and research results; and close cooperation with users and related organizations.

4
이지연(연세대학교) ; 감미아(연세대학교) 2018, Vol.35, No.1, pp.129-155 https://doi.org/10.3743/KOSIM.2018.35.1.129
초록보기
초록

본 연구는 실증적 데이터의 검토 및 분석을 통해 이용자연구와 실용연구 분야의 특징을 발견하고, 이용자연구와 실용연구 분야의 융합 가능성을 논하고자 수행되었다. 이용자연구의 개척 및 확장 가능성을 살펴보기 위해, 실용연구 분야 중 UX 연구를 선택하여 비교하였고, 이용자연구 영역과 UX 영역의 주제어 및 분야별 중복도를 살펴보았다. 연구를 위해 국내 이용자연구 3,370개 논문과 국내 UX 연구 2,413개 논문, 국외 이용자연구 3,875개 논문과 국외 UX 연구 2,515개 논문을 수집하였고, 단순 출현빈도를 포함한 계량정보학적 분석 방법을 이용하여 네트워크 맵핑 및 순위 선정, 시기별 비교분석을 수행하였다. 분석 결과 국내의 이용자연구와 UX 연구 중복도는 국외보다 낮은 편이었고, 분야 간 협업의 활발성이 중복도와 연관이 있다고 해석할 수 있었다. 시기별 분석을 통해 이용자연구와 UX 연구간 중복되는 키워드가 점차 증가하고 있음을 발견하였기에, 향후 이용자연구와 실용연구 분야 간의 융합이 활발히 일어날 가능성을 엿볼 수 있었다.

Abstract

This research aims to discover various aspects of the user studies and the research in practice and also to propose collaboration methods by empirical analysis of the data. To determine the application applicability of the user studies in other subject areas, the degree of keyword overlap between the user studies and the User Experience (UX), one of the research in practice discipline, was measured. The quantitative information science methods including simple frequency analysis were applied to more than ten thousand published papers to generate the network mapping and ranking as well as comparative analysis by time. The analysis result showed that there were slightly lesser overlap between the user studies and the UX in the domestically published articles than the international ones. It also revealed that there is a relationship between the actual occurrences of collaboration and the keyword overlap. The temporal analysis showed that there is increasingly more keyword overlap between two disciplines and thus it is possible to predict the active convergence in the future.

5
김선우(경기대학교 문헌정보학과) ; 고건우(경기대학교 문헌정보학과) ; 최원준(한국과학기술정보연구원 콘텐츠 큐레이션센터) ; 정희석(한국과학기술정보연구원 콘텐츠 큐레이션센터) ; 윤화묵(한국과학기술정보연구원 콘텐츠큐레이션센터) ; 최성필(경기대학교) 2018, Vol.35, No.4, pp.141-164 https://doi.org/10.3743/KOSIM.2018.35.4.141
초록보기
초록

최근 학술문헌의 양이 급증하고, 융복합적인 연구가 활발히 이뤄지면서 연구자들은 선행 연구에 대한 동향 분석에 어려움을 겪고 있다. 이를 해결하기 위해 우선적으로 학술논문 단위의 분류 정보가 필요하지만 국내에는 이러한 정보가 제공되는 학술 데이터베이스가 존재하지 않는다. 이에 본 연구에서는 국내 학술문헌에 대해 다중 분류가 가능한 자동 분류 시스템을 제안한다. 먼저 한국어로 기술된 기술과학 분야의 학술문헌을 수집하고 K-Means 클러스터링 기법을 활용하여 DDC 600번 대의 중분류에 맞게 매핑하여 다중 분류가 가능한 학습집합을 구축하였다. 학습집합 구축 결과, 메타데이터가 존재하지 않는 값을 제외한 총 63,915건의 한국어 기술과학 분야의 자동 분류 학습집합이 구축되었다. 이를 활용하여 심층학습 기반의 학술문헌 자동 분류 엔진을 구현하고 학습하였다. 객관적인 검증을 위해 수작업 구축한 실험집합을 통한 실험 결과, 다중 분류에 대해 78.32%의 정확도와 72.45%의 F1 성능을 얻었다.

Abstract

Recently, as the amount of academic literature has increased rapidly and complex researches have been actively conducted, researchers have difficulty in analyzing trends in previous research. In order to solve this problem, it is necessary to classify information in units of academic papers. However, in Korea, there is no academic database in which such information is provided. In this paper, we propose an automatic classification system that can classify domestic academic literature into multiple classes. To this end, first, academic documents in the technical science field described in Korean were collected and mapped according to class 600 of the DDC by using K-Means clustering technique to construct a learning set capable of multiple classification. As a result of the construction of the training set, 63,915 documents in the Korean technical science field were established except for the values ​​in which metadata does not exist. Using this training set, we implemented and learned the automatic classification engine of academic documents based on deep learning. Experimental results obtained by hand-built experimental set-up showed 78.32% accuracy and 72.45% F1 performance for multiple classification.

6
노영희(건국대학교) ; 오의경(상명대학교) ; 정대근(전남대학교 문헌정보학과) 2018, Vol.35, No.2, pp.7-36 https://doi.org/10.3743/KOSIM.2018.35.2.007
초록보기
초록

본 연구는 기초학문자료센터가 인문자산 원스톱(One-Stop) 포털 서비스 구축에 있어 효과적인 데이터연계 방향성 제안을 목적으로 하였다. 이를 위해 인문자산을 보유한 국내 기관에 대한 현황을 수집하고 분석하였으며, 대상 기관이 보유한 데이터 분석을 통해 연계 방향성을 제시하였다. 본 연구에서는 첫째, 인문자산의 주제에 대하여 기존 분류체계 검토를 기반으로 인문자산의 분류체계를 제안하였다. 둘째, 조사 대상기관이 보유하고 있는 데이터의 주제와 유형에 대한 구체적인 분석을 통해 인문자산으로 편입될 수 있는 잠재적 데이터의 범주를 설정하였다. 셋째, 인문자산 원스톱 포털 서비스를 제공하고 있는 유사사례 기관의 플랫폼을 분석하였으며, 유사성을 중심으로 원스톱 시스템 구축 시, 적용 가능한 메타필드를 제시하였다.

Abstract

The purpose of this study is to propose an effective direction of data linkage for building the humanities assets one-stop portal service. For this purpose, We collected and analyzed the actual status of the domestic institution with humanities assets, and presented the linkage direction through analysis of the data held by the target organization. The results of this study are as follows: First, we proposed a classification system of humanities assets based on the reviewing the existing classification system on the subject of humanities assets. Second, we set up the categories of potential data that can be incorporated into humanities assets through a detailed analysis of the subject and type of data held by the subject institutions. Third, we analyzed the platforms of similar case organizations providing one-stop portal services for humanities assets and proposed the applicable meta fields when constructing one-stop system based on similarity.

7
육지희(연세대학교 일반대학원 문헌정보학과) ; 송민(연세대학교) 2018, Vol.35, No.2, pp.63-88 https://doi.org/10.3743/KOSIM.2018.35.2.063
초록보기
초록

본 연구는 LDA 토픽 모델과 딥 러닝을 적용한 단어 임베딩 기반의 Doc2Vec 기법을 활용하여 자질을 선정하고 자질집합의 크기와 종류 및 분류 알고리즘에 따른 분류 성능의 차이를 평가하였다. 또한 자질집합의 적절한 크기를 확인하고 문헌의 위치에 따라 종류를 다르게 구성하여 분류에 이용할 때 높은 성능을 나타내는 자질집합이 무엇인지 확인하였다. 마지막으로 딥 러닝을 활용한 실험에서는 학습 횟수와 문맥 추론 정보의 유무에 따른 분류 성능을 비교하였다. 실험문헌집단은 PMC에서 제공하는 생의학 학술문헌을 수집하고 질병 범주 체계에 따라 구분하여 Disease-35083을 구축하였다. 연구를 통하여 가장 높은 성능을 나타낸 자질집합의 종류와 크기를 확인하고 학습 시간에 효율성을 나타냄으로써 자질로의 확장 가능성을 가지는 자질집합을 제시하였다. 또한 딥 러닝과 기존 방법 간의 차이점을 비교하고 분류 환경에 따라 적합한 방법을 제안하였다.

Abstract

This research evaluated differences of classification performance for feature selection methods using LDA topic model and Doc2Vec which is based on word embedding using deep learning, feature corpus sizes and classification algorithms. In addition to find the feature corpus with high performance of classification, an experiment was conducted using feature corpus was composed differently according to the location of the document and by adjusting the size of the feature corpus. Conclusionally, in the experiments using deep learning evaluate training frequency and specifically considered information for context inference. This study constructed biomedical document dataset, Disease-35083 which consisted biomedical scholarly documents provided by PMC and categorized by the disease category. Throughout the study this research verifies which type and size of feature corpus produces the highest performance and, also suggests some feature corpus which carry an extensibility to specific feature by displaying efficiency during the training time. Additionally, this research compares the differences between deep learning and existing method and suggests an appropriate method by classification environment.

정보관리학회지