바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073
검색어: dataset records, 검색결과: 3
1
이경남(한신대학교 대학원 기록관리학과 강사) ; 최광훈(중부대학교 기록물관리학과 석사, ㈜알엠소프트 대표) ; 임진희(명지대학교 기록정보과학전문대학원 조교수) 2021, Vol.38, No.3, pp.263-285 https://doi.org/10.3743/KOSIM.2021.38.3.263
초록보기
초록

행정정보데이터세트 관리의 시급성과 중요성을 인식하고 실무에 적용 가능한 실효성 있는 방안을 연구하는 것이 필요하다. 특히 데이터세트 평가를 위해 데이터세트 기록을 식별하고 기록관리를 위한 기준을 정하는 일은 상세하고 구체적으로 제시될 필요가 있다. 본 연구는 공공기관에서 운영 중인 행정정보시스템 데이터세트를 대상으로 데이터세트 식별과 평가 과정을 설계하고 검증하였다. 이와 함께 평가 과정에서 기록관을 비롯한 참여 주체들의 역할을 제시하였다. 본 연구 결과를 통해 기록관에서 데이터세트 기록 관리를 위한 구체적이고 실질적인 프로세스 및 도구를 개발하기 위한 유용한 시사점을 도출하였다.

Abstract

It is necessary to recognize the urgency and importance of administrative information dataset management and study effective management measures and specific procedures applicable in practice. Particularly, identify dataset records and developing records schedule for records management needs to be presented in detail and specific. This study designed and verified an identification method and appraisal procedure of dataset records in public administrative information systems dataset operating in public institutions. In addition, this study presented the role of the participants including the records center in the appraisal process. Through this, useful implications are derived for the development of specific and practical processes and tools for dataset management in the records center.

2
한희정(전북대학교 문화융복합아카이빙 연구소 전임연구원) ; 윤성호(전북대학교 일반대학원 기록관리학과 석사과정) ; 오효정(전북대학교 문헌정보학과 부교수) ; 양동민(전북대학교 일반대학원 기록관리학과 부교수) 2020, Vol.37, No.2, pp.251-284 https://doi.org/10.3743/KOSIM.2020.37.2.251
초록보기
초록

정보의 활용이 국가 경쟁력의 핵심으로 부각되면서 우리 정부를 포함한 주요 선진국들은 데이터를 중요하게 인식하고 있으며, 이에 따라 장기보존 기술 연구 및 표준 제정 등을 추진하여 데이터의 체계적인 관리 및 보존을 위한 노력을 지속적으로 기울이고 있다. 그러나 현재 국내의 경우 다양한 유형의 데이터들에 대해 법령에는 기록관리 대상으로 명시하고 있지만, 이를 수집, 관리 및 보존하기 위한 구체적인 방법은 표준전자문서 이외에는 없는 상황이다. 특히, 행정정보시스템에서 생산되는 엄청난 규모의 데이터세트에 대한 관리 및 보존은 무엇보다 강하게 요구되어 왔으나 데이터세트에 대한 지침이 제대로 제공되고 있지 않고 있다. 보존포맷 선정체계가 마련되어야 시스템 보완 및 구축이 가능하기 때문에 우선적으로 데이터세트 특성을 고려한 보존포맷 선정 기준 체계가 보다 구체화 되어야 하며, 선정기준에 따라 도출된 데이터세트 보존포맷의 변환에 대한 실증적인 검증 작업이 필요하다. 이에 본 연구는 데이터세트의 특성을 고려한 보존포맷 선정 기준에 대한 평가체계를 도출하고, 보존포맷에 대한 실증적 검증을 통해 장기보존할 수 있는 방안을 제시하고자 한다.

Abstract

As the use of information has emerged as the core of national competitiveness, major developed countries and the Korean government have realized the importance of data. They have pursued technical research and standard establishment for long-term preservation and continuously strived for systematic management and preservation of data. However, although various types of data are specified for the purpose of record management in the law, there is no specific method on how to collect, manage and preserve them, except standard electronic documents. In particular, management and preservation of huge datasets from the administrative information system have been strongly demanded above all. Any guidelines for datasets do not have been properly provided. After the framework for selecting preservation format must be prepared, the system can be supplemented and built. The framework considering the characteristics of the dataset should be specified more concretely, and empirical verification of the conversion and restoration for the dataset preservation format derived according to the selection criteria is necessary. Therefore, this study intends to propose a method for long-term preservation through empirical verification of the preservation format after deriving an evaluation the framework for the preservation format selection criteria considering the characteristics of the dataset.

초록보기
초록

이 연구에서는 토픽 모델링 결과 해석의 용이성을 위하여, 동적 인용 네트워크를 활용하여 LDA 기반 토픽 모델링의 토픽 수를 설정하고 중복 배치된 주요 키워드를 자아 중심 네트워크 분석을 통해 재배치하여 제시하는 방법을 제안하였다. ‘White LED’ 두 분야의 논문 데이터를 이용하여 분석한 결과, 동적 인용 네트워크 분석을 통해 형성된 분석대상 문헌집단에 혼잡도에 따른 토픽수를 사용하고 중복 분류된 토픽 내 주요 키워드를 자아중심 네트워크 분석 기법을 적용하여 재배치한 결과가 토픽 간의 중복도가 가장 낮은 것으로 나타났다. 따라서 동적 인용 네트워크 및 자아 중심 네트워크 분석을 적용함으로써 토픽모델링에 의한 분석 결과를 보완하는 다면적인 연구 동향 분석이 가능할 것으로 보인다.

Abstract

The combined approach of using ego-centric network analysis and dynamic citation network analysis for refining the result of LDA-based topic modeling was suggested and examined in this study. Tow datasets were constructed by collecting Web of Science bibliographic records of White LED and topic modeling was performed by setting a different number of topics on each dataset. The multi-assigned top keywords of each topic were re-assigned to one specific topic by applying an ego-centric network analysis algorithm. It was found that the topical cohesion of the result of topic modeling with the number of topic corresponding to the lowest value of perplexity to the dataset extracted by SPLC network analysis was the strongest with the best values of internal clustering evaluation indices. Furthermore, it demonstrates the possibility of developing the suggested approach as a method of multi-faceted research trend detection.

정보관리학회지