바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: collection, 검색결과: 14
11
이정연(이화여자대학교 이화사회과학원) ; 전수현(우아한형제들 데이터애널리스트) 2020, Vol.37, No.2, pp.171-195 https://doi.org/10.3743/KOSIM.2020.37.2.171
초록보기
초록

본 연구는 대표적인 온라인 협업커뮤니티인 한국 위키피디아의 초기 2002년부터 2019년까지의 편집로그 빅데이터를 해체하여 공동협업과정을 시계열적으로 분석하였다. 공개된 오픈데이터의 표준화된 XML 문서편집 기록을 활용해 Phython과 R을 이용하여 분석 요소를 추출하여 이를 활용하였다. 연구 분석 결과 한국 위키피디아 편집자의 참여 방법, 데이터 내용의 특징, 문서 생성의 추이 등을 설명할 수 있었다. 소수 편집자들의 적극적 활동과 대다수 편집자들의 느슨한 참여도 밝혀졌으며, 온라인에서도 나타나는 사회 문화적 특징이 한국 위키피디아에서도 나타났다. 집단지성을 지속화시키기 위해서는 새롭고 다양한 외부자원이 필수인데 신규 진입자들이 공동편집 커뮤니티에 안착하기 위한 다각적인 고려가 필요하며, 관리자 그룹의 고착화를 탈피하여 순환구조를 통한 개방성이 필요함을 제언하였다.

Abstract

This study analyzed the collaborative process in time series by dismantling the edit log big data of Wikipedia Korea, a representative online collaboration community, from early 2002 to 2019. Analysis elements were extracted from the document edit records, formatted in standardized XML, and analyzed using Python and R. The ways of editors’ contribution, the characteristics of data contents, and the trend of document creation were explained by the analysis. An active contribution of a small set of editors and a loose participation of the majority were revealed. In addition, sociocultural characteristics that appear in online communities were also found in Wikipedia Korea. A new, diverse set of external resources is necessary to sustain the collective intelligence. An effort to settle new editors into the wikipedia community and an openness through circulation structure to avoid the exclusiveness of the management group are suggested.

12
황성욱(전북대학교 기록관리학과) ; 정예용(전북대학교 기록관리학과) ; 김수정(전북대학교 문헌정보학과) ; 오효정(전북대학교 문헌정보학과) 2020, Vol.37, No.2, pp.23-45 https://doi.org/10.3743/KOSIM.2020.37.2.023
초록보기
초록

최근 ‘코로나19’라는 초유의 재난 사태를 맞이하여 대한민국 정부의 투명한 정보 공개를 통한 적극적 대응에 전 세계가 주목하고 있다. 이렇듯 공공데이터 개방은 특정 정보에 대한 국민의 인지도와 접근성을 높임으로써 다양한 사회적, 경제적 가치를 상승시키는 데 필수적이다. 본 연구는 정부차원에서 주도적으로 수집하고 공개하고 있는 공공데이터포털의 이용 활성화를 위해 각국에서 운영하고 있는 SNS 현황과 그에 따른 개선방안을 제안하고자 한다. 이를 위해 국내․외 공공데이터포털 SNS 운용현황을 살펴보고, 그 중 선진 사례 3국(인도, 미국, 한국)의 서비스를 선정하여 계량 분석, 피드백 분석, 시계열 분석, 정보유형 분석을 실시하였다. 분석결과를 통해 정보유형 및 이용요구를 파악하고 시사점을 도출하여 공공데이터 이용 활성화를 위한 구체적인 개선방안을 제언하였다.

Abstract

The world is paying attention to the South Korean government’s aggressive COVID-19 response, key of which is transparency and openness in sharing information. Opening up government information is essential to enhancing its social and economic value through increased awareness and accessibility. The purpose of this study is to investigate the current status of SNS operated by national open data portals in which government-collected and -disclosed data is available and to suggest improvements for the use of open data portals. To do this, the study compared 3 national open data portals, each from India, U.S.A, and Korea, by performing quantitative analysis, user feedback analysis, time-series analysis, and information type analysis. Based on the identified information types and user needs, the study suggests concrete ways to facilitate the use of open data portals.

초록보기
초록

이 연구는 한국학의 주류를 이루는 연구영역들의 기원과 발전경로를 파악하기 위하여 텍스트 마이닝과 주경로 분석(main path analysis, MPA) 기법을 수행하였다. 이를 위하여 전통적인 인문학 연구방법론이 아닌 디지털 텍스트를 기반으로 한 정량적 분석을 시도하였고 인용 데이터베이스를 활용하여 인용정보가 포함된 한국학 관련 문헌들을 수집하고 직접 인용 네트워크를 구축하여 한국학 분야 주경로를 추출하였다. 주경로 추출 결과, 한국학 인문분야에서는 키루트(key-route) 주경로 탐색에서 두 개의 주경로 군집(①한국 고대 농경문화(역사․문화․고고학), ②한국인의 영어습득(언어학))이 발견되었고, 한국학 인문․사회분야에서는 키루트 주경로 탐색에서 네 개의 주경로 군집(①한국 지역(공간)개발․조경, ②한국 경제발전(경제원조․소프트파워), ③한국의 산업(정치경제학), ④한국의 인구구성(남아선호)․북한경제(빈곤․중국협력))이 발견되었다. 이 연구의 결과가 한국학의 정체성을 파악하는데 기존의 지엽적 분석에서 벗어나 한국학이라는 학문에서 논의되고 있는 주 영역의 발전과 진화를 거시적으로 분석․제시함으로써 한국학이 가지는 포괄성과 모호성을 다소 해소하고 한국학 외연을 가시적으로 조망하는데 기여할 수 있으리라 기대한다.

Abstract

In this study, text mining and main path analysis (MPA) were applied to understand the origins and development paths of research areas that make up the mainstream of Korean studies. To this end, a quantitative analysis was attempted based on digital texts rather than the traditional humanities research methodology, and the main paths of Korean studies were extracted by collecting documents related to Korean studies including citation information using a citation database, and establishing a direct citation network. As a result of the main path analysis, two main path clusters (Korean ancient agricultural culture (history, culture, archeology) and Korean acquisition of English (linguistics)) were found in the key-route search for the Humanities field of Korean studies. In the field of Korean Studies Humanities and Social Sciences, four main path clusters were discovered: (1) Korea regional/spatial development, (2) Korean economic development (Economic aid/Soft power), (3) Korean industry (Political economics), and (4) population of Korea (Sex selection) & North Korean economy (Poverty, South-South cooperation).

14
한희정(전북대학교 문화융복합아카이빙 연구소 전임연구원) ; 윤성호(전북대학교 일반대학원 기록관리학과 석사과정) ; 오효정(전북대학교 문헌정보학과 부교수) ; 양동민(전북대학교 일반대학원 기록관리학과 부교수) 2020, Vol.37, No.2, pp.251-284 https://doi.org/10.3743/KOSIM.2020.37.2.251
초록보기
초록

정보의 활용이 국가 경쟁력의 핵심으로 부각되면서 우리 정부를 포함한 주요 선진국들은 데이터를 중요하게 인식하고 있으며, 이에 따라 장기보존 기술 연구 및 표준 제정 등을 추진하여 데이터의 체계적인 관리 및 보존을 위한 노력을 지속적으로 기울이고 있다. 그러나 현재 국내의 경우 다양한 유형의 데이터들에 대해 법령에는 기록관리 대상으로 명시하고 있지만, 이를 수집, 관리 및 보존하기 위한 구체적인 방법은 표준전자문서 이외에는 없는 상황이다. 특히, 행정정보시스템에서 생산되는 엄청난 규모의 데이터세트에 대한 관리 및 보존은 무엇보다 강하게 요구되어 왔으나 데이터세트에 대한 지침이 제대로 제공되고 있지 않고 있다. 보존포맷 선정체계가 마련되어야 시스템 보완 및 구축이 가능하기 때문에 우선적으로 데이터세트 특성을 고려한 보존포맷 선정 기준 체계가 보다 구체화 되어야 하며, 선정기준에 따라 도출된 데이터세트 보존포맷의 변환에 대한 실증적인 검증 작업이 필요하다. 이에 본 연구는 데이터세트의 특성을 고려한 보존포맷 선정 기준에 대한 평가체계를 도출하고, 보존포맷에 대한 실증적 검증을 통해 장기보존할 수 있는 방안을 제시하고자 한다.

Abstract

As the use of information has emerged as the core of national competitiveness, major developed countries and the Korean government have realized the importance of data. They have pursued technical research and standard establishment for long-term preservation and continuously strived for systematic management and preservation of data. However, although various types of data are specified for the purpose of record management in the law, there is no specific method on how to collect, manage and preserve them, except standard electronic documents. In particular, management and preservation of huge datasets from the administrative information system have been strongly demanded above all. Any guidelines for datasets do not have been properly provided. After the framework for selecting preservation format must be prepared, the system can be supplemented and built. The framework considering the characteristics of the dataset should be specified more concretely, and empirical verification of the conversion and restoration for the dataset preservation format derived according to the selection criteria is necessary. Therefore, this study intends to propose a method for long-term preservation through empirical verification of the preservation format after deriving an evaluation the framework for the preservation format selection criteria considering the characteristics of the dataset.

정보관리학회지