바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 통계적 특성, 검색결과: 2
초록보기
초록

한국의 dCollection이 학위논문 수집기로 활용되고 있는데 반해, 일본의 레포지토리는 다양한 학술 컨텐츠를 수집, 보존, 확산하고 오픈 엑세스를 실현하기 위한 개별 기관의 자발적인 운영 도구로 발전되고 있다. 본 연구는 일본의 기관 레포지토리 통계 DB인 IRDB를 통해 레포지토리의 특성을 통계적으로 분석하고 구축된 컨텐츠량, 종별 구축 비율, 그리고 종간 상관성을 살펴보았다. 또한 등록된 컨텐츠 특성을 변수로 K-means 군집 분석을 수행함으로써, 일본에 형성된 기관 레포지토리가 어떻게 유형화될 수 있는지 분석하였다. 분석 결과, 일본의 기관 레포지토리는 교내학술논문, 학위논문, 기술보고서, 의학자료, 학술잡지논문 등 다양한 컨텐츠를 수용하고 있을 뿐 아니라, 컨텐츠의 특징에 따라 5개의 차별화된 군집으로 유형화됨으로써 다양한 모습으로 발전되어 가고 있었다.

Abstract

While dCollections of Korea have been initiated by a government for metadata harvesting, institutional repositories of Japan have been managed as instituion’s independent tool for not only collectiong, archiving and distributing their intellecture assets, but also realizing open access. This study analyzes IRDB of Japanese statistically for understanding features of institutional repositories and by clustering the repository on the basis of types of contents, the differences have been brightened. According to analysis result, Japanese repository contains diverse types of contents, such as journal articles, scholarly papers, text books and technical reports. etc. and clustered by five distinguished group with different contents type.

초록보기
초록

본 연구는 Figshare를 통해 공유되고 있는 문헌정보학분야 연구데이터의 유형, 주제, 공개 수준 등을 분석하고 재사용성이 상대적으로 높은 데이터의 특성을 통계적으로 해석해 보았다. 분석 결과 데이터의 유형은 dataset과 paper 유형이, 주제 분야는 open access와 research data가 가장 많은 비중을 차지하였으며, 70%에 가까운 연구데이터가 pdf와 같이 편집과 재사용이 원활하지 않은 형태로 공개되어 있는 것으로 조사되었다. 또한 연구데이터의 특성과 활용 정도간의 관계 분석 결과, 주제에 있어서는 APC(Article Processing Charge)를 비롯한 open access 영역이 가장 많이 활용되고 있는 것으로 나타났으며, 데이터 유형에 있어서는 paper의 활용도가 가장 높은 것으로 나타났다.

Abstract

This study analyzed the type, subject and open level of research data in the field of library and information science field shared by Figshare, and statistically analyzed the characteristics of data with relatively high recyclability. The results of the analysis showed that datasets and papers were most common data types, and open access and research data were the most common keywords of data, and that 70% of the data were published in a form that can not be processed mechanically such as pdf. As a result of analysis of the relationship between characteristics of research data and degree of sharing, open access areas such as APC (Article Processing Charge) were found to be most common in the subject. However in data type, gray literature such as paper found to be highly utilized rather than dataset.

정보관리학회지