바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: data science, 검색결과: 82
1
정은경(이화여자대학교 사회과학대학 문헌정보학과 교수) 2020, Vol.37, No.1, pp.153-177 https://doi.org/10.3743/KOSIM.2020.37.1.153
초록보기
초록

오픈과학의 흐름에서 데이터 공유와 재이용은 중요한 연구자의 활동이 되어가고 있다. 데이터 공유와 재이용에 관한 여러 논의 중에서 데이터학술지와 데이터논문의 발간이 가시적인 결과를 보여주고 있다. 데이터학술지는 여러 학문 분야에서 발간되고 있으며, 논문의 수도 점차 증가하고 있다. 데이터논문은 데이터 자체와는 다르게 인용을 주고 받는 활동이 포함되어, 따라서 이들이 형성하는 고유한 지적구조가 생겨나게 된다. 본 연구는 데이터학술지와 데이터논문이 학술커뮤니티에서 구성하는 지적구조를 규명하고자 Web of Science에 색인된 14종의 데이터학술지와 6,086건의 데이터논문과 인용된 참고문헌 84,908건을 분석하였다. 저자사항과 함께 동시인용분석과 서지결합분석을 네트워크로 시각화하여 데이터논문이 형성한 세부 주제 분야를 규명하였다. 분석결과, 저자, 저자소속기관, 국가를 추출하여 출현빈도를 살펴보면, 전통적인 학술지 논문과 다른 양상을 보인다. 이러한 결과는 데이터의 생산이 용이한 기관과 국가에 주로 데이터논문을 출간하기 때문이라고 해석될 수 있다. 동시인용분석와 서지결합분석 모두 분석도구, 데이터베이스, 게놈구성 등이 주된 세부 주제 영역으로 나타났다. 동시인용분석결과는 9개의 군집으로 형성되었는데, 특정 주제 분야로 나타난 영역은 수질과 기후 등의 분야이다. 서지결합분석은 총 27개의 컴포넌트로 구성되었는데, 수질, 기후 이 외에도 해양, 대기 등의 세부 주제 영역이 파악되었다. 특기할만한 사항으로는 사회과학 분야의 주제 영역도 나타났다는 점이다.

Abstract

In the context of open science, data sharing and reuse are becoming important researchers’ activities. Among the discussions about data sharing and reuse, data journals and data papers shows visible results. Data journals are published in many academic fields, and the number of papers is increasing. Unlike the data itself, data papers contain activities that cite and receive citations, thus creating their own intellectual structures. This study analyzed 14 data journals indexed by Web of Science, 6,086 data papers and 84,908 cited references to examine the intellectual structure of data journals and data papers in academic community. Along with the author’s details, the co-citation analysis and bibliographic coupling analysis were visualized in network to identify the detailed subject areas. The results of the analysis show that the frequent authors, affiliated institutions, and countries are different from that of traditional journal papers. These results can be interpreted as mainly because the authors who can easily produce data publish data papers. In both co-citation and bibliographic analysis, analytical tools, databases, and genome composition were the main subtopic areas. The co-citation analysis resulted in nine clusters, with specific subject areas being water quality and climate. The bibliographic analysis consisted of a total of 27 components, and detailed subject areas such as ocean and atmosphere were identified in addition to water quality and climate. Notably, the subject areas of the social sciences have also emerged.

2
김나연(이화여자대학교 일반대학원 문헌정보학과 석사) ; 정은경(이화여자대학교 문헌정보학과 교수) 2020, Vol.37, No.4, pp.1-26 https://doi.org/10.3743/KOSIM.2020.37.4.001
초록보기
초록

오늘날 점차 데이터 집약적으로 변모하는 학문 환경 속에서 데이터는 연구부산물이 아닌 연구성과물로써 학술 커뮤니케이션의 기반으로 자리 잡아가고 있다. 그러나 데이터 공급의 확대나 접근가능성의 확보만으로는 실제적인 데이터 재이용을 담보하는 데 한계가 있다. 이를 극복하기 위해서는 학술연구자의 데이터 재이용 행위와 데이터요구를 심층적으로 파악할 필요성이 있다. 따라서 본 연구는 연구자의 주요 데이터 재이용 행위와 데이터요구를 규명하고자 하였다. 이를 위해 한국사회과학자료원(KOSSDA)의 최근 3개년 데이터 재이용문헌 중 KCI 등재 논문의 저자를 연구대상으로 선정하고, 인터뷰를 수락한 연구자 12명과의 심층면담을 수행하였다. 심층면담 분석결과, 데이터를 재이용하는 요인은 개인적, 경제적, 기술적, 사회적 측면 모두에서 나타났으며, 데이터 재이용 목적에 따라 데이터 그 자체를 이용하거나 데이터가 지닌 맥락정보를 활용하였다. 웹 기반의 정보원으로부터 데이터를 주로 습득하였으나 비공식적인 커뮤니케이션을 통해 파악하는 경우도 있었다. 한편 데이터 재이용 시에 발생하는 학술연구자의 데이터요구를 살펴보면 생산 단위는 기관을, 언어는 영어를, 국가로는 미국을 선호하였다. 또한 조사원 기입식 대인면접 조사 방식으로 수집된 양적 데이터를 우선시하였다. 메타데이터와 식별정보를 충분히 포함한 원자료 수준의 데이터를 긍정적으로 인식하였으나, 접근 및 이용이 통제된 데이터는 데이터가 지닌 가치에 대한 확신을 갖기 어려워 부정적으로 받아들였다. 그러나 데이터의 규모나 최신성과 관련된 선호는 뚜렷하게 나타나지 않았는데 이는 선택 가능한 유사 데이터가 부재하였기 때문이었다.

Abstract

In today’s increasingly data-intensive academic environment, data is becoming the foundation of academic communication as a research outcome rather than a research by-product. However, there is a limit to guaranteeing actual data reuse only by expanding the data supply or securing accessibility. In order to overcome this, it is necessary to understand the data reuse behavior and data needs in-depth. Therefore, this study attempted to identify the major data reuse behavior and data needs among researchers. To this end, the authors of KCI papers among the data reuse documents of the Korea Social Science Data Archive (KOSSDA) for the past 3 years were targeted. An in-depth interview was conducted with 12 researchers who accepted the interview. As a result, factors considered when reusing data were personal, economic, technical, and social aspects, and it was found that the data itself was used or contextual information of the data was used depending on the purpose of data reuse. The path to acquiring data is a web-based source of information, and a path through informal communication can also be found. In terms of the data needs, it was found that they prefer English, the United States, and institutional producers. Also they have a clear preference for quantitative data from an interviewer-filled interpersonal interview survey method, rich metadata along with raw data, and data that contains identification information. However, due to the lack of confidence in the value, it is negative for the use of data with controlled access and use, and it is difficult to confirm a clear preference because there is no similar data available for selection in terms of size and freshness.

초록보기
초록

본 연구는 미국도서관협회(American Library Association, ALA)의 인가를 받은 문헌정보학 프로그램에서 제공하는 데이터사이언스와 관련된 수업의 내용을 조사했다. 연구의 목적은 강의 계획서의 내용 분석을 통해 해당 수업에서 다뤄지는 교과목 명, 교과 설명, 학습 목표, 주차 별 주제를 살펴보는 것이다. 문헌정보학 프로그램에서의 데이터사이언스와 관련된 필수 과목 및 선택 과목은, 데이터사이언스 개론, 데이터 마이닝, 데이터베이스, 데이터 분석, 데이터 시각화, 데이터 큐레이션 및 관리, 머신 러닝, 메타데이터, 컴퓨터 프로그래밍 등 데이터사이언스 전 분야에 걸쳐 다양하게 교과목이 개설되어 있었다. 본 연구의 결과는 문헌정보학 프로그램에서 데이터사이언스 교과 과정을 개설 및 개정할 때 논의의 시작점이 될 수 있는 기초 자료가 되어 운영 역량을 강화하는데 활용되기를 기대한다.

Abstract

This preliminary study examined the status of data science-related course syllabi in the American Library Association (ALA) accredited Library and Information Science (LIS) programs. The purpose of this study was to explore LIS course syllabi related to data science, such as course title, course description, learning outcomes, and weekly topics. LIS programs offer various topics in data science such as the introduction to data science, data mining, database, data analysis, data visualization, data curation and management, machine learning, metadata, and computer programming. This study contributes to helping instructors develop or revise course materials to improve course competencies related to data science in the ALA-accredited LIS programs.

초록보기
초록

본 연구는 Figshare를 통해 공유되고 있는 문헌정보학분야 연구데이터의 유형, 주제, 공개 수준 등을 분석하고 재사용성이 상대적으로 높은 데이터의 특성을 통계적으로 해석해 보았다. 분석 결과 데이터의 유형은 dataset과 paper 유형이, 주제 분야는 open access와 research data가 가장 많은 비중을 차지하였으며, 70%에 가까운 연구데이터가 pdf와 같이 편집과 재사용이 원활하지 않은 형태로 공개되어 있는 것으로 조사되었다. 또한 연구데이터의 특성과 활용 정도간의 관계 분석 결과, 주제에 있어서는 APC(Article Processing Charge)를 비롯한 open access 영역이 가장 많이 활용되고 있는 것으로 나타났으며, 데이터 유형에 있어서는 paper의 활용도가 가장 높은 것으로 나타났다.

Abstract

This study analyzed the type, subject and open level of research data in the field of library and information science field shared by Figshare, and statistically analyzed the characteristics of data with relatively high recyclability. The results of the analysis showed that datasets and papers were most common data types, and open access and research data were the most common keywords of data, and that 70% of the data were published in a form that can not be processed mechanically such as pdf. As a result of analysis of the relationship between characteristics of research data and degree of sharing, open access areas such as APC (Article Processing Charge) were found to be most common in the subject. However in data type, gray literature such as paper found to be highly utilized rather than dataset.

5
이정윤(중앙대학교 문헌정보학과 석사과정) ; 김학래(중앙대학교 문헌정보학과 교수) 2024, Vol.41, No.1, pp.189-210 https://doi.org/10.3743/KOSIM.2024.41.1.189
초록보기
초록

문헌정보학 전공자는 사서직 공무원, 대학도서관, 공공도서관 등 도서관 분야로 취업하는 경향이 있다. 반면, 최근의 정보기술 발전과 직업관의 변화는 문헌정보학 전공자의 진로를 다양한 영역으로 확대하고 있다. 진로탐색에 대한 연구는 대학의 전공 또는 직업군에 따라 다양한 방식으로 진행되고 있다. 본 연구는 문헌정보학 전공자의 지속적인 진로탐색을 위해 애자일 방식으로 설문조사와 데이터 분석을 위한 프레임워크를 제안하고, 문헌정보학 전공자의 진로탐색 조사에 대한 결과를 분석한다. 연구 결과에 따르면, 문헌정보학 전공자는 사회변화에 따라 급여, 가치관에 대한 변화가 있고, 사서직에 한정되지 않고 다양한 직종을 희망하는 경향이 나타나고 있다. 이런 맥락에서 문헌정보학 전공자의 진로탐색을 위한 효과적인 지원과 지속적인 연구가 필요하다.

Abstract

Individuals majoring in Library and Information Science (LIS) typically find employment in the library sector, such as working as librarians, university librarians, and in public libraries. Recent advancements in information technology and shifts in work outlooks have broadened the professional opportunities for students majoring in LIS in several sectors. Research on career exploration varies based on the university major or occupation. This paper suggests a methodology for conducting surveys and analyzing data efficiently to support ongoing career exploration for students majoring in LIS. It also examines the findings of a career exploration survey conducted among LIS majors. The survey findings indicate that individuals majoring in LIS are adapting their salary expectations and priorities in alignment with societal shifts, showing a preference for diverse career opportunities outside traditional librarian roles. Effective support and ongoing research are essential for the career development of LIS majors in this environment.

6
김순(이화여자대학교) ; 이보람(한국전자통신연구원) ; 김환민(한국과학기술정보연구원) ; 김혜선(한국과학기술정보연구원) 2017, Vol.34, No.3, pp.229-249 https://doi.org/10.3743/KOSIM.2017.34.3.229
초록보기
초록

공공연구 성과물(출판물 및 데이터)을 디지털 포맷으로 공개하여 이들 자료에 대한 접근성을 높이고자 하는 오픈 사이언스 프로젝트가 국외에서 활발히 진행되고 있다. 해외에서는 오픈 사이언스의 주요 특징인 공개 연구, 오픈 액세스, 연구데이터 공유, 공개적인 동료 평가, 투명한 연구 성과 평가에 맞추어 연구자 중심의 다양한 연구지원 서비스가 이루어지고 있다. 본 연구는 오픈 사이언스 시대를 대비하여 해외의 과학기술정보 서비스에 대해 심층 분석하고 국내 활용현황을 조사하였다. 국외의 적극적인 오픈 사이언스 대응현황에 비해 국내에서는 오픈 액세스나 기관 리포지터리 정도만 준비가 되어 있고, 연구데이터 관리나 협력 연구에 대해서는 아직까지 준비가 미비한 상태로 분석되었다. 따라서 국내 정보서비스 기관에서도 오픈 사이언스 시대를 대비하여 해외 우수 사례들을 충분히 고찰하여 이를 효과적으로 실행할 수 있는 연구지원 서비스 정책과 가이드라인 마련이 시급한 것으로 나타났다.

Abstract

Open science projects are being actively carried out globally. Publishing the results of public research (publications and data) in digital format and enhancing access to these materials are getting more important. Various research support tools are being used to support open research, open access, open data, open peer review and open research performance evaluation. We analyzed research support services to prepare open science movement in Korea. Korea is not ready for research data management and research collaboration except open access and institutional repositories. It can be seen as an urgent matter to analyze these international open science research support services carefully and reflect them in research support policy and service guideline.

초록보기
초록

미래 도서관의 패러다임이 정보소장에서 정보접근으로 변화됨에 따라 도서관상호협력과 문헌제공서비스의 중요성이 증가하고 있다. 이를 위하여 개별 도서관들은 자료의 구입예산을 절감하고 도서관정보서비스의 질적인 향상을 물론 이용자의 정보서비스에 대한 만족도를 제고한다는 점에서 문헌제공서비스의 활용은 상당한 장점이 있다. 본 연구는 문헌제공서비스의 효과적인 수행과 이용을 위한 국내 이용자들의 문헌제공서비스 트랜잭션 데이터 분석을 통하여 문헌제공서비스의 이용추이와 동향을 예측하고, 여기에 나타난 그들의 요구변화를 검토하여 국내 도서관 및 정보센터의 문헌제공서비스의 질적인 향상과 이용자 만족도 제고에 사용할 수 있는 근거 자료를 제시하는데 그 목적이 있다. 이를 위하여 KISTI-DDS의 실제 이용데이터를 활용하여 문헌제공서비스의 연도별, 지역별, 이용계층별 차이를 분석하였으며, 자료유형별 복사추이도 관찰하였다. 또한 이용자들이 원문복사를 제공하는 복사제공기관과 원문입수방법을 검토하고 연도별, 이용계층별로 의미있는 차이가 있는지를 분석하였다.

Abstract

The purpose of this study is to analyze the usage patterns of document delivery services of domestic users based on usage transaction data about photocopying services of KISTI-DDS that the most important document delivery organization in Korea. For the purpose of this study, it was investigated the number of processed document, type of favorite documents, ordering coverage for photocopying, delivery methods of photocopying documents for users in DDS(document delivery service) through transaction data of DDS during the past 4 years from 2000 to 2003.

8
박지원(전남대학교 대학원 기록관리학과) ; 장우권(전남대학교) 2021, Vol.38, No.4, pp.199-230 https://doi.org/10.3743/KOSIM.2021.38.4.199
초록보기
초록

이 연구는 연구데이터 재이용에 대한 연구자 및 재이용 데이터를 조사를 통해 연구데이터 재이용 영향에 대한 분석 및 활성화 방안을 제시하는데 있다. 이를 위해 연구데이터를 재이용하여 뉴 연구결과물을 산출한 경험이 있는 국내 사회과학분야 학술 연구자를 대상으로 설문배포와 회수를 토대로 178부를 분석하였다. 그 결과, 1) 대부분의 연구자들은 데이터 리포지터리, 데이터관리시스템, 연구데이터 DB와 같은 시스템을 통해 재이용 데이터를 획득하고, 실험 및 관찰을 통해 생산된 분석데이터를 주로 재이용하는 것으로 나타났다. 또한 성공적으로 연구데이터를 재이용한 연구자임에도 불구하고 연구데이터 공유에 대한 인식이 낮을뿐더러 다양한 문제에 직면하여 공유를 하지 않았다. 2) 문헌 검토와 요인 분석을 통해 도출한 10가지 요인(학문적 유용성, 연구의 효율성, 연구자의 우려사항, 데이터 취약성, 직접적 노력, 간접적 노력, 재이용 적합성, 데이터 완전성, 데이터 유용성, 사회적 조건)의 신뢰성과 타당성을 검증하였다. 3) 상관 분석결과 연구 효율성, 사회적 조건은 연구데이터 재이용 의도와 양적 상관관계가, 연구자의 우려사항, 데이터 취약성, 직접적 노력은 연구데이터 재이용 의도와 음적 상관관계가 나타났다. 회귀 분석 결과 이 요인들은 모두 연구데이터 재이용 의도에 유의미한 영향을 미치는 것으로 나타났으며, 연구의 효율성, 사회적 조건, 직접적 노력, 연구자의 우려사항, 데이터 취약성 순서로 연구데이터 재이용 의도에 영향을 미치는 것으로 나타났다. 이를 토대로 연구데이터 재이용 활성화 방안을 제시하였다.

Abstract

This study is to present an analysis and activation plan for the effect of reuse of research data through investigation of researchers and reuse data on reuse of research data. To this end, 178 copies were analyzed based on the distribution and collection of surveys targeting academic researchers in the field of social science in Korea who have experience in calculating new research results by reusing research data. As a result, 1) Most researchers acquire reuse data through systems such as data repositories, data management systems, and research data DBs, and mainly reuse analysis data produced through experiments and observations. In addition, despite being a researcher who successfully reused research data, the awareness of research data sharing was low and did not share it in the face of various problems. 2) The reliability and validity of 10 factors derived through literature review and factor analysis (academic usefulness, research efficiency, researcher concerns, data vulnerability, direct effort, indirect effort, suitability for reuse, data completeness, data usefulness, and social conditions) were verified. 3) As a result of correlation analysis, research efficiency, social conditions showed a quantitative correlation with research data reuse intention, researcher concerns, data vulnerability, and direct effort showed a negative correlation with research data reuse intention. As a result of regression analysis, all of these factors had a significant effect on the intention to reuse research data, and in the order of research efficiency, social conditions, direct efforts, researchers’ concerns, and data vulnerability. Based on this, a plan to revitalize the reuse of research data was proposed.

초록보기
초록

최근 문헌정보학의 관련 분야로 주목받고 있는 데이터과학은 오랫동안 문헌정보학에서 해오던 정보의 수집, 저장, 조직, 분석, 활용 등의 활동을 데이터에 적용하여 그 가치를 이해하려는 학문이며, 통계학과 컴퓨터공학 등 다른 학문분야와의 연계가 필요한 분야이다. 이러한 데이터과학 분야의 연구 영역을 파악하기 위하여 동시출현단어 분석을 사용하여 Web of Science 핵심컬렉션에 수록된 문헌들 중 데이터과학 관련 자료들을 수집하고, 그 주제범주를 활용하여 네트워크분석을 실시하였다. 총 667건의 자료에 대한 159개의 주제범주를 기술분석하여 데이터과학 관련 연구가 많이 이루어지고 있는 학문분야를 조사하였고, 네트워크분석을 통해 데이터과학 분야 연구영역의 지적구조를 시각적으로 파악하였다. 분석결과, 데이터과학 분야의 연구들은 2개 영역 9개 군집으로 구분되었으며, 주제범주의 용어들 중 중심성이 높은 용어들을 통해 각 군집의 대표적인 주제들을 선정하였다. 연구의 결과는 데이터과학 분야의 연구들에 대한 지적구조를 파악하는데 도움이 될 수 있고, 문헌정보학과의 연계융합전공으로서의 데이터과학 교과과정 개발에 방향성을 제시할 수도 있을 것이다.

Abstract

Data Science is emerging as a closely related field of study to Library and Information Science (LIS), and as an interdisciplinary subject combining LIS, statistics and computer science in an attempt to understand the value of data by applying what LIS has been doing for collecting, storing, organizing, analyzing, and utilizing information. To investigate which subject fields other than LIS, statistics, and computer science are related to Data Science, this study retrieved 667 materials from Web of Science Core Collection, extracted terms representing Web of Science Categories, examined subject fields that are studying Data Science using descriptive analysis, analyzed the intellectual structure of the field by co-word analysis and network analysis, and visualized the results as a Pathfinder network with clustering created with the PNNC clustering algorithm. The result of this study might help to understand the intellectual structure of the Data Science field, and may be helpful to give an idea for developing relatively new curriculum.

10
서선경(한국과학기술정보연구원) ; 최호남(한국과학기술정보연구원) ; 김병규(KISTI) ; 최선희(한국과학기술정보연구원) ; 김정환(한국과학기술정보연구원) 2016, Vol.33, No.2, pp.157-176 https://doi.org/10.3743/KOSIM.2016.33.2.157
초록보기
초록

Cited-by Linking 서비스는 CrossRef에서 제공하는 주요 서비스 중 하나로 해당 논문이 DOI를 통하여 얼마나 인용되었는지 누적하여 집계된 데이터이다. 이에 본 연구에서는 KISTI의 학술정보통합관리시스템에서 월단위로 구축․관리하는 Cited-by Linking 데이터를 분석하여 자연과학과 공학 분야의 인용 패턴을 규명하고자 하였다. 이를 위해서 전체 기탁된 21만 건 중 자연과학과 공학 분야 총 170,999건(315종)을 분석 대상으로 하고, 2016년 3월까지 누적된 Cited-by Linking 데이터를 수집하였다. 연구의 분석 결과, 첫째, 글로벌하게 인용될 가능성에서 사용 언어는 영향을 미치고 있으며, 둘째, SCIE 및 SCOPUS 등재 여부 역시 인용가능성에 상당 부분 기여하고 있음을 확인하였다. 셋째, 자연과학 분야는 거의 동일한 주제 분야에서 인용을 받고 있으며, 상대적으로 공학 분야는 타주제 분야에서 더 인용 받고 있음을 파악하였다. 이러한 연구의 결과는 자연과학과 공학 분야의 세부주제 분야별 인용 행태를 규명하고, 향후, 인용 행태에 관한 연구에서 유용하게 활용될 것으로 기대한다.

Abstract

Cited-by Linking Service is one of the CrossRef’s information services that allows you to discover how your publications are being cited and to incorporate that information into your online publication platform. This study tries to investigate citation patterns in the field of both Natural Science and Engineering using all of DOI assigned articles and Cited-by Linking data which are accumulated and managed by KISTI. The investigating approach is designed to verify the theory of 1) cognitive accessibility, 2) ‘perceived quality and significance’ and 3) ‘subject relativity’. For cognitive accessibility verification the fulltext language portion of Korean and English between “Cited DOI Source Data” and “NOT Cited DOI Source Data” was compared. For perceived quality and significance verification the availability of the “Cited DOI Source Data” and “NOT Cited DOI Source Data” from SCIE and SCOPUS was employed. For subject relativity DOI data were classified and analysed on the basis of OECD subject classification scheme. Findings are that global citability is closely related to the fulltext language of the articles and their quality and significance. And in the natural science field most of citations are from the same subject categories, while relatively more citations are from other subject categories in the engineering field.

정보관리학회지