바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: data journal, 검색결과: 56
41
이지연(연세대학교) ; 감미아(연세대학교) ; 한남기(연세대학교) ; 송한나(연세대학교) 2016, Vol.33, No.2, pp.177-200 https://doi.org/10.3743/KOSIM.2016.33.2.177
초록보기
초록

본 연구는 학제성이 강한 HCI 연구 내에서 문헌정보학 분야 연구가 수행한 연구내용과 역할을 분석하고 향후 타 학문분야와의 협력 가능성 및 수행 가능한 연구주제를 살펴보고자 하였다. 연구에서 사용된 데이터는 문헌정보학 분야의 대표적인 국내 학술지 및 한국HCI학회 학술대회의 발표논문집에서 추출한 키워드와 소속 정보이며, 이들을 활용하여 네트워크 분석과 빈도 분석을 하였다. 국내 HCI 분야에서는 정보통신, 컴퓨터공학, 기술산업 등이 활발한 교류를 보이고 있었으며, 문헌정보학은 연구 협력에 있어서 비교적 소극적이었다. 문헌정보학 연구의 HCI 분야 내 역할을 살펴본 결과, 타 분야와 협력이 필요한 전문적인 주제에 대해서는 그 관심도가 높지 않음을 발견했다. 그러나 문헌정보학 분야 학술지에 타 학문분야 연구자들이 HCI 관련 논문을 다수 게재했다는 점과 기술산업 분야와도 어느 정도 연결성을 가지고 있다는 점에서, 향후 문헌정보학 분야가 기술산업 등 타 분야와의 협력을 통한 공동연구를 적극적으로 수행한다면 학계 간의 연구주제 확장 및 발전에 기여할 수 있음을 발견하였다.

Abstract

The purpose of this study was to analyze how the Library and Information Science (LIS) related research efforts in Korea contributed to the progress of the Human Computer Interaction (HCI) discipline to identify the potential collaboration research partners and topics. The following data was used for the network and frequency analysis: titles, keywords and affiliation information extracted from the Korean journals serving the LIS fields as well as the conference proceedings of the Korean HCI society. Information communication technology, computer engineering, and technology industry had been active in research collaborations but LIS field was comparatively not active. This study was able to determine that LIS researchers carried out important research but they had not much interests in the topics that required interdisciplinary collaboration. However, there were a number of papers, which were not authored by LIS discipline researchers, in the LIS related journals. In addition, there are a few ongoing interdisciplinary research projects which included LIS researchers. This reveals that it is possible for the LIS field could play an important role in the future if the researchers actively participate the collaborative projects.

초록보기
초록

본 연구는 대학도서관의 연구데이터관리서비스 개발을 위하여 수행되었다. 본 연구에서는 연구데이터관리서비스의 요소와 제공 수준을 알아보고, 국내에서 연구비 규모가 가장 큰 대학인 서울대학교 소속 연구자들을 대상으로 인터뷰를 진행하여 연구자들의 연구데이터관리 및 공유와 이용, 서비스에 대한 요구를 분석하였다. 인터뷰 참여자들은 해외 연구비지원기관 또는 학술 저널에서 제시하는 데이터 공유 의무조항에 대한 인식과 이행 경험이 부족하고 데이터를 체계적으로 관리하는데 어려움을 겪고 있었다. 그러나 상당수의 연구자들이 데이터 관리 및 연구데이터관리서비스 관련 교육에 대한 필요성에 대해 동감하고 있었다. 이를 바탕으로, 연구데이터관리서비스를 교육서비스, 전문 컨설팅 서비스, 큐레이션 기술 서비스 요소로 나누어 각 요소별 이용자의 요구를 반영한 서비스를 제안하였다. 본 연구결과는 향후 국내 대학도서관 및 연구데이터관리서비스를 계획하고 있는 기관에서 서비스 개발의 기초자료로 활용할 수 있을 것이다.

Abstract

This study aimed to develop Research Data Management (RDM) Services in a domestic university library of Korea. In this study, elements and levels of RDM services are examined and in-depth interview was conducted with university researchers affiliated in Seoul National University, which has the largest amount of research fund among universities in Korea. Interview was conducted to analyze their data management practices and needs of RDM services. Interview results show researchers’ lack of awareness toward Data Management Policy and data sharing obligations of funding agencies and academic journal publishers. Also, they had trouble managing research data systematically. However, many of the researchers understand the necessary of research data management and education of data management. Based on the interview result, service elements and contents are suggested for RDM services which is consisted of education services, professional consulting services, curation technical services. This study result will help to guide for the planning the future RDM service in university library of Korea.

43
김인후(중앙대학교 문헌정보학과 대학원) ; 김성희(중앙대학교 문헌정보학과) 2022, Vol.39, No.3, pp.293-310 https://doi.org/10.3743/KOSIM.2022.39.3.293
초록보기
초록

본 연구에서는 한국어 데이터로 학습된 BERT 모델을 기반으로 문헌정보학 분야의 문서를 자동으로 분류하여 성능을 분석하였다. 이를 위해 문헌정보학 분야의 7개 학술지의 5,357개 논문의 초록 데이터를 학습된 데이터의 크기에 따라서 자동분류의 성능에 어떠한 차이가 있는지를 분석, 평가하였다. 성능 평가척도는 정확률(Precision), 재현율(Recall), F 척도를 사용하였다. 평가결과 데이터의 양이 많고 품질이 높은 주제 분야들은 F 척도가 90% 이상으로 높은 수준의 성능을 보였다. 반면에 데이터 품질이 낮고 내용적으로 다른 주제 분야들과 유사도가 높고 주제적으로 확실히 구별되는 자질이 적을 경우 유의미한 높은 수준의 성능 평가가 도출되지 못하였다. 이러한 연구는 미래 학술 문헌에서 지속적으로 활용할 수 있는 사전학습모델의 활용 가능성을 제시하기 위한 기초자료로 활용될 수 있을 것으로 기대한다.

Abstract

In this study, we analyzed the performance of the BERT-based document classification model by automatically classifying documents in the field of library and information science based on the KoBERT. For this purpose, abstract data of 5,357 papers in 7 journals in the field of library and information science were analyzed and evaluated for any difference in the performance of automatic classification according to the size of the learned data. As performance evaluation scales, precision, recall, and F scale were used. As a result of the evaluation, subject areas with large amounts of data and high quality showed a high level of performance with an F scale of 90% or more. On the other hand, if the data quality was low, the similarity with other subject areas was high, and there were few features that were clearly distinguished thematically, a meaningful high-level performance evaluation could not be derived. This study is expected to be used as basic data to suggest the possibility of using a pre-trained learning model to automatically classify the academic documents.

초록보기
초록

오늘날 정보환경은 정보이용자로 하여금 도서관 장서뿐만 아니라 다양한 디지털 정보자원으로의 접근을 가능하게 하였다. 변화하는 환경에서 이용률이 증가하는 디지털 정보자원으로 웹사이트, 각종 데이터, 홈페이지 등을 들 수 있다. 이 연구는 ISI Web of Knowledge의 Essential Science Indicators에서 제공하는 인용정보를 이용하여 임상의학 분야의 피인용 횟수가 높은 저자들과 이 저자들의 논문을 인용한 저자들의 홈페이지에 수록된 연구 성과물을 추출한 후, 의학대학 디지털 도서관 및 학술포털과 비교 분석하였다. 10,000여명의 저자 중 연구 성과물 정보를 제시하는 146명의 홈페이지 연구정보를 분석하였는데, 홈페이지에서만 제공하는 연구정보는 학술지 논문, 단행본, 학술대회 발표논문, 강의노트를 포함하였다. 이 중 학술지 논문은 약 15%, 단행본은 약 32%, 학술대회 발표논문은 약 48%, 강의노트는 100% 모두 홈페이지를 통해서만 접근할 수 있는 연구 성과물로 분석되었다. 실제로 의학대학 도서관과 학술포털에서 제공하는 연구정보가 대부분 일치했던 점을 고려할 때, 저명한 연구자들의 홈페이지를 통한 연구정보의 확충이 디지털 도서관 장서개발의 양적, 질적 향상을 위한 방안이 될 수 있다.

Abstract

Nowadays the information environment enables users to access the traditional library collection as well as various digital information resources. In this rapidly changing environment, the use of digital information resources such as web sites, data, and homepages has increased. In this research, highly-cited authors' research outcomes as well as the research outcomes of the people, who cited the highly-cited authors' works, were extracted then compared with information stored in the medical colleges' digital libraries and the academic information portals in the clinical medicine area by using the citation information provided by Essential Science Indicators from ISI Web of Knowledge. Out of 10,000 authors, 146 people's homepages, which present research outcomes, were analyzed. The research outcomes listed in the homepages included journal papers, monographs, conference proceedings, and lecture notes. About 15% of the journal papers, 32% of the monographs, 48% of the conference proceedings, and 100% of lecture notes were accessible only through the homepages. The research outcomes accessible from the homepages were almost analogous to the ones available through the medical college's digital libraries and the academic information portals. Therefore, the digital library collection will be improved and expanded quantitatively and qualitatively by collecting and using the information in the homepages of the prestigious researchers.

45
최형욱(이화여자대학교 일반대학원 문헌정보학과) ; 정은경(이화여자대학교) 2017, Vol.34, No.3, pp.109-124 https://doi.org/10.3743/KOSIM.2017.34.3.109
초록보기
초록

여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문 인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 ‘Sociology’로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 ‘Sociology’로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

Abstract

Through a wide variety of disciplines, practices on data access and re-use have been increased recently. In fact, there has been an emerging phenomenon that researchers tend to use the data sets produced by other researchers and give scholarly credit as citation. With respect to this practice, in 2012, Thomson Reuters launched Data Citation Index (DCI). With the DCI, citation to research data published by researchers are collected and analyzed in a similar way for citation to journal articles. The purpose of this study is to identify the characteristics and intellectual structure of sociology field based on research data, which is one of actively data-citing fields. To accomplish this purpose, two data sets were collected and analyzed. First, from DCI, a total of 8,365 data were collected in the field of sociology. Second, a total of 12,132 data were collected from Web of Science with a topic search with ‘Sociology’. As a result of the co-word analysis of author provided-keywords for both data sets, the intellectual structure of research data-based sociology was composed of two areas and 15 clusters and that of article-based sociology was composed with three areas and 17 clusters. More importantly, medical science area was found to be actively studied in research data-based sociology and public health and psychology are identified to be central areas from data citation.

초록보기
초록

이 연구에서는 우리나라의 인문학자들이 최근 학술정보환경의 급격한 변화에 직면하여 연구를 수행하는 과정에서 현재 어떤 정보자원을 이용하고 중요하다고 여기며, 앞으로 오년 동안 이용 빈도의 변화를 어떻게 전망하는지 살펴보았다. 이 연구의 목적은 인문학자들의 정보자원 이용행태의 현상과 변화에 관한 전망을 포괄적으로 분석하고, 이를 근거로 대학도서관들이 어떤 서비스를 제공할 수 있는 방안을 제안하는 것이다. 이 연구를 위해 스물다섯 개 대학 소속 인문학 분야 교수 중 799명을 표본으로 확정한 후, 2007년 11월부터 2008년 1월 사이 우편 서베이를 실시하여, 모두 132개의 분석 가능한 설문을 수집하였다. 서베이 응답자들은 대체로 연구와 교육에 균등한 시간을 배분하며, 대부분 단독연구를 수행하는 독자적 연구행태를 보였다. 책과 인쇄학술지(심사)로 대표되는 전통적 자원의 현재 이용 빈도 및 중요성의 인식도가 절대적으로 높았으나, 전자원문, 전자학술지 등 텍스트 형태의 전자자원에 대한 의존도 또한 높았고, 향후 오년 동안 그 이용 빈도는 상당히 증가할 것으로 전망하였다. 인문학자들 가운데 신진연구자, 중견연구자 및 최고경력자 집단 사이에 정보자원의 이용 행태 면에서 다소 차이점이 있는 것으로 보였다. 대학도서관은 인문학자들을 위해 (1) 보다 적극적인 “아웃리치(Outreach)” 수행, (2) 인쇄 및 전자자원 장서의 균형적 구성 및 우선순위 결정, (3) 전통적 정보자원을 위한 정보리터러시 교육의 적절한 수행, (4) 전자자원 이용 행태의 현황 및 변화 추이의 지속적 모니터링 및 교육 시행, 그리고 (5) 적절한 물리적 공간으로서 역할 확인이 필요함을 강조하였다.

Abstract

The purpose of this study is to investigate the use of information resources of the humanities scholars in Korea and suggest the strategic planning of academic library and information services to serve their needs. To collect data, a mail survey was conducted during the period of November 2007 through January 2008. Out of 799 humanities scholars sampled from 25 universities, 132 responded with the completion rate of 16%. Major findings in this study are as follows: First, the majority of the humanities scholars distribute their time equally to research and education, and conduct independent research. Second, they still largely depend on print resources, including scholarly journals, books, and manuscripts for getting information, while using some online information resource mostly in text such as electronic documents and journals. They expect that the frequency of using such print resources would not decline much, but the use of online resources could definitely increase in the next five years. Some variances in the behavior were observed among the groups of scholars according to their research experiences. It is suggested that academic libraries (1) conduct more active outreach, (2) prioritize between traditional and electronic resources, (3) plan information literacy education for traditional resources.

47
이용구(계명대학교) ; 김병규(한국과학기술정보연구원) 2011, Vol.28, No.1, pp.309-326 https://doi.org/10.3743/KOSIM.2011.28.1.309
초록보기
초록

기존 메타데이터의 품질 측정 방법은 오류가 발생한 레코드를 단순히 계수하여 그 비율로 품질을 측정하였다. 이러한 한계를 극복하기 위해 메타데이터 요소별로 상대적 중요 정도를 나타내는 가중치를 적용함으로서, 메타데이터 품질을 체계적으로 계량화 하는 측정 방법을 제시하고자 하였다. 구체적인 가중치 부여 방법으로 엔트로피, 이용자 과업, 그리고 이용 통계를 활용하였다. 또한 이들을 결합하여 통합 가중치를 제시하고 실제 서비스 되고 있는 학술지 기사 메타데이터에 적용하였다. 실험 결과, 엔트로피 가중치 방법은 데이터 자체의 특성을 잘 반영하며, 이용자 과업을 적용한 방법은 이용자의 정보요구를 해결하는 필요한 메타데이터 요소를 제시하며, 통합 가중치는 특정 메타데이터 요소의 오류에 영향을 받지 않으면서 균형 잡힌 측정값을 제시하여 계량화 방법에 적합한 것으로 나타났다.

Abstract

Most metadata quality measurement employ simple techniques by counting error records. This study presents a new quantitative measurement of metadata quality using advanced weighting schemes in order to overcome the limitations of exiting measurement techniques. Entropy, user tasks, and usage statistics were used to calculate the weights. Integrated weights were presented by combining these weights and were applied to actual journal article metadata. Entropy weights were found to reflect the characteristics of the data itself. User tasks presented the required metadata elements to solve user's information need. Integrated weights showed balanced measures without being affected by the influence of error elements, This finding indicates the new method being suitable for quantitative measurement of metadata quality.

48
강보라(경북대학교 문헌정보학과) ; 김희섭(경북대학교) 2017, Vol.34, No.3, pp.49-66 https://doi.org/10.3743/KOSIM.2017.34.3.049
초록보기
초록

본 연구의 목적은 국내 디지털 도서관 관련된 연구의 동향을 분석하는 것이다. 연구의 목적을 달성하기 위하여 국내 문헌정보학 분야 대표 학술지 4종으로부터 최근 10년(2007년-2016년) 동안 발표된 디지털 도서관 관련 논문 272편을 대상으로 해당 논문의 저자가 직접 부여한 영문키워드 578개를 수집하였다. 수집된 자료는 NetMiner V.4를 사용하여 연결중심성과 매개중심성을 분석하였다. 연구 결과로는, 첫째, 연구 주제의 양적인 측면에서는 ‘Academic Library’, ‘Reference Service’, ‘Public Library’, ‘E Resource’, ‘E Book’ 순으로 나타났고, 둘째, 연구 주제의 영향력 측면에서는, ‘Academic Library’, ‘Reference Service’, ‘Information Behavior’, ‘E Resource’ 등의 순으로 나타났다. 마지막으로 연구 주제의 확장성 측면에서는, ‘Academic Library’, ‘Metadata’, ‘Information Behavior’, ‘E Resource’, ‘Librarian’ 등의 순으로 파악되었다.

Abstract

The aim of this study was to analyze the research trends on the digital libraries in Korea. To achieve this objective, a total of 578 author-assigned English keywords were collected from the 272 major LIS journal articles published in Korea during last ten years-period, i.e., 2007-2016. The collected data were analyzed using NetMiner V.4 to discover their ‘degree centrality’ and ‘betweenness centrality’. As the results, ‘Academic Library’, ‘Reference Service’, ‘Public Library’, ‘E Resource’, and ‘E Book’ showed the most frequently conducted research topics, and ‘Academic Library’, ‘Reference Service’, ‘Information Behavior’, and ‘E Resource’ were the most influencing research topics. Finally, ‘Academic Library’, ‘Metadata’, ‘Information Behavior’, ‘E Resource’, and ‘Librarian’ seemed the most widely intervening research topics in this research.

초록보기
초록

기계학습 기반 문서범주화 기법에 있어서 최적의 자질을 구성하는 것이 성능향상에 있어서 중요하다. 본 연구는 학술지 수록 논문의 필수적 구성요소인 저자 제공 키워드와 논문제목을 대상으로 자질확장에 관한 실험을 수행하였다. 자질확장은 기본적으로 선정된 자질에 기반하여 WordNet과 같은 의미기반 사전 도구를 활용하는 것이 일반적이다. 본 연구는 키워드와 논문제목을 대상으로 WordNet 동의어 관계 용어를 활용하여 자질확장을 수행하였으며, 실험 결과 문서범주화 성능이 자질확장을 적용하지 않은 결과와 비교하여 월등히 향상됨을 보여주었다. 이러한 성능향상에 긍정적인 영향을 미치는 요소로 파악된 것은 정제된 자질 기반 및 분류어 기준의 동의어 자질확장이다. 이때 용어의 중의성 해소 적용과 비적용 모두 성능향상에 영향을 미친 것으로 파악되었다. 본 연구의 결과로 키워드와 논문제목을 활용한 분류어 기준 동의어 자질 확장은 문서 범주화 성능향상에 긍정적인 요소라는 것을 제시하였다.

Abstract

Identifying optimal feature sets in Text Categorization(TC) is crucial in terms of improving the effectiveness. In this study, experiments on feature expansion were conducted using author provided keyword sets and article titles from typical scientific journal articles. The tool used for expanding feature sets is WordNet, a lexical database for English words. Given a data set and a lexical tool, this study presented that feature expansion with synonymous relationship was significantly effective on improving the results of TC. The experiment results pointed out that when expanding feature sets with synonyms using on classifier names, the effectiveness of TC was considerably improved regardless of word sense disambiguation.

초록보기
초록

이 연구는 색인가가 주제 색인하는 과정에서 참조하는 여러 문서구성요소를 문서 범주화의 정보원으로 인식하여 이들이 문서 범주화 성능에 미치는 영향을 살펴보는데 그 목적이 있다. 이는 기존의 문서 범주화 연구가 전문(full text)에 치중하는 것과는 달리 문서구성요소로서 정보원의 영향을 평가하여 문서 범주화에 효율적으로 사용될 수 있는지를 파악하고자 한다. 전형적인 과학기술 분야의 저널 및 회의록 논문을 데이터 집합으로 하였을 때 정보원은 본문정보 중심과 문서구성요소 중심으로 나뉘어 질 수 있다. 본문정보 중심은 본론 자체와 서론과 결론으로 구성되며, 문서구성요소 중심은 제목, 인용, 출처, 초록, 키워드로 파악된다. 실험 결과를 살펴보면, 인용, 출처, 제목 정보원은 본문 정보원과 비교하여 유의한 차이를 보이지 않으며, 키워드 정보원은 본문 정보원과 비교하여 유의한 차이를 보인다. 이러한 결과는 색인가가 참고하는 문서구성요소로서의 정보원이 문서 범주화에 본문을 대신하여 효율적으로 활용될 수 있음을 보여주고 있다.

Abstract

The purpose of this study is to examine whether the information resources referenced by human indexers during indexing process are effective on Text Categorization. More specifically, information resources from bibliographic information as well as full text information were explored in the context of a typical scientific journal article data set. The experiment results pointed out that information resources such as citation, source title, and title were not significantly different with full text. Whereas keyword was found to be significantly different with full text. The findings of this study identify that information resources referenced by human indexers can be considered good candidates for text categorization for automatic subject term assignment.

정보관리학회지