바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 색인, 검색결과: 6
초록보기
초록

이 연구는 색인가가 주제 색인하는 과정에서 참조하는 여러 문서구성요소를 문서 범주화의 정보원으로 인식하여 이들이 문서 범주화 성능에 미치는 영향을 살펴보는데 그 목적이 있다. 이는 기존의 문서 범주화 연구가 전문(full text)에 치중하는 것과는 달리 문서구성요소로서 정보원의 영향을 평가하여 문서 범주화에 효율적으로 사용될 수 있는지를 파악하고자 한다. 전형적인 과학기술 분야의 저널 및 회의록 논문을 데이터 집합으로 하였을 때 정보원은 본문정보 중심과 문서구성요소 중심으로 나뉘어 질 수 있다. 본문정보 중심은 본론 자체와 서론과 결론으로 구성되며, 문서구성요소 중심은 제목, 인용, 출처, 초록, 키워드로 파악된다. 실험 결과를 살펴보면, 인용, 출처, 제목 정보원은 본문 정보원과 비교하여 유의한 차이를 보이지 않으며, 키워드 정보원은 본문 정보원과 비교하여 유의한 차이를 보인다. 이러한 결과는 색인가가 참고하는 문서구성요소로서의 정보원이 문서 범주화에 본문을 대신하여 효율적으로 활용될 수 있음을 보여주고 있다.

Abstract

The purpose of this study is to examine whether the information resources referenced by human indexers during indexing process are effective on Text Categorization. More specifically, information resources from bibliographic information as well as full text information were explored in the context of a typical scientific journal article data set. The experiment results pointed out that information resources such as citation, source title, and title were not significantly different with full text. Whereas keyword was found to be significantly different with full text. The findings of this study identify that information resources referenced by human indexers can be considered good candidates for text categorization for automatic subject term assignment.

2
곽선영(이화여자대학교) ; 정은경(이화여자대학교) 2012, Vol.29, No.1, pp.115-134 https://doi.org/10.3743/KOSIM.2012.29.1.115
초록보기
초록

전통적인 저자동시인용분석은 인용색인 데이터베이스가 색인하는 제 1저자만을 대상으로 하기 때문에 제1저자 이외의 저자의 기여도가 제외된다는 한계를 지니고 있다. 본 연구의 목적은 경제학 분야를 대상으로 하여 복수저자기반의 저자동시인용분석을 활용하여 해당 학문분야의 지적구조를 제시하고자 한다. 이를 위하여 네 가지 실험집단을 구성하였다. (1) 인용된 문헌의 제 1저자만을 고려한 저자동시인용분석, (2) 문헌당 총합 제한 없이 복수저자에게 동일한 인용빈도 부여한 저자동시인용분석, (3) 문헌당 총 합을 제한하여 인용빈도를 부여한 저자동시인용분석, (4) 저자기입 순서를 고려하여 인용빈도를 부여한 저자동시인용분석. 본 연구의 결과는 크게 제 1저자만 고려한 방식과 복수저자를 모두 고려한 방식에 따라 군집형성에 있어서 차이를 보였다. 또한 복수저자의 인용빈도를 구하는 방식에 따라서 군집의 소속이 달라지는 변화를 찾아볼 수 있다. 이러한 결과는 공동저작이 증가하는 학문적 추세에 비추어서 학문의 지적구조를 밝히기 위해서는 복수저자가 고려된 저자동시인용분석이 중요하다는 점을 시사한다.

Abstract

The author co-citation analysis is generally based on the frequency of the first author because most citation databases include only the first author in the bibliographic information. In this sense, the purpose of this study is to provide a better knowledge structure by utilizing the multiple authorship of author co-citation analysis. To achieve the purpose of this study, four different data sets are prepared: (1) counting the first author, (2) counting all the author without limiting the total frequency, (3) counting all the author with limiting the total frequency, and (4) counting adjusted frequencies based on the order of author subscription. The findings of this study show that there are clear differences between the knowledge structure counting all the author and the one counting only the first author. In addition, depending on the different methods, there are subtle changes of cluster members for authors.

3
정은경(이화여자대학교) ; 정선영(이화여자대학교) 2012, Vol.29, No.4, pp.273-294 https://doi.org/10.3743/KOSIM.2012.29.4.273
초록보기
초록

세대적 특성과 정보기술의 발달은 이미지의 생산과 이용을 가속화한다. 본 연구는 이미지 이용자의 일상생활 맥락에서 정보요구를 분석하여 이미지 접근점 확장에 관한 논의를 목적으로 하였다. 이를 위하여 소셜 Q&A 서비스인 네이버 지식인에서 이미지를 검색하고자 하는 질문 105건을 추출하였다. 이미지 질문은 이용 목적과 이미지 속성으로 구분한 프레임워크를 이용하여 분석하였다. 분석결과로서 이용 목적은 총 8가지로, 이미지를 데이터로서 이용하고자 하는 목적이 두드러졌으며, 이중에서 ‘보고그리기’는 기존 연구결과에서 찾아볼 수 없었던 이용 목적으로 새롭게 도출되었다. 이미지 속성에서는 의미, 비시각적, 구성 측면에서 의미와 비시각적 속성이 우세하게 나타났다. 전통적으로 이미지 검색과 접근에서 의미 측면의 속성은 중요하게 인식되어 왔으나, 본 연구의 분석결과에서 보여주는 바와 같이 비시각적 측면 특히, 맥락 요소의 비중은 접근점 제공에 있어서 중요한 시사점으로 볼 수 있다.

Abstract

Images have been substantially searched and used due to not only the advanced internet and digital technologies but the characteristics of a younger generation. The purpose of this study aims to discuss the ways on expanding the access points to images by analyzing the needs of users in context of everyday life. In order to achieve the purpose of this study, 105 questions of image seeking in NAVER, which is one of social Q&A services in Korea, were analyzed. For the analysis, a two-dimensional framework with image uses and image attributes were utilized. The findings of this study demonstrate that considerable use purposes on data oriented pole, such as information processing, information dissemination and learning are identified. On the other hand, image attributes from the needs of image show that non-visual aspects including contextual attributes are recognized substantially in addition to the traditional semantic attributes.

초록보기
초록

최근 다양한 학문 분야는 대내외적 요인으로 인해 학제적 연구 흐름에 영향을 받고 있는 추세이다. 본 연구는 문헌정보학 분야를 대상으로 학제성과 연구 영향력의 상관관계를 분석하고자 하였다. 이를 위해 2011년 JCR(Journal Citation Reports)의 학술지 영향력 지수 상위에 해당하는 문헌정보학 학술지 10종을 선정하여 WoS(Web of Science) 인용색인 DB에서 2006년부터 2010년까지 1,873편의 논문의 참고문헌 데이터를 대상으로 분석하였다. 동시인용 네트워크 분석과 선정된 4가지 학제성 지수를 사용하여 문헌정보학 분야의 학제적 구조를 파악하고 학제성과 연구 영향력 사이의 상관관계를 분석하였다. 분석 결과를 통해 문헌정보학의 학제적 구조를 제시하였으며, 학제성 지수 중 매개중심성은 학술지 영향력 지수(5년) 그리고 논문당 영향도(Article Influence Score)와 통계적으로 유의한 상관관계가 있음이 밝혀졌다.

Abstract

As interdisciplinary research has been dominant in various fields, the purpose of this study is to analyze the relationship between interdisciplinarity and research impact in the field of Library and Information Science. For a data set, ten journals ranked as the top of 2011 JCR’s in terms of JIF (Journal Impact Factor) were selected. The citation data of 1,873 articles from the ten journals were collected from the WoS during the period from 2006 to 2010. In order to achieve the purpose of this study, as network analysis was conducted to investigate the interdisciplinarity of LIS field, interdisciplinarity indicators, and research impact factors were statistically analyzed. The findings of this study confirmed the interdisciplinary knowledge structure of the LIS field as previous studies identified. More importantly, this study demonstrated that a positive correlation existed between interdisciplinarity represented as betweenness centrality and research impact.

5
최형욱(이화여자대학교 일반대학원 문헌정보학과) ; 정은경(이화여자대학교) 2017, Vol.34, No.3, pp.109-124 https://doi.org/10.3743/KOSIM.2017.34.3.109
초록보기
초록

여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문 인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 ‘Sociology’로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 ‘Sociology’로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

Abstract

Through a wide variety of disciplines, practices on data access and re-use have been increased recently. In fact, there has been an emerging phenomenon that researchers tend to use the data sets produced by other researchers and give scholarly credit as citation. With respect to this practice, in 2012, Thomson Reuters launched Data Citation Index (DCI). With the DCI, citation to research data published by researchers are collected and analyzed in a similar way for citation to journal articles. The purpose of this study is to identify the characteristics and intellectual structure of sociology field based on research data, which is one of actively data-citing fields. To accomplish this purpose, two data sets were collected and analyzed. First, from DCI, a total of 8,365 data were collected in the field of sociology. Second, a total of 12,132 data were collected from Web of Science with a topic search with ‘Sociology’. As a result of the co-word analysis of author provided-keywords for both data sets, the intellectual structure of research data-based sociology was composed of two areas and 15 clusters and that of article-based sociology was composed with three areas and 17 clusters. More importantly, medical science area was found to be actively studied in research data-based sociology and public health and psychology are identified to be central areas from data citation.

6
정은경(이화여자대학교 사회과학대학 문헌정보학과 교수) 2020, Vol.37, No.1, pp.153-177 https://doi.org/10.3743/KOSIM.2020.37.1.153
초록보기
초록

오픈과학의 흐름에서 데이터 공유와 재이용은 중요한 연구자의 활동이 되어가고 있다. 데이터 공유와 재이용에 관한 여러 논의 중에서 데이터학술지와 데이터논문의 발간이 가시적인 결과를 보여주고 있다. 데이터학술지는 여러 학문 분야에서 발간되고 있으며, 논문의 수도 점차 증가하고 있다. 데이터논문은 데이터 자체와는 다르게 인용을 주고 받는 활동이 포함되어, 따라서 이들이 형성하는 고유한 지적구조가 생겨나게 된다. 본 연구는 데이터학술지와 데이터논문이 학술커뮤니티에서 구성하는 지적구조를 규명하고자 Web of Science에 색인된 14종의 데이터학술지와 6,086건의 데이터논문과 인용된 참고문헌 84,908건을 분석하였다. 저자사항과 함께 동시인용분석과 서지결합분석을 네트워크로 시각화하여 데이터논문이 형성한 세부 주제 분야를 규명하였다. 분석결과, 저자, 저자소속기관, 국가를 추출하여 출현빈도를 살펴보면, 전통적인 학술지 논문과 다른 양상을 보인다. 이러한 결과는 데이터의 생산이 용이한 기관과 국가에 주로 데이터논문을 출간하기 때문이라고 해석될 수 있다. 동시인용분석와 서지결합분석 모두 분석도구, 데이터베이스, 게놈구성 등이 주된 세부 주제 영역으로 나타났다. 동시인용분석결과는 9개의 군집으로 형성되었는데, 특정 주제 분야로 나타난 영역은 수질과 기후 등의 분야이다. 서지결합분석은 총 27개의 컴포넌트로 구성되었는데, 수질, 기후 이 외에도 해양, 대기 등의 세부 주제 영역이 파악되었다. 특기할만한 사항으로는 사회과학 분야의 주제 영역도 나타났다는 점이다.

Abstract

In the context of open science, data sharing and reuse are becoming important researchers’ activities. Among the discussions about data sharing and reuse, data journals and data papers shows visible results. Data journals are published in many academic fields, and the number of papers is increasing. Unlike the data itself, data papers contain activities that cite and receive citations, thus creating their own intellectual structures. This study analyzed 14 data journals indexed by Web of Science, 6,086 data papers and 84,908 cited references to examine the intellectual structure of data journals and data papers in academic community. Along with the author’s details, the co-citation analysis and bibliographic coupling analysis were visualized in network to identify the detailed subject areas. The results of the analysis show that the frequent authors, affiliated institutions, and countries are different from that of traditional journal papers. These results can be interpreted as mainly because the authors who can easily produce data publish data papers. In both co-citation and bibliographic analysis, analytical tools, databases, and genome composition were the main subtopic areas. The co-citation analysis resulted in nine clusters, with specific subject areas being water quality and climate. The bibliographic analysis consisted of a total of 27 components, and detailed subject areas such as ocean and atmosphere were identified in addition to water quality and climate. Notably, the subject areas of the social sciences have also emerged.

정보관리학회지