바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Representative author, 검색결과: 8
1
윤재혁(성균관대학교 일반대학원 문헌정보학과) ; 도슬기(성균관대학교 일반대학원 문헌정보학과) ; 오삼균(성균관대학교 문헌정보학과) 2020, Vol.37, No.2, pp.197-223 https://doi.org/10.3743/KOSIM.2020.37.2.197
초록보기
초록

본 연구는 통합서지용 한국문헌자동화목록(KORMARC)으로 작성된 서지레코드를 FRBR의 저작(Work) 단위로 군집화 하는 과정에서 나타난 이슈사항들을 분석하고, 이에 대한 해결방안을 고안하였다. 특히 기존의 연구에서는 대표저작자를 식별하고 처리하는 기준이 명확하게 드러나지 않거나 파생저작 레코드의 대표저작자를 선정하는 방법에 대한 논의가 충분히 이루어지지 않았다. 따라서 본 연구는 저작을 창작하는 데 기여한 사람이 다수일 때 대표저작자를 명확하게 식별하기 위한 방법을 고안하는 데 초점을 맞추었다. 이를 위해 책임표시사항(245) 필드의 책임표시 태그(▼d, ▼e)에서 추출한 역할용어를 토대로 표준화된 저자역할용어사전을 개발하여 대표저작자 판별에 활용하는 방안을 마련하였다. 또한 저자명의 유사도와 표제의 유사도를 각각 계산하여 유사도가 일정 수준 이상인 경우 동일한 저작으로 군집화 하는 방법을 채택하였다. 각각의 유사도를 계산하여 동일 저작을 판단하므로 공백, 관제처리, 괄호제거와 같은 데이터 정제 조건을 조정하여 6가지 패턴에 따른 군집화의 정확도를 비교하였고, 저자명과 표제의 유사도가 모두 80퍼센트 이상일 때의 정확도가 가장 높게 나타났다. 본 연구는 대표저작자 선정을 위한 역할용어사전 개발, 대표저작자와 표제의 유사도를 별도로 측정하여 저작군집화를 시도한 실험연구이며 후속 연구에서는 표제 간 유사도 측정의 정확도를 향상시키는 방안과 FRBR 1그룹의 다른 개체(표현형, 구현형, 개별자료) 수준으로 확대하여 활용하는 방안, 국내에서 사용하고 있는 다른 형태의 MARC 데이터에 적용하는 방안을 고안할 예정이다.

Abstract

The purpose of this study is to analyze the issues resulted from the process of grouping KORMARC records using FRBR WORK concept and to suggest a new method. The previous studies did not sufficiently address the criteria or processes for identifying representative authors of records and their derivatives. Therefore, our study focused on devising a method of identifying the representative author when there are multiple contributors in a work. The study developed a method of identifying representative authors using an author role dictionary constructed by extracting role-terms from the statement of responsibility field (245). We also designed another way to group records as a work by calculating similarity measures of authors and titles. The accuracy rate of WORK grouping was the highest when blank spaces, parentheses, and controling processes were removed from titles and the measured similarity rates of authors and titles were higher than 80 percent. This was an experiment study where we developed an author-role dictionary that can be utilized in selecting a representative author and measured the similarity rate of authors and titles in order to achieve effective WORK grouping of KORMARC records. The future study will attempt to devise a way to improve the similarity measure of titles, incorporate FRBR Group 1 entities such as expression, manifestation and item data into the algorithm, and a method of improving the algorithm by utilizing other forms of MARC data that are widely used in Korea.

초록보기
초록

학문과 기술의 발달이 전개되면서 학문 간의 융합이 이루어지고 학제적 성향을 띠는 학문이 더욱 등장하게 되었다. 현재까지 계량정보학적 방법으로 학문 분야의 지적구조를 파악한 연구는 있었지만 학제적인 학문의 특성을 규명하여 지적구조를 분석한 시도는 적었다. 따라서 본 연구에서는 학제성을 띠는 의료정보학(Medical Informatics) 분야의 저널 중 IEEE ENG MED BIOL 저널을 선정하여 저자동시인용 분석과 동시출현단어 분석을 통해 본 저널의 지적구조를 파악하였다. 또한 상위 3개 대표 저널의 저자 및 MeSH Term을 추출하여 종합적으로 비교분석하였다. 이를 통해 의료정보학 분야의 융합된 학문들의 관계를 구조적으로 파악하고 의료정보학의 학문적 성향을 분석했다.

Abstract

Due to the development of science and technology, the convergence of various disciplines has been fostered. Accordingly, interdisciplinary studies have increasingly been expanded by integrating knowledge and methodology from different disciplines. The primary focus of biblimetric methods is on investigating the intellectual structure a field, and analysis of the characterization of interdisciplinary studies is overlooked. In this study, we aim to identify the intellectual structure of the field of medical informatics through author co-citation analysis and co-word analysis by the representative journal “IEEE ENG MED BIOL.” In addition, we examine authors and MeSH Terms of top three representative journals for further analysis of the field. We examine the intellectual structure of the medical informatics field by author and word clusters to identify the network structure of medical informatics disciplines.

3
김성진(인하공업전문대학) ; 정동열(이화여자대학교) 2004, Vol.21, No.1, pp.23-53 https://doi.org/10.3743/KOSIM.2004.21.1.023
초록보기
초록

본 연구는 국내외 학술지에서 이론개발과 이론활용이 이루어진 이론연구를 조사함으로써, 문헌정보학 이론의 효율성과 활용성을 분석하고 이를 기반으로 문헌정보학의 학문적 본질을 규명하는 데 목적이 있다. 이를 위해 국내외 문헌정보학의 대표 학술지를 두 종씩 선정하여 1984년부터 2003년 상반기까지 게재된 연구논문 1,661편에 대한 내용분석을 실시하였다. 이론개발과 이론활용에 대한 질적 평가를 위해 4단계의 이론 효율성 모델과 5단계의 이론 활용성 모델을 각각 분석척도로 사용하였다. 이론연구에 대한 구체적인 분석을 위해 연구의 배경적 속성(학회지, 발행국, 연구시기), 연구의 내용적 속성(연구주제, 연구방법), 연구자 속성(소속, 전공, 연구경력)을 조사하고, 활용된 이론의 근원학문과 활용주기를 분석하였다. 또한 저자동시인용법을 적용하여 동시이론활용을 분석함으로써 20년간 문헌정보학 연구자들에 의해 형성된 이론적 기반에 대한 지적 구조를 규명하였다.

Abstract

The purpose of this study is to analyze the identity and relationship of library and information science by exploring theoretical aspects of LIS research, including theory building and theory use. The sample of this study consists of 1,661 research articles published from 1984 to 2003 in two Korean and two American core LIS journals. Theory articles are analyzed with two scales, such as '4-degree of theory efficiency' and '5-degree of theory use.' Each article is coded in terms of journal, country, publication year, subfield, and methodology of the article, and affiliation, department, and research experience of the first author. The theories used therein are coded according to their origin and age. Also, an author co-citation technique is applied to represent intellectual structure on a two-dimensional map, which has been constructed by theory use of LIS authors for 20 years.

초록보기
초록

본고에서는 서지데이터요소의 채기 과정에서 거의 신성권을 보장받았던 표제지의 기능성을 연구하고자 하였다. 그래서 우선적으로 서지통정상에서의 표제지의 출현배경과 그들의 개념정립을 고찰하였으며 편목과정에서 어떻게 취급하였는지도 규명하였다. 그리고 하이퍼텍스트환경에서의 표제지에 대한 탈-서지적 과정도 분석하였다.

Abstract

The title page of a book is a reliable source, since it, together with its verso, usually contains all bibliographically significant data. Generally, the title page is a page at the beginning of a book giving its title and the names of the author and publisher. Prescribing a source of information from which data elements should be derived is a way of specifying how an entity can represent itself. In simpler times, when bibliographic entities were for the most part books published in Western countries, the choice of source was obviously the title page, the "face of the book".

초록보기
초록

연구전선이란 연구논문들 간에 인용이 빈번하게 발생하며, 지속적으로 발전이 이루어지고 있는 연구영역을 의미한다. 연구행위가 집중되는 핵심 연구분야로 발전 가능성이 높은 연구전선을 조기에 예측해내는 것은 학계와 산업계, 정부기관, 나아가 국가의 과학기술 발전에 큰 유익을 가져다 줄 수 있는 유용한 사회적 자원이 된다. 본 연구는 복합자질을 활용하여 연구전선을 추론하는 모델을 제시하고자 시도하였다. 연구전선 추론은 핵심 연구영역으로 발전할 가능성이 높은 문헌들이 포함될 수 있도록 문헌을 복합자질로 표현하고, 그 자질들을 심층학습하여 새로 발행된 문헌들이 연구전선에 포함될 수 있는지 그 가능성을 예측하였다. 서지 자질, 네트워크 자질, 내용 자질 등 복합자질 세트를 사용하여 문헌을 표현하고 피인용을 많이 받을 가능성이 있는 문헌을 추론하기 위해서 확률기반 팩터그래프 모델을 적용하였다. 추출된 자질들은 팩터그래프의 변수로 표현되어 합-곱 알고리즘과 접합 트리 알고리즘을 적용하여 연구전선 추론이 이루어졌다. 팩터그래프 확률모델을 적용하여 연구전선을 추론․구축한 결과, 서지결합도 4 이상으로 구축된 베이스라인 연구전선과 큰 차이를 보였다. 팩터그래프 기반 연구전선그룹이 서지결합 기반 연구전선그룹보다 문헌 간의 직접 연결정도가 강하며 연결 관계에 있지 않은 두 개의 문헌을 연결시키는 매개정도 또한 강한 집단으로 나타났다.

Abstract

This study attempts to infer research fronts using factor graph model based on heterogeneous features. The model suggested by this study infers research fronts having documents with the potential to be cited multiple times in the future. To this end, the documents are represented by bibliographic, network, and content features. Bibliographic features contain bibliographic information such as the number of authors, the number of institutions to which the authors belong, proceedings, the number of keywords the authors provide, funds, the number of references, the number of pages, and the journal impact factor. Network features include degree centrality, betweenness, and closeness among the document network. Content features include keywords from the title and abstract using keyphrase extraction techniques. The model learns these features of a publication and infers whether the document would be an RF using sum-product algorithm and junction tree algorithm on a factor graph. We experimentally demonstrate that when predicting RFs, the FG predicted more densely connected documents than those predicted by RFs constructed using a traditional bibliometric approach. Our results also indicate that FG-predicted documents exhibit stronger degrees of centrality and betweenness among RFs.

6
이지원(대구가톨릭대학교 도서관학과 부교수) 2019, Vol.36, No.4, pp.279-300 https://doi.org/10.3743/kosim.2019.36.4.279
초록보기
초록

본 연구는 동시출현단어 분석을 사용하여 2000년대와 2010년대 목록 분야 연구동향 및 지적구조 분석을 수행하고, 두 시기의 차이점을 비교하였다. 목록 분야는 독자적인 연구 영역을 확고히 구축하고 있었으며, 2000년대와 2010년대 연구동향 및 지적구조에 많은 차이점이 발견되었다. 첫째, 논문 수에 있어서는 2000년대에 비해 2010년대에는 연간 평균 4.2편이 감소하였으나, 저자키워드 수는 큰 차이는 나지 않았다. 연대별 키워드 출현빈도는 22.2%의 키워드만이 두 시기에 모두 3회 이상 나타났으며, 77.8%의 키워드들은 한 시기에만 3회 이상 나타났다. 둘째, 지적구조에 있어서 살펴보면, 2000년대에는 3단계 군집을 보여주어 2단계 군집으로 표현된 2010년대에 비해 보다 복잡한 형태의 네트워크를 형성하였다. 셋째, 각 군집의 특성 변화를 살펴본 결과, 일부 변화가 적은 연구주제들이 있기는 하지만, 많은 연구주제들이 더욱 활발히 진행되거나 세분되었으며, 감소하기도 하는 변화가 있었다. 이러한 연구의 결과는 목록 분야의 시대적 흐름과 함께 지적구조를 시각적으로 파악할 수 있게 하며, 미래의 모습을 예측하여 관련 교육과 연구를 준비할 수 있다는 점에서 의의가 있다.

Abstract

This study aims to analyze and to demonstrate the research trends and intellectual structure in the field of catalog in the 2000s and 2010s through co-word analysis. The field of catalog had firmly established its own research area and Many differences were found in research trends and intellectual structures in the 2000s and 2010s. First, the average number of articles decreased by 4.2 in the 2010s compared to the 2000s, but the number of author keywords was not significantly different. Only 22.2% of keywords appeared more than three times in both periods, and 77.8% of keywords appeared more than three times in one period. Second, in terms of intellectual structure, the 2000s, represented by three-level clusters, formed a more complex network than the 2010s, represented by two-level clusters. Third, as a result of examining the changes in the characteristics of each cluster, there were some research topics with few changes, but many research topics were more actively progressed or subdivided, and decreased. The results of this study are meaningful in that they can visually grasp the intellectual structure along with the trend of the age of catalogue, and can prepare for related education and research by predicting the future.

초록보기
초록

본 연구에서는 국립중앙도서관 링크드 데이터를 대상으로 인물 정보가 표현되고 연계되는 방식을 분석하고, 이를 확장하기 위한 방안을 제안하였다. 분석 결과, 저자로서의 인물 정보는 링크드 데이터에서도 인물을 표현하는 어휘와 연계되어 기술되고 있는 반면에, 주제로 표현된 인물은 개념으로만 취급되고 있었다. 또한 링크드 데이터 구축과정에서 기존의 전거 정보를 변환한 것 외에는 별도의 부가 정보를 추가했는지를 확인할 수 없었다. 이에 본 연구에서는 저자로서의 인물 정보뿐 아니라 주제로서의 인물 정보도 서지 정보에 포함시키고, 저자로서의 인물 정보와 주제로서의 인물 정보를 연계할 때 링크드 데이터의 품질을 제고할 수 있다고 판단하였다. 그리고 이와 더불어 인물과 관련된 부가 링크 정보를 함께 구축하고 이를 활용하여 서지데이터 검색의 접근점을 확장하는 방안도 함께 제안하였다.

Abstract

This study analyzed the methods for representing and linking personal information in the linked data of National Library of Korea and provided suggestions for expanding the scope of identifying and linking of the personal information. As a result, the personal information as a subject has been dealt with a concept, where the personal information as a contributor has been linked with a vocabulary of personal name. In addition, there have not been assured of including additional information except existing authority data in the process of building the linked data. Therefore, this study suggested that linking personal information as a subject and personal information as a contributor was essential for the quality of linked data. In addition, we proposed to provide additional information related to the person in linked data for expanding the scope of access points in information discovery.

8
김판준(신라대학교) ; 이재윤(경기대학교) 2007, Vol.24, No.4, pp.285-303 https://doi.org/10.3743/KOSIM.2007.24.4.285
초록보기
초록

본 연구는 연구 영역 분석을 위하여 통제어휘와 비통제어휘를 연계해서 사용하는 새로운 방법을 모색하기 위한 것이다. 동시출현단어분석은 크게 통제어휘와 비통제어휘를 사용하는 경우의 두 가지 유형으로 구분할 수 있는데, 통제어휘를 사용할 경우에는 자료 희귀성 및 색인자 효과가 단점이며, 비통제어휘를 사용할 경우에는 저자의 주관에 따른 단어 선택 및 단어의 중의성이 문제가 된다. 이 연구에서는 양자를 보완할 수 있는 방법으로, 통제어휘인 디스크립터를 비통제어휘인 단어와의 동시출현 정보로 표현하는 디스크립터 프로파일링을 제안하였다. 정보학 분야에 적용해본 결과, 디스크립터 프로파일링은 특정 영역의 최신 동향을 파악하는데 있어 통제어휘와 비통제어휘가 갖는 본질적인 문제점을 어느 정도 보완할 수 있는 것으로 나타났다.

Abstract

This study aims to explore a new technique making complementary linkage between controlled vocabularies and uncontrolled vocabularies for analyzing a research domain. Co-word analysis can be largely divided into two based on the types of vocabulary used: controlled and uncontrolled. In the case of using controlled vocabulary, data sparseness and indexer effect are inherent drawbacks. On the other case, word selection by the author's perspective and word ambiguity. To complement each other, we suggest a descriptor profiling that represents descriptors(controlled vocabulary) as the co-occurrence with words from the text(uncontrolled vocabulary). Applying the profiling to the domain of information science implies that this method can complement each other by reducing the inherent shortcoming of the controlled and uncontrolled vocabulary.

정보관리학회지