바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 서지데이터, 검색결과: 34
31
김동훈(성균관대학교 문헌정보학과) ; 김규리(성균관대학교 문헌정보학과) ; 주영준(성균관대학교 문헌정보학과) 2021, Vol.38, No.1, pp.53-69 https://doi.org/10.3743/KOSIM.2021.38.1.053
초록보기
초록

본 연구에서는 다학제적 연구가 활발해진 국내 연구의 동향을 파악하기 위하여 2020 구글 스칼라 매트릭스에 색인된 국내 주요 학술지 데이터를 활용하여 전 학문분야를 포괄하는 네트워크 분석(대학협력 네트워크, 키워드 동시출현 네트워크, 학술지 인용 네트워크, 학문분야 인용 네트워크)을 실시하였다. 대학협력 네트워크 분석결과, 서울대학교, 계명대학교, 성균관대학교 등 협력연구를 활발히 진행하는 대학을 파악할 수 있었고, 키워드 동시출현 네트워크 분석결과, 이직의도, 직무만족 등 직무 관련 키워드가 높은 빈도로 나타남을 확인하였다. 학술지 인용 네트워크에서는 한국콘텐츠학회논문지, 한국사회학, 한국심리학회지: 문화 및 사회문제 등 인용이 많이 되고 있는 핵심 학술지들을 확인하였으며, 학문분야 인용 네트워크에서는 교육학, 경영학, 사회복지학이 다른 학문에 가장 많은 영향을 미치는 학문임을 확인하였다. 본 연구에서는 기존의 국내 계량서지분석연구에서 시도하지 않았던 구글 스칼라 매트릭스 데이터를 처음 활용하였으며, 키워드, 학술지, 학문분야로 범위를 확장시켜가며 단계적 네트워크 분석을 실시하였다는 점에서 학술적 의의를 가지며, 연구결과는 국내 대학 간 공동연구의 전략 수립 및 다학제적 융합 연구 기획에 활용될 수 있다는 점에서 실질적인 함의를 시사한다.

Abstract

This study aims to understand the research landscape of South Korea using the data of 2020 Google Scholar Metrics. To achieve the goal, we constructed and analyzed four types of networks including the university collaboration network, the keyword co-occurrence network, the journal citation network, and the discipline citation network. Through the analysis of the university collaboration network, we found major universities such as Seoul National University, Keimyung University, and Sungkyunkwan University that have led collaborative research. Job related keywords such as job change intention and job satisfaction have been frequently studied with other keywords. Through the analysis of the journal citation network, we found multiple journals such as The Journal of the Korea Contents Association, Korean Journal of Sociology, and Korean Journal of Culture and Social Issues that have been widely cited by the other journals and influenced them. Finally, Education, Business administration, and Social welfare were identified as the top influential disciplines that have influenced other disciplines through the knowledge diffusion. The study is the first of its kind to use the data of Google Scholar Metrics and conduct a stepwise network analysis (e.g., keyword, journal, and discipline) to broadly understand the research landscape of South Korea. Our results can be used by government agencies and universities to develop effective strategies of promoting university collaboration and interdisciplinary research.

32
윤재혁(성균관대학교 일반대학원 문헌정보학과) ; 도슬기(성균관대학교 일반대학원 문헌정보학과) ; 오삼균(성균관대학교 문헌정보학과) 2020, Vol.37, No.2, pp.197-223 https://doi.org/10.3743/KOSIM.2020.37.2.197
초록보기
초록

본 연구는 통합서지용 한국문헌자동화목록(KORMARC)으로 작성된 서지레코드를 FRBR의 저작(Work) 단위로 군집화 하는 과정에서 나타난 이슈사항들을 분석하고, 이에 대한 해결방안을 고안하였다. 특히 기존의 연구에서는 대표저작자를 식별하고 처리하는 기준이 명확하게 드러나지 않거나 파생저작 레코드의 대표저작자를 선정하는 방법에 대한 논의가 충분히 이루어지지 않았다. 따라서 본 연구는 저작을 창작하는 데 기여한 사람이 다수일 때 대표저작자를 명확하게 식별하기 위한 방법을 고안하는 데 초점을 맞추었다. 이를 위해 책임표시사항(245) 필드의 책임표시 태그(▼d, ▼e)에서 추출한 역할용어를 토대로 표준화된 저자역할용어사전을 개발하여 대표저작자 판별에 활용하는 방안을 마련하였다. 또한 저자명의 유사도와 표제의 유사도를 각각 계산하여 유사도가 일정 수준 이상인 경우 동일한 저작으로 군집화 하는 방법을 채택하였다. 각각의 유사도를 계산하여 동일 저작을 판단하므로 공백, 관제처리, 괄호제거와 같은 데이터 정제 조건을 조정하여 6가지 패턴에 따른 군집화의 정확도를 비교하였고, 저자명과 표제의 유사도가 모두 80퍼센트 이상일 때의 정확도가 가장 높게 나타났다. 본 연구는 대표저작자 선정을 위한 역할용어사전 개발, 대표저작자와 표제의 유사도를 별도로 측정하여 저작군집화를 시도한 실험연구이며 후속 연구에서는 표제 간 유사도 측정의 정확도를 향상시키는 방안과 FRBR 1그룹의 다른 개체(표현형, 구현형, 개별자료) 수준으로 확대하여 활용하는 방안, 국내에서 사용하고 있는 다른 형태의 MARC 데이터에 적용하는 방안을 고안할 예정이다.

Abstract

The purpose of this study is to analyze the issues resulted from the process of grouping KORMARC records using FRBR WORK concept and to suggest a new method. The previous studies did not sufficiently address the criteria or processes for identifying representative authors of records and their derivatives. Therefore, our study focused on devising a method of identifying the representative author when there are multiple contributors in a work. The study developed a method of identifying representative authors using an author role dictionary constructed by extracting role-terms from the statement of responsibility field (245). We also designed another way to group records as a work by calculating similarity measures of authors and titles. The accuracy rate of WORK grouping was the highest when blank spaces, parentheses, and controling processes were removed from titles and the measured similarity rates of authors and titles were higher than 80 percent. This was an experiment study where we developed an author-role dictionary that can be utilized in selecting a representative author and measured the similarity rate of authors and titles in order to achieve effective WORK grouping of KORMARC records. The future study will attempt to devise a way to improve the similarity measure of titles, incorporate FRBR Group 1 entities such as expression, manifestation and item data into the algorithm, and a method of improving the algorithm by utilizing other forms of MARC data that are widely used in Korea.

33
김선욱(경북대학교 사회과학대학 문헌정보학과) ; 양기덕(영남고문헌아카이브센터) 2022, Vol.39, No.3, pp.99-132 https://doi.org/10.3743/KOSIM.2022.39.3.099
초록보기
초록

본 연구의 목적은 LDA 토픽모델링 결과와 BERTopic 토픽모델링 결과를 합성하는 방법론인 Augmented and Extended Topics(AET)를 제안하고, 이를 사용해 문헌정보학 분야의 연구주제를 분석하는 데 있다. AET의 실제 적용결과를 확인하기 위해 2001년 1월부터 2021년 10월까지의 Web of Science 내 문헌정보학 학술지 85종에 게재된 학술논문 서지 데이터 55,442건을 분석하였다. AET는 서로 다른 토픽모델링 결과의 관계를 WORD2VEC 기반 코사인 유사도 매트릭스로 구축하고, 매트릭스 내 의미적 관계가 유효한 범위 내에서 매트릭스 재정렬 및 분할 과정을 반복해 증강토픽(Augmented Topics, 이하 AT)을 추출한 뒤, 나머지 영역에서 코사인 유사도 평균값 순위와 BERTopic 토픽 규모 순위에 대한 조화평균을 통해 확장토픽(Extended Topics, 이하 ET)을 결정한다. 최적 표준으로 도출된 LDA 토픽모델링 결과와 AET 결과를 비교한 결과, AT는 LDA 토픽모델링 토픽을 한층 더 구체화하고 세분화하였으며 ET는 유효한 토픽을 발견하였다. AT(Augmented Topics)의 성능은 LDA 이상이었으며 ET(Extended Topics)는 일부 경우를 제외하고 대부분 LDA와 유사한 수준의 성능을 나타내었다.

Abstract

The purpose of this study is to propose AET (Augmented and Extended Topics), a novel method of synthesizing both LDA and BERTopic results, and to analyze the recently published LIS articles as an experimental approach. To achieve the purpose of this study, 55,442 abstracts from 85 LIS journals within the WoS database, which spans from January 2001 to October 2021, were analyzed. AET first constructs a WORD2VEC-based cosine similarity matrix between LDA and BERTopic results, extracts AT (Augmented Topics) by repeating the matrix reordering and segmentation procedures as long as their semantic relations are still valid, and finally determines ET (Extended Topics) by removing any LDA related residual subtopics from the matrix and ordering the rest of them by (BERTopic topic size rank, Inverse cosine similarity rank). AET, by comparing with the baseline LDA result, shows that AT has effectively concretized the original LDA topic model and ET has discovered new meaningful topics that LDA didn’t. When it comes to the qualitative performance evaluation, AT performs better than LDA while ET shows similar performances except in a few cases.

초록보기
초록

네트워크 분석 기법을 활용한 연구가 다양한 학문 분야에서 수행되고 있다. 본 연구는 2003년부터 2021년까지 국내 학술지에 게재된 네트워크 분석 논문 총 2,187건을 대상으로 계량서지적 분석과 내용분석을 수행하였다. 분석결과는 살펴보면, 논문 생산에 있어서 교육학, 학제간연구, 컴퓨터학, 문헌정보학, 행정학, 경영학 등의 우위를 확인할 수 있다. 학술지 단위로 보면, 메가 학술지의 강세가 나타난다. 그러나 피인용 기반의 영향력을 살펴보면, 행정학, 문헌정보학, 교육학의 영향력을 뚜렷하게 확인할 수 있다. 저자 단위로 분석한 결과 역시 언론정보학, 행정학, 문헌정보학의 우위를 확인할 수 있다. 파악된 1,537명의 저자 중에서 극소수의 저자가 활발한 연구활동을 하는 것으로 나타났으며, 이를 통해 연구자 저변 확대의 필요성도 확인할 수 있다. 내용분석의 결과를 살펴보면, 논문을 데이터셋으로 하여 가중/비방향네트워크를 형성하는 것이 가장 일반적인 네트워크 형태로 나타났다. 노드는 단어, 링크는 동시출현으로 표현되는 것이 보편적이며, 분석을 위해서는 KrKwic, UCINET, NetMiner, NetDraw의 활용이 가장 두드러졌다.

Abstract

Research in various academic fields using network analysis techniques has been conducted and grown. This study performed bibliographical analysis and content analysis on a total of 2,187 network analysis papers published in journals from 2003 to 2021. The results showed that the fields of Pedagogy, Interdisciplinary Research, Computer Science, Library and Information Science, Public Administration, and Business Administration were higher in terms of the number of research papers. From the perspective of journal, mega-journals were indicated as the most productive journals. However, when looking at the impact based on the number of citations, the strength of Public Administration, Library and Information Science, and Pedagogy is clearly revealed. The results of the analysis by authors can also confirm the higher impact of Journalism, Public Administration Science, and Library and Information Science. Of the 1,537 authors identified, very few authors are active in research, confirming the need to expand the researcher base. The results of content analysis showed that the weighted and non-directional network was the most common network type with using the research papers as a data set. Generally nodes are expressed as words and links are expressed as relationship. For network analysis, the use of KrKwic, UCINET, NetMiner, and NetDraw is the most prominent.

정보관리학회지