바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 연구데이터, 검색결과: 27
21
김선욱(경북대학교 사회과학대학 문헌정보학과) ; 양기덕(영남고문헌아카이브센터) 2022, Vol.39, No.3, pp.99-132 https://doi.org/10.3743/KOSIM.2022.39.3.099
초록보기
초록

본 연구의 목적은 LDA 토픽모델링 결과와 BERTopic 토픽모델링 결과를 합성하는 방법론인 Augmented and Extended Topics(AET)를 제안하고, 이를 사용해 문헌정보학 분야의 연구주제를 분석하는 데 있다. AET의 실제 적용결과를 확인하기 위해 2001년 1월부터 2021년 10월까지의 Web of Science 내 문헌정보학 학술지 85종에 게재된 학술논문 서지 데이터 55,442건을 분석하였다. AET는 서로 다른 토픽모델링 결과의 관계를 WORD2VEC 기반 코사인 유사도 매트릭스로 구축하고, 매트릭스 내 의미적 관계가 유효한 범위 내에서 매트릭스 재정렬 및 분할 과정을 반복해 증강토픽(Augmented Topics, 이하 AT)을 추출한 뒤, 나머지 영역에서 코사인 유사도 평균값 순위와 BERTopic 토픽 규모 순위에 대한 조화평균을 통해 확장토픽(Extended Topics, 이하 ET)을 결정한다. 최적 표준으로 도출된 LDA 토픽모델링 결과와 AET 결과를 비교한 결과, AT는 LDA 토픽모델링 토픽을 한층 더 구체화하고 세분화하였으며 ET는 유효한 토픽을 발견하였다. AT(Augmented Topics)의 성능은 LDA 이상이었으며 ET(Extended Topics)는 일부 경우를 제외하고 대부분 LDA와 유사한 수준의 성능을 나타내었다.

Abstract

The purpose of this study is to propose AET (Augmented and Extended Topics), a novel method of synthesizing both LDA and BERTopic results, and to analyze the recently published LIS articles as an experimental approach. To achieve the purpose of this study, 55,442 abstracts from 85 LIS journals within the WoS database, which spans from January 2001 to October 2021, were analyzed. AET first constructs a WORD2VEC-based cosine similarity matrix between LDA and BERTopic results, extracts AT (Augmented Topics) by repeating the matrix reordering and segmentation procedures as long as their semantic relations are still valid, and finally determines ET (Extended Topics) by removing any LDA related residual subtopics from the matrix and ordering the rest of them by (BERTopic topic size rank, Inverse cosine similarity rank). AET, by comparing with the baseline LDA result, shows that AT has effectively concretized the original LDA topic model and ET has discovered new meaningful topics that LDA didn’t. When it comes to the qualitative performance evaluation, AT performs better than LDA while ET shows similar performances except in a few cases.

22
이고은(연세대학교 대학원 문헌정보학과) ; 박지홍(연세대학교 문헌정보학과) 2022, Vol.39, No.3, pp.69-97 https://doi.org/10.3743/KOSIM.2022.39.3.069
초록보기
초록

자녀에게 부모의 관심과 돌봄은 성장하는 과정에서 매우 중요한 요건이지만 부모도 양육이 매우 생소하고 어려운 일이다. 양육과정에서 부모는 양육과 관련된 끊임없는 정보요구가 발생하며 이를 해결하기 위하여 개인 수준에서 학부모 간 모임이나 관계를 통해 정보를 획득하고자 노력하는데 이 과정에서 갈등 및 스트레스를 받는 경우가 종종 발생한다. 이에 본 연구는 학부모 간 소셜네트워크의 특성을 탐색하고 이러한 소셜네트워크 특성이 정보공유의도 및 정보공유만족도에 미치는 영향을 파악하는 것을 목적으로 한다. 이를 위해 선행 연구를 조사하여 설문지를 개발하였으며 어린이집 한 곳을 선정하여 학부모를 대상으로 설문조사를 실시하였고 수집된 설문데이터는 소셜네트워크분석(SNA: social network analysis) 방법을 활용하여 분석하였다. 분석 결과, 소셜네트워크 특성과 정보공유의도, 정보공유만족도간 관계는 상관관계를 가지지만 학부모 소셜네트워크의 특성과 정보공유의도, 정보공유만족도의 영향관계는 성립되지 않았으며, 도움을 주고자 하는 것보다 받고자 하는 의도가 높은 것으로 나타났다. 이에 학부모들의 정보요구 충족을 위한 정책 지원 방안과 지역 공공도서관의 역할 재고의 필요성을 제시하였다.

Abstract

Parents’ interest and care are very important for their children in the process of growing up, but parenting is also very unfamiliar and difficult for themselves. Parents constantly need information related to parenting, and in order to solve this problem, they try to obtain information through informal meetings or social relationships among parents at an individual level, which often brings up conflicts and stresses. Accordingly, the purpose of this study is to explore the characteristics of social networks among parents and to understand the influence of the network characteristics on information-sharing intention and information-sharing satisfaction. To this end, a survey questionnaire was developed based on previous studies and was administered among parents whose children are in a daycare center. Then, the data was analyzed using social network analysis (SNA) method. Findings indicate that the correlation among the social networks, the information -sharing intention, and the information-sharing satisfaction was significant, but the influence of the social networks on the information-sharing intention, and the information-sharing satisfaction was not established. It was also found that the intention to receive help was higher than the desire to help others. Policy suggestions to meet parents’ information needs and the need to reconsider the role of local public libraries were presented.

23
이재윤(명지대학교 문헌정보학과) ; 정은경(이화여자대학교 문헌정보학과) 2022, Vol.39, No.1, pp.309-330 https://doi.org/10.3743/KOSIM.2022.39.1.309
초록보기
초록

학문의 구조, 특성, 하위 분야 등을 계량적으로 규명하는 지적구조 분석 연구가 최근 급격히 증가하는 추세이다. 지적구조 분석 연구를 수행하기 위하여 전통적으로 사용되는 분석기법은 서지결합분석, 동시인용분석, 단어동시출현분석, 저자서지결합분석 등이다. 이 연구의 목적은 키워드서지결합분석(KBCA, Keyword Bibliographic Coupling Analysis)을 새로운 지적구조 분석 방식으로 제안하고자 한다. 키워드서지결합분석 기법은 저자서지결합분석의 변형으로 저자 대신에 키워드를 표지로 하여 키워드가 공유한 참고문헌의 수를 두 키워드의 주제적 결합 정도로 산정한다. 제안된 키워드서지결합분석 기법을 사용하여 Web of Science에서 검색된 ‘Open Data’ 분야의 1,366건의 논문집합을 대상으로 분석하였다. 1,366건의 논문집합에서 추출된 7회 이상 출현한 63종의 키워드를 오픈데이터 분야의 핵심 키워드로 선정하였다. 63종의 핵심 키워드를 대상으로 키워드서지결합분석 기법으로 제시된 지적구조는 열린정부와 오픈사이언스라는 주된 영역과 10개의 소주제로 규명되었다. 이에 반해 단어동시출현분석의 지적구조 네트워크는 전체 구성과 세부 영역 구조 규명에 있어 미진한 것으로 나타났다. 이러한 결과는 키워드서지결합분석이 키워드 간의 서지결합도를 사용하여 키워드 간의 관계를 풍부하게 측정하기 때문이라고 볼 수 있다.

Abstract

Intellectual structure analysis, which quantitatively identifies the structure, characteristics, and sub-domains of fields, has rapidly increased in recent years. Analysis techniques traditionally used to conduct intellectual structure analysis research include bibliographic coupling analysis, co-citation analysis, co-occurrence analysis, and author bibliographic coupling analysis. This study proposes a novel intellectual structure analysis method, Keyword Bibliographic Coupling Analysis (KBCA). The Keyword Bibliographic Coupling Analysis (KBCA) is a variation of the author bibliographic coupling analysis, which targets keywords instead of authors. It calculates the number of references shared by two keywords to the degree of coupling between the two keywords. A set of 1,366 articles in the field of ‘Open Data’ searched in the Web of Science were collected using the proposed KBCA technique. A total of 63 keywords that appeared more than 7 times, extracted from 1,366 article sets, were selected as core keywords in the open data field. The intellectual structure presented by the KBCA technique with 63 key keywords identified the main areas of open government and open science and 10 sub-areas. On the other hand, the intellectual structure network of co-occurrence word analysis was found to be insufficient in the overall structure and detailed domain structure. This result can be considered because the KBCA sufficiently measures the relationship between keywords using the degree of bibliographic coupling.

24
이경화(건국대학교 일반대학원 문헌정보학과) ; 노영희(건국대학교 문헌정보학과) 2022, Vol.39, No.1, pp.17-44 https://doi.org/10.3743/KOSIM.2022.39.1.017
초록보기
초록

본 연구는 대학도서관 이용자의 도서관 불안 요인을 분석하여 비대면 서비스가 도서관 불안해소에 미치는 영향에 관한 방안 제시를 목적으로 하였다. 이를 위해 코로나19 사태에 따른 대학도서관의 이용자 서비스 대응 활동 사례를 살펴보고, 재학생 5,000명 이상 10,000명 이하의 국내 4년제 대학도서관에서 재학생 1인당 도서관 방문자수가 가장 높은 순위부터 40교를 선정하여 비대면 방식의 정보 서비스 및 프로그램 사례를 분석하였고, K대학도서관을 이용하는 재학생을 대상으로 K-LAS를 재구성하여 설문조사를 실시하였다. 수집된 데이터를 대상으로 빈도분석, 기술통계분석, 탐색적 요인분석, 신뢰도분석, 상관관계분석, 다중회귀분석을 적용하여 이용자의 도서관 불안 요인을 분석하였다. 도서관의 물리적․환경적 요인, 자료검색선정 요인, 디지털 정보시스템 요인, 사서(직원) 요인, 심리․정서적 요인등 5가지 도서관 불안 요인과 비대면 서비스 활성화 요인간 관계를 파악하고, 비대면 서비스 활성화 요인이 도서관 불안요인에 미치는 영향을 살펴보았으며, 그 결과, 비대면 서비스 활성화 요인들이 도서관 디지털 정보시스템 불안 요인에 가장 크게 영형을 끼치는 것으로 나타났다. 분석결과에 기초하여 비대면 서비스 활성화를 통하여 이용자의 도서관 불안해소 방안을 도출해보고자 하였다.

Abstract

The purpose of this study was to present a plan on the effect of non-face-to-face services on library anxiety facilities by analyzing the library anxiety factors of university library users. To this end, we look at the cases of university library user service response activities in response to the COVID-19 crisis and select 40 schools with the highest number of library visitors per student from among domestic four-year university libraries with 5,000 or more and less than 10,000 students. Methods of information service and program cases were analyzed, and K-LAS was reconstructed and surveyed for current students using the K university library, and frequency analysis, descriptive statistical analysis, exploratory factor analysis, and reliability analysis, correlation analysis, and multiple regression analysis were applied to analyze the library anxiety factors of users. Identify the relationship between 5 library anxiety factors and non-face-to-face service activation factors, such as physical/environmental factors of the library, data search selection factors, digital information system factors, librarian (staff) factors, and psychological/emotional factors, and activate non-face-to-face services. The influence of these factors on library anxiety factors was examined, and as a result, it was found that non-face-to-face service activation factors had the greatest influence on library digital information system anxiety factors. Based on the analysis results, it was attempted to derive a plan to relieve users’ library anxiety by activating non-face-to-face services.

25
김규리(성균관대학교 문헌정보학과 석사과정) ; 오찬희(성균관대학교 문헌정보학과 석사과정) ; 주영준(연세대학교 문헌정보학과) 2022, Vol.39, No.1, pp.331-350 https://doi.org/10.3743/KOSIM.2022.39.1.331
초록보기
초록

본 연구는 코로나바이러스감염증-19 (이하 코로나19)로 인해 생겨난 코로나19 반시민성 주제와 코로나19 혐오 정서를 파악하기 위해 소셜 미디어 중 하나인 트위터의 코로나19 관련 게시물을 분석하였다. 2019년 12월 1일부터 2021년 8월 31일까지 21개월 동안 작성된 코로나19 관련 혐오 대상별(지역, 공공시설 혐오, 특정 인구 집단 혐오, 종교 혐오) 게시물 수집 및 전처리를 진행하여 총 63,802개의 게시물을 분석하였다. 혐오 대상별 빈도 분석, 다이나믹 토픽 모델링, 키워드 동시 출현 네트워크 분석 기법을 통하여 혐오 대상별 반시민성 주제와 혐오 키워드를 파악하였다. 첫째, 빈도 분석 결과, 지역, 공공시설 혐오는 상대적으로 증가하는 추세를 보이고 특정 인구 집단과 종교 혐오는 상대적으로 감소하는 추세를 확인할 수 있었다. 둘째, 다이나믹 토픽 모델링 분석 결과, 지역, 공공시설 혐오는 ‘대구, 경북지방 혐오’, ‘지역 간 혐오’, ‘공공시설 혐오’로 나타났고, 특정 인구 집단 혐오는 ‘중국 혐오’, ‘바이러스 전파자’, ‘실외(야외)활동 제재’로 나타났으며, 종교 혐오는 ‘신천지’, ‘기독교’, ‘종교 내 감염’, ‘방역 의무 거부’, ‘확진자 동선 비난’으로 나타났다. 셋째, 키워드 동시 출현 네트워크 분석 결과, 지역, 공공시설 혐오(코로나, 대구, 확진자, 신천지, 경북, 지역), 특정 인구 집단 혐오(코로나바이러스, 우한폐렴, 우한, 중국, 중국인, 사람, 입국, 금지), 종교 혐오(신천지, 코로나, 교회, 대구, 확진자, 감염) 등을 핵심 키워드로 확인할 수 있었다. 본 연구는 소셜 미디어를 활용한 국내 코로나19 혐오 대상 및 키워드 파악을 통해 코로나19 관련한 대중의 반시민성 여론을 파악하고자 하였다. 특히 기존의 선행연구에서 시도하지 않았던 주제인 코로나19 관련 혐오에 데이터 마이닝 기법을 이용하여 소셜 미디어에서 표출하는 대중의 반시민성 주제와 혐오 정서 탐색은 대중들의 여론을 파악하는 것이 의의가 있다. 더불어 본 연구 결과는 포스트 코로나 시대를 대비하는 문화적 소통 방안의 제도 및 정책 수립 기여를 위한 기본 자료에 기초할 수 있다는 점에서 실질적 함의를 시사한다.

Abstract

This study aims to understand topics of incivility related to COVID-19 from analyzing Twitter posts including COVID-19-related hate speech. To achieve the goal, a total of 63,802 tweets that were created between December 1st, 2019, and August 31st, 2021, covering three targets of hate speech including region and public facilities, groups of people, and religion were analyzed. Frequency analysis, dynamic topic modeling, and keyword co-occurrence network analysis were used to explore topics and keywords. 1) Results of frequency analysis revealed that hate against regions and public facilities showed a relatively increasing trend while hate against specific groups of people and religion showed a relatively decreasing trend. 2) Results of dynamic topic modeling analysis showed keywords of each of the three targets of hate speech. Keywords of the region and public facilities included “Daegu, Gyeongbuk local hate”, “interregional hate”, and “public facility hate”; groups of people included “China hate”, “virus spreaders”, and “outdoor activity sanctions”; and religion included “Shincheonji”, “Christianity”, “religious infection”, “refusal of quarantine”, and “places visited by confirmed cases”. 3) Similarly, results of keyword co-occurrence network analysis revealed keywords of three targets: region and public facilities (Corona, Daegu, confirmed cases, Shincheonji, Gyeongbuk, region); specific groups of people (Coronavirus, Wuhan pneumonia, Wuhan, China, Chinese, People, Entry, Banned); and religion (Corona, Church, Daegu, confirmed cases, infection). This study attempted to grasp the public’s anti-citizenship public opinion related to COVID-19 by identifying domestic COVID-19 hate targets and keywords using social media. In particular, it is meaningful to grasp public opinion on incivility topics and hate emotions expressed on social media using data mining techniques for hate-related to COVID-19, which has not been attempted in previous studies. In addition, the results of this study suggest practical implications in that they can be based on basic data for contributing to the establishment of systems and policies for cultural communication measures in preparation for the post-COVID-19 era.

26
박서정(연세대학교 문헌정보학과) ; 이수빈(연세대학교 문헌정보학과) ; 김우정(연세대학교 의과대학 용인세브란스병원 정신건강의학교실) ; 송민(연세대학교 문헌정보학과) 2022, Vol.39, No.1, pp.91-117 https://doi.org/10.3743/KOSIM.2022.39.1.091
초록보기
초록

국내를 비롯하여 전 세계적으로 우울증 환자 수가 매년 증가하는 추세이다. 그러나 대다수의 정신질환 환자들은 자신이 질병을 앓고 있다는 사실을 인식하지 못해서 적절한 치료가 이루어지지 않고 있다. 우울 증상이 방치되면 자살과 불안, 기타 심리적인 문제로 발전될 수 있기에 우울증의 조기 발견과 치료는 정신건강 증진에 있어 매우 중요하다. 이러한 문제점을 개선하기 위해 본 연구에서는 한국어 소셜 미디어 텍스트를 활용한 딥러닝 기반의 우울 경향 모델을 제시하였다. 네이버 지식인, 네이버 블로그, 하이닥, 트위터에서 데이터 수집을 한 뒤 DSM-5 주요 우울 장애 진단 기준을 활용하여 우울 증상 개수에 따라 클래스를 구분하여 주석을 달았다. 이후 구축한 말뭉치의 클래스 별 특성을 살펴보고자 TF-IDF 분석과 동시 출현 단어 분석을 실시하였다. 또한, 다양한 텍스트 특징을 활용하여 우울 경향 분류 모델을 생성하기 위해 단어 임베딩과 사전 기반 감성 분석, LDA 토픽 모델링을 수행하였다. 이를 통해 문헌 별로 임베딩된 텍스트와 감성 점수, 토픽 번호를 산출하여 텍스트 특징으로 사용하였다. 그 결과 임베딩된 텍스트에 문서의 감성 점수와 토픽을 모두 결합하여 KorBERT 알고리즘을 기반으로 우울 경향을 분류하였을 때 가장 높은 정확률인 83.28%를 달성하는 것을 확인하였다. 본 연구는 다양한 텍스트 특징을 활용하여 보다 성능이 개선된 한국어 우울 경향 분류 모델을 구축함에 따라, 한국 온라인 커뮤니티 이용자 중 잠재적인 우울증 환자를 조기에 발견해 빠른 치료 및 예방이 가능하도록 하여 한국 사회의 정신건강 증진에 도움을 줄 수 있는 기반을 마련했다는 점에서 의의를 지닌다.

Abstract

The number of depressed patients in Korea and around the world is rapidly increasing every year. However, most of the mentally ill patients are not aware that they are suffering from the disease, so adequate treatment is not being performed. If depressive symptoms are neglected, it can lead to suicide, anxiety, and other psychological problems. Therefore, early detection and treatment of depression are very important in improving mental health. To improve this problem, this study presented a deep learning-based depression tendency model using Korean social media text. After collecting data from Naver KonwledgeiN, Naver Blog, Hidoc, and Twitter, DSM-5 major depressive disorder diagnosis criteria were used to classify and annotate classes according to the number of depressive symptoms. Afterwards, TF-IDF analysis and simultaneous word analysis were performed to examine the characteristics of each class of the corpus constructed. In addition, word embedding, dictionary-based sentiment analysis, and LDA topic modeling were performed to generate a depression tendency classification model using various text features. Through this, the embedded text, sentiment score, and topic number for each document were calculated and used as text features. As a result, it was confirmed that the highest accuracy rate of 83.28% was achieved when the depression tendency was classified based on the KorBERT algorithm by combining both the emotional score and the topic of the document with the embedded text. This study establishes a classification model for Korean depression trends with improved performance using various text features, and detects potential depressive patients early among Korean online community users, enabling rapid treatment and prevention, thereby enabling the mental health of Korean society. It is significant in that it can help in promotion.

27
노영희(건국대학교) ; 장인호(대진대학교 문헌정보학과) ; 심효정(경기대학교 문헌정보학과) ; 곽우정(건국대학교 GLOCAL(글로컬)캠퍼스 지식콘텐츠연구소) 2022, Vol.39, No.4, pp.191-213 https://doi.org/10.3743/KOSIM.2022.39.4.191
초록보기
초록

기존 국립세종도서관 정책정보포털(POINT)의 국정과제 서비스를 뛰어넘는 고품질 정책정보서비스 제공을 위하여, 새로운 국정과제 이행에 필요한 정책자료를 효과적으로 서비스할 수 있는 방안이 필요하다고 생각된다. 이에 본 연구에서는 BRM기반 국정과제와 정책정보콘텐츠 연계 및 구축방안을 모색하고자 하였다. 이를 위해, 첫째, 新정부 120대 국정과제를 중심으로 국정과제 유형과 정부기능분류체계 분야․영역별 콘텐츠를 분석하였다. 또 이전 정부의 국정과제와 현 정보의 국정과제를 비교․분석하여 국정과제 관련 콘텐츠 구축 시 중점적으로 반영해야 할 내용을 파악하였다. 둘째, 정책정보 및 국가 정보 포털의 현황 분석 등을 통해 정책 정보의 연계 및 수집 방안을 모색하였다. 연구 결과, 첫째, 국정과제의 1단계 BRM을 보면, 사회복지 21개, 통일외교 14개, 산업통상중소기업 17개, 일반공공행정 12개, 재정세제금융이 8개, 문화체육관광과 과학기술, 교육이 각 6개, 통신과 공공질서및안전이 5개, 보건, 교통및물류, 환경이 각 4개, 농림 3개, 국방, 지역개발이 각 2개, 해양수산이 각 1개 등의 순으로 나타났다. 新정부의 경우 과학기술과 IT를 중시하는 것을 알 수 있어 핵심 국정과제 정보서비스 구축 시에도 이를 고려할 필요가 있다. 둘째, 외부 기관과의 데이터베이스 연계를 위해서는 연계운영협의회를 구성하고, 국정과제 정보의 연계 및 수집, 국정과제 관련 정보 POINT 연계 및 제공이 필요하다.

Abstract

With a view to providing a high-quality policy information service beyond the existing national task service of the national policy information portal (POINT) of the National Library of Korea Sejong, it would be necessary to effectively provide the policy data needed for the implementation of the new national tasks. Accordingly, in this study, an attempt has been made to find a way to connect and develop the BRM-based national tasks and the policy information contents. Towards this end, first, the types of national tasks and the contents of each field and area of the government function’s classification system were analyzed, with a focus placed on the 120 national tasks of the new administration. Furthermore, by comparing and analyzing the national tasks of the previous administration and the current information, the contents ought to be reflected for the development of contents related to the national tasks identified. Second, the method for linking and collecting the policy information was sought based on the analysis of the current status of policy information and the national information portal. As a result of the study, first, examining the 1st stage BRM of the national tasks, it turned out that there were 21 tasks for social welfare, 14 for unification and diplomacy, 17 for small and medium-sized businesses in industry and trade, 12 for general public administration, 8 for the economy, taxation and finance, 6 for culture, sports and tourism, science and technology, and education each, 5 for communication, public order and safety each, 4 for health, transportation and logistics, and environment each, 3 for agriculture and forestry, 2 for national defense and regional development each, and 1 for maritime and fisheries each, among others. As for the new administration, it is apparent that science technology and IT are important, and hence, it is necessary to consider such when developing the information services for the core national tasks. Second, to link the database with external organizations, it would be necessary to form a linked operation council, link and collect the information on the national tasks, and link and provide the national task-related information for the POINTs.

정보관리학회지