바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: social classification, 검색결과: 2
1
이수빈(연세대학교 문헌정보학과) ; 김성덕(연세대학교 문헌정보학과) ; 이주희(연세대학교 문헌정보학과) ; 고영수(연세대학교 문헌정보학과) ; 송민(연세대학교) 2021, Vol.38, No.2, pp.153-172 https://doi.org/10.3743/KOSIM.2021.38.2.153
초록보기
초록

본 연구는 공황장애 말뭉치 구축과 분석을 통해 공황장애의 특성을 살펴보고 공황장애 경향 문헌을 분류할 수 있는 딥러닝 자동 분류 모델을 만들고자 하였다. 이를 위해 소셜미디어에서 수집한 공황장애 관련 문헌 5,884개를 정신 질환 진단 매뉴얼 기준으로 직접 주석 처리하여 공황장애 경향 문헌과 비 경향 문헌으로 분류하였다. 이 중 공황장애 경향 문헌에 나타난 어휘적 특성 및 어휘의 관계성을 분석하기 위해 TF-IDF값을 산출하고 단어 동시출현 분석을 실시하였다. 공황장애의 특성 및 증상 간의 관련성을 분석하기 위해 증상 빈도수와 주석 처리된 증상 번호 간의 동시출현 빈도수를 산출하였다. 또한, 구축한 말뭉치를 활용하여 딥러닝 자동 분류 모델 학습 및 성능 평가를 하였다. 이를 위하여 최신 딥러닝 언어 모델 BERT 중 세 가지 모델을 활용하였고 이 중 KcBERT가 가장 우수한 성능을 보였다. 본 연구는 공황장애 관련 증상을 겪는 사람들의 조기 진단 및 치료를 돕고 소셜미디어 말뭉치를 활용한 정신 질환 연구의 영역을 확장하고자 시도한 점에서 의의가 있다.

Abstract

This study is to create a deep learning based classification model to examine the characteristics of panic disorder and to classify the panic disorder tendency literature by the panic disorder corpus constructed for the present study. For this purpose, 5,884 documents of the panic disorder corpus collected from social media were directly annotated based on the mental disease diagnosis manual and were classified into panic disorder-prone and non-panic-disorder documents. Then, TF-IDF scores were calculated and word co-occurrence analysis was performed to analyze the lexical characteristics of the corpus. In addition, the co-occurrence between the symptom frequency measurement and the annotated symptom was calculated to analyze the characteristics of panic disorder symptoms and the relationship between symptoms. We also conducted the performance evaluation for a deep learning based classification model. Three pre-trained models, BERT multi-lingual, KoBERT, and KcBERT, were adopted for classification model, and KcBERT showed the best performance among them. This study demonstrated that it can help early diagnosis and treatment of people suffering from related symptoms by examining the characteristics of panic disorder and expand the field of mental illness research to social media.

초록보기
초록

이 연구는 KCI 기타인문학, 기타사회과학, 사회과학일반 분야(이하 ‘일반 및 기타 분야’로 표기)에 속한 학술지의 다학문성과 학제성을 분석한 후, 이를 바탕으로 일반 및 기타 분야의 학술지 분류에 대한 개선방안을 제안하는 것이 목적이다. 개별 학술지의 다학문성과 학제성은 인용관계에 나타난 학술지 단위 엔트로피와 논문 단위 엔트로피로 각각 측정하였다. 학술지 간 인용관계 분석 결과 KCI 일반 및 기타 분야에는 다학문성과 학제성 측면에서 다양한 학술지가 혼재되어 있는 것으로 나타났다. 일반 및 기타 분야 학술지의 분류를 바로잡기 위해서는 우선 학술연구분야 분류표에 인문학일반 분야를 새로 설정할 필요가 있음을 밝혔다. 나아가서 각 학술지의 다학문성 수준 및 학제성 수준을 고려하여 일반 및 기타 분야 학술지를 재분류하는 방안을 제안하였다.

Abstract

This study analyzed humanities and social science (HSS) journals of KCI to examine the multidisciplinarity and interdisciplinarity in the general and miscellaneous fields (hereinafter referred to as ‘GM fields’), The multidisciplinarity and interdisciplinarity identified in this study will be a foundation to improve classification of KCI journals in GM fields. Each journal’s multidisciplinarity and interdisciplinarity were measured by journal-level entropy and document-level entropy, respectively, in the citation relationships. According to the analysis, GM field journals have wide ranges of multidisciplinarity and interdisciplinarity. To improve classification quality of journals in GM fields, the general humanities should be considered as a new classification class for the multidisciplinary and interdisciplinary journals in the humanities. Furthermore, this study proposes a strategy to reclassify GM field journals of HSS according to their multidisciplinarity and interdisciplinarity.

정보관리학회지