바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 감성 분석, 검색결과: 2
1
박서정(연세대학교 문헌정보학과) ; 이수빈(연세대학교 문헌정보학과) ; 김우정(연세대학교 의과대학 용인세브란스병원 정신건강의학교실) ; 송민(연세대학교 문헌정보학과) 2022, Vol.39, No.1, pp.91-117 https://doi.org/10.3743/KOSIM.2022.39.1.091
초록보기
초록

국내를 비롯하여 전 세계적으로 우울증 환자 수가 매년 증가하는 추세이다. 그러나 대다수의 정신질환 환자들은 자신이 질병을 앓고 있다는 사실을 인식하지 못해서 적절한 치료가 이루어지지 않고 있다. 우울 증상이 방치되면 자살과 불안, 기타 심리적인 문제로 발전될 수 있기에 우울증의 조기 발견과 치료는 정신건강 증진에 있어 매우 중요하다. 이러한 문제점을 개선하기 위해 본 연구에서는 한국어 소셜 미디어 텍스트를 활용한 딥러닝 기반의 우울 경향 모델을 제시하였다. 네이버 지식인, 네이버 블로그, 하이닥, 트위터에서 데이터 수집을 한 뒤 DSM-5 주요 우울 장애 진단 기준을 활용하여 우울 증상 개수에 따라 클래스를 구분하여 주석을 달았다. 이후 구축한 말뭉치의 클래스 별 특성을 살펴보고자 TF-IDF 분석과 동시 출현 단어 분석을 실시하였다. 또한, 다양한 텍스트 특징을 활용하여 우울 경향 분류 모델을 생성하기 위해 단어 임베딩과 사전 기반 감성 분석, LDA 토픽 모델링을 수행하였다. 이를 통해 문헌 별로 임베딩된 텍스트와 감성 점수, 토픽 번호를 산출하여 텍스트 특징으로 사용하였다. 그 결과 임베딩된 텍스트에 문서의 감성 점수와 토픽을 모두 결합하여 KorBERT 알고리즘을 기반으로 우울 경향을 분류하였을 때 가장 높은 정확률인 83.28%를 달성하는 것을 확인하였다. 본 연구는 다양한 텍스트 특징을 활용하여 보다 성능이 개선된 한국어 우울 경향 분류 모델을 구축함에 따라, 한국 온라인 커뮤니티 이용자 중 잠재적인 우울증 환자를 조기에 발견해 빠른 치료 및 예방이 가능하도록 하여 한국 사회의 정신건강 증진에 도움을 줄 수 있는 기반을 마련했다는 점에서 의의를 지닌다.

Abstract

The number of depressed patients in Korea and around the world is rapidly increasing every year. However, most of the mentally ill patients are not aware that they are suffering from the disease, so adequate treatment is not being performed. If depressive symptoms are neglected, it can lead to suicide, anxiety, and other psychological problems. Therefore, early detection and treatment of depression are very important in improving mental health. To improve this problem, this study presented a deep learning-based depression tendency model using Korean social media text. After collecting data from Naver KonwledgeiN, Naver Blog, Hidoc, and Twitter, DSM-5 major depressive disorder diagnosis criteria were used to classify and annotate classes according to the number of depressive symptoms. Afterwards, TF-IDF analysis and simultaneous word analysis were performed to examine the characteristics of each class of the corpus constructed. In addition, word embedding, dictionary-based sentiment analysis, and LDA topic modeling were performed to generate a depression tendency classification model using various text features. Through this, the embedded text, sentiment score, and topic number for each document were calculated and used as text features. As a result, it was confirmed that the highest accuracy rate of 83.28% was achieved when the depression tendency was classified based on the KorBERT algorithm by combining both the emotional score and the topic of the document with the embedded text. This study establishes a classification model for Korean depression trends with improved performance using various text features, and detects potential depressive patients early among Korean online community users, enabling rapid treatment and prevention, thereby enabling the mental health of Korean society. It is significant in that it can help in promotion.

2
오찬희(성균관대학교 문헌정보학과 석사과정) ; 김규리(성균관대학교 문헌정보학과 석사과정) ; 주영준(연세대학교 문헌정보학과) 2022, Vol.39, No.1, pp.257-280 https://doi.org/10.3743/KOSIM.2022.39.1.257
초록보기
초록

본 연구에서는 대한민국 정부가 지정한 국가전략기술 사업인 반도체, 이차전지, 바이오 산업에 대한 여론을 파악하고 여론의 변화와 주가 흐름의 연관성을 분석하기 위해 각 산업별 대표 기업에 대한 기사의 댓글을 분석하였다. 반도체 산업에서 ‘삼성전자’, ‘SK하이닉스’, 이차전지 산업에서 ‘삼성SDI’, ‘LG화학’, 바이오 산업에서 ‘삼성바이오로직스’, ‘셀트리온’을 선정하여 이를 제목에 포함하고 있는 2020년 1월 1일부터 2020년 12월 31일까지 발행된 네이버 뉴스 기사의 댓글 47,452개를 수집하고 분석하였다. 먼저, 해당 댓글을 긍정, 중립, 부정의 감성으로 나누고 각 감성 그룹에서의 시간의 흐름에 따른 댓글의 동적인 주제를 분석하여 각 산업별 여론의 트렌드를 파악하였다. 분석 결과 반도체 산업 분야의 경우 투자, 코로나19관련 이슈, 삼성전자라는 대기업에 대한 신뢰, 정부 정책 변화로 인한 타격에 대한 언급이 주제 토픽으로 나타났다. 이차전지 산업체의 경우 투자, 배터리, 기업 이슈에 대한 언급이 주제 토픽으로 나타났다. 바이오 산업체의 경우 투자, 코로나19 관련 이슈 및 기업 이슈에 대한 언급이 주제 토픽으로 나타났다. 다음으로, 댓글의 감성이 실제 주가와 연관성이 있는지를 알아보고자 각 대표 기업 별 주가의 변화와 댓글의 감성 점수 변화를 시각적 분석기법을 이용하여 비교 분석하였다. 분석 결과, 댓글의 감성 점수와 주가의 변화 흐름이 매우 유사하게 나타남을 통해 여론의 감성 점수 변화와 주가의 흐름에는 연관성이 있음을 확인하였다. 본 연구는 주가와의 연관성이 높은 뉴스 기사 댓글을 분석했다는 점, 수집 시기를 코로나19로 선정하여 코로나19라는 특수한 상황에서의 여론 트렌드 변화를 파악했다는 점, 국가전략기술제도에 속하는 산업 기업에 대한 여론을 분석하여 정부기관의 관련 정책 제정에 객관적인 근거를 제공하였다는 점에서 의의를 지닌다.

Abstract

In this study, we analyzed comments on news articles of representative companies of the three industries (i.e., semiconductor, secondary battery, and bio industries) that had been listed as national strategic technology projects of South Korea to identify public opinions towards them. In addition, we analyzed the relationship between changes in public opinion and stock price. ‘Samsung Electronics’ and ‘SK Hynix’ in the semiconductor industry, ‘Samsung SDI’ and ‘LG Chem’ in the secondary battery industry, and ‘Samsung Biologics’ and ‘Celltrion’ in the bio-industry were selected as the representative companies and 47,452 comments of news articles about the companies that had been published from January 1, 2020, to December 31, 2020, were collected from Naver News. The comments were grouped into positive, neutral, and negative emotions, and the dynamic topics of comments over time in each group were analyzed to identify the trends of public opinion in each industry. As a result, in the case of the semiconductor industry, investment, COVID-19 related issues, trust in large companies such as Samsung Electronics, and mention of the damage caused by changes in government policy were the topics. In the case of secondary battery industries, references to investment, battery, and corporate issues were the topics. In the case of bio-industries, references to investment, COVID-19 related issues, and corporate issues were the topics. Next, to understand whether the sentiment of the comments is related to the actual stock price, for each company, the changes in the stock price and the sentiment values of the comments were compared and analyzed using visual analytics. As a result, we found a clear relationship between the changes in the sentiment value of public opinion and the stock price through the similar patterns shown in the change graphs. This study analyzed comments on news articles that are highly related to stock price, identified changes in public opinion trends in the COVID-19 era, and provided objective feedback to government agencies’ policymaking.

정보관리학회지