바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: feature combination, 검색결과: 2
1
김판준(신라대학교 문헌정보학과) 2023, Vol.40, No.1, pp.1-21 https://doi.org/10.3743/KOSIM.2023.40.1.001
초록보기
초록

본 연구는 텍스트 분류를 위한 효율적인 자질선정 방법으로 자질 순위화 기법의 성능을 구체적으로 검토하였다. 지금까지 자질 순위화 기법은 주로 문헌빈도에 기초한 경우가 대부분이며, 상대적으로 용어빈도를 사용한 경우는 많지 않았다. 따라서 텍스트 분류를 위한 자질선정 방법으로 용어빈도와 문헌빈도를 개별적으로 적용한 단일 순위화 기법들의 성능을 살펴본 다음, 양자를 함께 사용하는 조합 순위화 기법의 성능을 검토하였다. 구체적으로 두 개의 실험 문헌집단(Reuters-21578, 20NG)과 5개 분류기(SVM, NB, ROC, TRA, RNN)를 사용하는 환경에서 분류 실험을 진행하였고, 결과의 신뢰성 확보를 위해 5-fold cross validation과 t-test를 적용하였다. 결과적으로, 단일 순위화 기법으로는 문헌빈도 기반의 단일 순위화 기법(chi)이 전반적으로 좋은 성능을 보였다. 또한, 최고 성능의 단일 순위화 기법과 조합 순위화 기법 간에는 유의한 성능 차이가 없는 것으로 나타났다. 따라서 충분한 학습문헌을 확보할 수 있는 환경에서는 텍스트 분류의 자질선정 방법으로 문헌빈도 기반의 단일 순위화 기법(chi)을 사용하는 것이 보다 효율적이라 할 수 있다.

Abstract

This study specifically reviewed the performance of the ranking schemes as an efficient feature selection method for text classification. Until now, feature ranking schemes are mostly based on document frequency, and relatively few cases have used the term frequency. Therefore, the performance of single ranking metrics using term frequency and document frequency individually was examined as a feature selection method for text classification, and then the performance of combination ranking schemes using both was reviewed. Specifically, a classification experiment was conducted in an environment using two data sets (Reuters-21578, 20NG) and five classifiers (SVM, NB, ROC, TRA, RNN), and to secure the reliability of the results, 5-Fold cross-validation and t-test were applied. As a result, as a single ranking scheme, the document frequency-based single ranking metric (chi) showed good performance overall. In addition, it was found that there was no significant difference between the highest-performance single ranking and the combination ranking schemes. Therefore, in an environment where sufficient learning documents can be secured in text classification, it is more efficient to use a single ranking metric (chi) based on document frequency as a feature selection method.

2
신혜원((전)숙명여자대학교 문헌정보학과 석사과정) ; 신동희(숙명여자대학교 문헌정보학과 조교수) 2023, Vol.40, No.3, pp.245-271 https://doi.org/10.3743/KOSIM.2023.40.3.245
초록보기
초록

본 연구는 전자책 이용률이 높은 디지털 네이티브 세대인 20대를 대상으로 전자책 구독서비스에 대한 인식을 파악하고자 하였다. 설문조사와 사용성 평가(usability testing)를 병행한 혼합연구 방법을 통해 전자책 이용률이 높은 20대 대학생의 전자책 구독 서비스이용 실태 및 서비스에 대한 인식을 조사하였다. 설문조사를 통해 국내 대학생 202명의 의견을 수집하였고, 전자책 비이용자와 이용자를 구분하여 분석하였다. 설문 결과, 비이용자와 이용자 간의 전자책에 인식의 차이가 나타났으며, 휴대성 및 편의성은 두 연구 참여자 그룹에게 공통적으로 나타나는 전자책의 장점으로 조사되었다. 사용성 평가에서 사용된 ‘밀리의 서재’ 애플리케이션은 가장 대중적인 전자책 플랫폼으로 해당 서비스를 활용하여 전자책 이용 경험이 없는 20대 대학생 10명을 대상으로 평가가 진행되었다. 실험 결과, 연구 참여자들은 전자책의 편의성, 디자인, 다양한 부가 기능, 가성비 등에 대해 긍정적인 반응을 보인 반면, 흥미 부족, 기능 실용성, 터치 오류 및 오작동, 장서 부족, 시스템 문제에 대해서는 부정적인 의견을 나타냈다.

Abstract

The purpose of this study was to assess the perception of e-book subscription services among the digitally native generation in their twenties, who have a high e-book usage rate. This study employed a mixed-methods approach, combining survey responses and usability testing. It aimed to assess the awareness and usage of e-book subscription services among university students in their twenties, a demographic known for their high utilization of electronic devices and e-books. The survey was conducted among 202 university students, and the responses were categorized and examined based on whether they were users or non-users. As a result of the survey, I found there is different awareness of e-book between users and non-users, on the other hand, convenience and portability are the strong point of e-books for users and non-users commonly also. Usability testing was performed on a group of 10 university students in their twenties who had not previously used the ‘Millies Library’ application, which is renowned as the most widely-used e-book platform. Following the experiment, participants expressed positive feedback regarding various optional features, convenience, design, and cost-effectiveness. However, they also had negative reactions concerning touch errors, malfunctions, functional practicality, a lack of interest, system issues, and the absence of a library.

정보관리학회지