바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 학습, 검색결과: 5
1
김용환(연세대학교) ; 정영미(연세대학교) 2012, Vol.29, No.2, pp.155-171 https://doi.org/10.3743/KOSIM.2012.29.2.155
초록보기
초록

텍스트 범주화에 있어서 일반적인 문제는 문헌을 표현하는 핵심적인 용어라도 학습문헌 집합에 나타나지 않으면 이 용어는 분류자질로 선정되지 않는다는 것과 형태가 다른 동의어들은 서로 다른 자질로 사용된다는 점이다. 이 연구에서는 위키피디아를 활용하여 문헌에 나타나는 동의어들을 하나의 분류자질로 변환하고, 학습문헌 집합에 출현하지 않은 입력문헌의 용어를 가장 유사한 학습문헌의 용어로 대체함으로써 범주화 성능을 향상시키고자 하였다. 분류자질 선정 실험에서는 (1) 비학습용어 추출 시 범주 정보의 사용여부, (2) 용어의 유사도 측정 방법(위키피디아 문서의 제목과 본문, 카테고리 정보, 링크 정보), (3) 유사도 척도(단순 공기빈도, 정규화된 공기빈도) 등 세 가지 조건을 결합하여 실험을 수행하였다. 비학습용어를 유사도 임계치 이상의 최고 유사도를 갖는 학습용어로 대체하여 kNN 분류기로 분류할 경우 모든 조건 결합에서 범주화 성능이 0.35%~1.85% 향상되었다. 실험 결과 범주화 성능이 크게 향상되지는 못하였지만 위키피디아를 활용하여 분류자질을 선정하는 방법이 효과적인 것으로 확인되었다.

Abstract

In text categorization, core terms of an input document are hardly selected as classification features if they do not occur in a training document set. Besides, synonymous terms with the same concept are usually treated as different features. This study aims to improve text categorization performance by integrating synonyms into a single feature and by replacing input terms not in the training document set with the most similar term occurring in training documents using Wikipedia. For the selection of classification features, experiments were performed in various settings composed of three different conditions: the use of category information of non-training terms, the part of Wikipedia used for measuring term-term similarity, and the type of similarity measures. The categorization performance of a kNN classifier was improved by 0.35~1.85% in F1 value in all the experimental settings when non-learning terms were replaced by the learning term with the highest similarity above the threshold value. Although the improvement ratio is not as high as expected, several semantic as well as structural devices of Wikipedia could be used for selecting more effective classification features.

초록보기
초록

이 연구는 대학 강의지원시스템을 이용하는 학습자의 이용성을 향상시키기 위해 필요한 이용자 인터페이스 설계 원칙을 개발하는데 목적이 있다. 이를 위하여 문헌조사를 바탕으로 사전설문과 이용성 평가 실험으로 구성된 이용성 조사를 실시하였다. 이용성 조사로부터 얻어낸 결과를 종합하여 총 11개의 대학 강의지원시스템 이용자 인터페이스 설계 원칙을 개발하였다. 본 연구는 대학 강의지원시스템의 이용자 인터페이스 설계 원칙을 개발하기 위하여 주이용자인 학습자를 대상으로 이용성 조사를 실시하여 실제 이용자의 의견을 시스템의 기능별로 제시하고 직접적으로 설계 원칙에 반영할 수 있었다는 점에서 의의가 있다.

Abstract

The study goal is to develop the user interface design principles to improve the usability of university course management systems. To achieve the goal, a usability study was conducted using a survey questionnaire and usability test. Eleven user interface design principles for university course management system were developed based on the usability study. This study has significance in that student opinions were incorporated directly into the user interface design principles of university course management system.

초록보기
초록

최근 대학교육에서 구성주의 교육 이론을 실천하는 방법으로서 팀 기반 학습에 대한 중요성이 점차 부각되고 있다. 그러나 이와 반대로 대학생들의 팀 과제에 대한 선호도는 매우 낮은 편이어서, 팀 과제 수행시의 정보문제 해결과정을 분석하여 대학의 정보문해 교육을 통해서 주요 문제점에 대한 해결방안을 지원할 필요성이 있다. 본 연구에서는 대학생들의 과제 중심 정보문제 해결과정을 두 차례의 인터뷰를 통해 분석한 결과 팀 과제 수행시 과제정의, 적합정보 판단, 결과와 과정의 평가, 팀원 간의 책임의 부재, 통합정리가 주요한 어려움으로서 분석되었다. 그 결과 정보문해 교육 내용에 반영할 권장사항으로서 다양한 정보원의 소개와 활용법 교육, 팀원 간의 커뮤니케이션 문제 해결, 정보의 신뢰성 판단 기준에 대한 교육, 과제 평가의 기준 및 방법이 제시되었다.

Abstract

Recently, the importance of team based learning has emerged as the method for conducting the constructivist learning theory. College students, however, have the low preference toward team projects. Thus, this research suggested that the information literacy education should be designed to overcome the problems in team project activities after analyzing the college students' information problem solving process. The in-depth interviews were conducted twice with 10 subjects. As a result, the main problems during team project activities were task definition, judgement on relevant information, evaluation of result and process, absence of accountability and synthesis. The recommendations for information literacy course are as follows: introduction to different types of information sources, support for communication problems between team members, education of credibility judgment on information and criteria for evaluating the results.

초록보기
초록

본 연구는 국내 주요 학술 DB의 검색서비스에서 제공되고 있는 저자키워드(비통제키워드)의 재분류를 통하여 디스크립터(통제키워드)를 자동 할당할 수 있는 가능성을 모색하였다. 먼저 기계학습에 기반한 주요 분류기들의 특성을 비교하는 실험을 수행하여 재분류를 위한 최적 분류기와 파라미터를 선정하였다. 다음으로, 국내 독서 분야 학술지 논문들에 부여된 저자키워드를 학습한 결과에 따라 해당 논문들을 재분류함으로써 키워드를 추가로 할당하는 실험을 수행하였다. 또한 이러한 재분류 결과에 따라 새롭게 추가된 문헌들에 대하여 통제키워드인 디스크립터와 마찬가지로 동일 주제의 논문들을 모아주는 어휘통제 효과가 있는지를 살펴보았다. 그 결과, 저자키워드의 재분류를 통하여 디스크립터를 자동 할당하는 효과를 얻을 수 있음을 확인하였다.

Abstract

This study purported to investigate the possibility of automatic descriptor assignment using the reclassification of author keywords in domestic scholarly databases. In the first stage, we selected optimal classifiers and parameters for the reclassification by comparing the characteristics of machine learning classifiers. In the next stage, learning the author keywords that were assigned to the selected articles on readings, the author keywords were automatically added to another set of relevant articles. We examined whether the author keyword reclassifications had the effect of vocabulary control just as descriptors collocate the documents on the same topic. The results showed the author keyword reclassification had the capability of the automatic descriptor assignment.

5
송성전(연세대학교) ; 정영미(연세대학교) 2012, Vol.29, No.2, pp.205-224 https://doi.org/10.3743/KOSIM.2012.29.2.205
초록보기
초록

자동 분류에서 문헌을 표현하는 일반적인 방식인 BOW는 용어를 독립적으로 처리하기 때문에 주변 문맥을 반영하지 못한다는 한계가 있다. 이에 본 연구는 각 용어마다 주제범주별 문맥적 특징을 파악해 프로파일로 정의하고, 이 프로파일과 실제 문헌에서의 문맥을 비교하는 과정을 통해 동일한 형태의 용어라도 그 의미나 주제적 배경에 따라 구분하고자 하였다. 이를 통해 주제가 서로 다름에도 불구하고 특정 용어의 출현만으로 잘못된 분류 판정을 하는 문제를 극복하고자 하였다. 본 연구에서는 이러한 문맥적 요소를 용어 가중치, 분류기 결합, 자질선정의 3가지 항목에 적용해 보고 그 분류 성능을 측정했다. 그 결과, 세 경우 모두 베이스라인보다 분류 성능이 향상되었고 가장 큰 성능 향상을 보인 것은 분류기 결합이었다. 또한 제안한 방법은 학습문헌 수가 많고 적음에 따라 발생하는 성능의 편향을 완화하는데도 효과적인 것으로 나타났다.

Abstract

One of the limitations of BOW method is that each term is recognized only by its form, failing to represent the term’s meaning or thematic background. To overcome the limitation, different profiles for each term were defined by thematic categories depending on contextual characteristics. In this study, a specific term was used as a classification feature based on its meaning or thematic background through the process of comparing the context in those profiles with the occurrences in an actual document. The experiment was conducted in three phases; term weighting, ensemble classifier implementation, and feature selection. The classification performance was enhanced in all the phases with the ensemble classifier showing the highest performance score. Also, the outcome showed that the proposed method was effective in reducing the performance bias caused by the total number of learning documents.

정보관리학회지