바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: availability, 검색결과: 2
초록보기
초록

문헌간 유사도를 자질로 사용하는 분류기에서 미분류 문헌을 학습에 활용하여 분류 성능을 높이는 방안을 모색해보았다. 자동분류를 위해서 다량의 학습문헌을 수작업으로 확보하는 것은 많은 비용이 들기 때문에 미분류 문헌의 활용은 실용적인 면에서 중요하다. 미분류 문헌을 활용하는 준지도학습 알고리즘은 대부분 수작업으로 분류된 문헌을 학습데이터로 삼아서 미분류 문헌을 분류하는 첫 번째 단계와, 수작업으로 분류된 문헌과 자동으로 분류된 문헌을 모두 학습 데이터로 삼아서 분류기를 학습시키는 두 번째 단계로 구성된다. 이 논문에서는 문헌간 유사도 자질을 적용하는 상황을 고려하여 두 가지 준지도학습 알고리즘을 검토하였다. 이중에서 1단계 준지도학습 방식은 미분류 문헌을 문헌유사도 자질 생성에만 활용하므로 간단하며, 2단계 준지도학습 방식은 미분류 문헌을 문헌유사도 자질 생성과 함께 학습 예제로도 활용하는 알고리즘이다. 지지벡터기계와 나이브베이즈 분류기를 이용한 실험 결과, 두 가지 준지도학습 방식 모두 미분류 문헌을 활용하지 않는 지도학습 방식보다 높은 성능을 보이는 것으로 나타났다. 특히 실행효율을 고려한다면 제안된 1단계 준지도학습 방식이 미분류 문헌을 활용하여 분류 성능을 높일 수 있는 좋은 방안이라는 결론을 얻었다

Abstract

This paper studies the problem of classifying documents with labeled and unlabeled learning data, especially with regards to using document similarity features. The problem of using unlabeled data is practically important because in many information systems obtaining training labels is expensive, while large quantities of unlabeled documents are readily available. There are two steps in general semi-supervised learning algorithm. First, it trains a classifier using the available labeled documents, and classifies the unlabeled documents. Then, it trains a new classifier using all the training documents which were labeled either manually or automatically. We suggested two types of semi-supervised learning algorithm with regards to using document similarity features. The one is one step semi-supervised learning which is using unlabeled documents only to generate document similarity features. And the other is two step semi-supervised learning which is using unlabeled documents as learning examples as well as similarity features. Experimental results, obtained using support vector machines and naive Bayes classifier, show that we can get improved performance with small labeled and large unlabeled documents then the performance of supervised learning which uses labeled-only data. When considering the efficiency of a classifier system, the one step semi-supervised learning algorithm which is suggested in this study could be a good solution for improving classification performance with unlabeled documents.

2
정경희(한성대학교 디지털인문정보학트랙 교수) ; 이재윤(명지대학교 문헌정보학과 교수) ; 정은경(이화여자대학교 문헌정보학과 교수) ; 최상희(대구가톨릭대학교 도서관학과 부교수) 2020, Vol.37, No.4, pp.255-286 https://doi.org/10.3743/KOSIM.2020.37.4.255
초록보기
초록

본 연구는 ‘한국연구재단 오픈액세스 2021(안)’에 대한 실행방안을 도출하기 위한 것이다. 본 연구는 APC 지원규모와 방법 및 절차, 국내 학술지의 오픈액세스 전환 지원, 오픈액세스 리포지터리에 논문을 기탁하는 방안 등 세 가지 측면에서 실행방안을 제안하였다. 첫째, APC는 합리적인 수준에서 지원되어야 하며 그 상한액을 설정하기 위하여 매년도 이전 3년간 오픈액세스 학술지에 출판한 논문의 APC 평균값이나 중위값을 적용한다. 또한 APC는 오픈액세스 학술지와 오픈액세스전환약정 학술지에 논문을 출판하는 경우 지원하고 하이브리드 학술지나 이중접근 학술지에는 지원하지 않는다. 둘째, 국내 학술지 오픈액세스 출판전환을 위하여 과도기에는 KJCI에 CCL 적용을 등록한 오픈액세스 학술지와 오픈액세스 출판 전환의향서를 제출한 학술지에 대하여 지원사업 신청이 가능하도록 해야 한다. 셋째, 하이브리드 학술지와 이중접근 학술지 및 구독학술지에 출판한 경우 원문기탁과 동시에 엠바고 등 저작권 사항을 보고해야 한다. 본 연구의 결과는 한국연구재단이 국내 학술지 출판환경과 국제적인 학술커뮤니케이션 상황에 부합하는 오픈액세스 정책을 신속하면서도 안정적이고 지속적으로 실행하는데 기초 자료로 활용될 수 있을 것이다.

Abstract

This study aims to identify the methods of implementation for the ‘National Research Foundation of Korea Open Access 2021(Plan)’. This study covers the methods of implementation in the three following core items: 1) developing the details on the amount, method, and procedures of APC support; 2) proposing methods for facilitating the transition of domestic Korean academic journals to open access journals; and 3) developing methods of entrusting papers to open access repositories. APC support should be guaranteed at a reasonable level. The average or median of APC values for the previous three years will be applied to set the upper limit for support each year. APC support will be provided when the paper is published to open access journals or transitioning journals to open access. Hybrid journals or dual access journals are not included. Support for open access publishing of academic journals in Korea during the transition period will be available for open access journals that have registered for CCL in KJCI or journals that have submitted their application for transitioning to open access. Publishing in hybrid, dual access or subscription-based journals must be accompanied by items related to copyright such as embargo. Research results will be used for the detailed implementation plan of ‘NRF OA2021 (Plan)’. They will serve as the base data for the rapid, stable, and sustainable implementation of open access policy in NRF, addressing the Korean domestic academic journal publishing environment and the field of international academic communication.

정보관리학회지