바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: classification scheme, 검색결과: 3
초록보기
초록

국내 학술회의 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히 구현이 쉽고 컴퓨터 처리 속도가 빠른 로치오 알고리즘을 사용하여 『한국정보관리학회 학술대회 논문집』의 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 분류기 생성 방법, 학습집합 규모, 가중치부여 기법, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 파라미터(β, λ)와 학습집합의 크기(5년 이상)를 적절하게 적용하는 것이 효과적이며, 동등한 성능 수준이라면 보다 단순한 단일 가중치부여 기법을 사용하여 분류의 효율성을 높일 수 있음을 발견하였다. 또한 국내 학술회의 논문의 분류는 특정 논문에 하나 이상의 범주가 부여되는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있으므로, 이러한 환경을 고려하여 주요 성능 요소들의 특성에 기초한 최적의 분류 모델을 개발할 필요가 있다.

Abstract

This study examined the factors affecting the performance of automatic classification for the domestic conference papers based on machine learning techniques. In particular, In view of the classification performance that assigning automatically the class labels to the papers in Proceedings of the Conference of Korean Society for Information Management using Rocchio algorithm, I investigated the characteristics of the key factors (classifier formation methods, training set size, weighting schemes, label assigning methods) through the diversified experiments. Consequently, It is more effective that apply proper parameters (β, λ) and training set size (more than 5 years) according to the classification environments and properties of the document set. and If the performance is equivalent, I discovered that the use of the more simple methods (single weighting schemes) is very efficient. Also, because the classification of domestic papers is corresponding with multi-label classification which assigning more than one label to an article, it is necessary to develop the optimum classification model based on the characteristics of the key factors in consideration of this environment.

2
김은주(중앙대학교) ; 노성원(한양의대병원) ; 남태우(중앙대학교) 2016, Vol.33, No.1, pp.53-84 https://doi.org/10.3743/KOSIM.2016.33.1.053
초록보기
초록

이 연구는 한국의 정신의학 분야 국제공동연구 활성화를 위하여, 네트워크 분석에 중점을 두어 정신의학 분야 국제공동연구의 핵심 연구동향을 반영하는 지적구조를 규명하였다. 이를 위해 데이터는 Web of Science를 기반으로 수집하였으며, 검색 대상 기간은 2009년에서 2013년까지로 하였다. 고급검색 기능을 통해 정신의학 연구 분야를 의미하는 SU=“psychiatry”의 검색 식을 사용하였으며, 국제공동연구만을 선택해 총 18,590건의 논문을 수집하였다. 총 18,590건 논문의 저자 키워드와 WoS에서 부여한 키워드를 합쳐 최종 선정된 85개 키워드를 대상으로 분석한 결과는 다음과 같다. 첫째, 질환을 중심으로 총 8개의 세부 주제 영역을 확인하였다. 둘째, 높은 영향력을 가지며 다른 키워드들 간의 매개를 도모하여 주제영역을 확장시키는 총 6개의 핵심 키워드를 확인하였다. 셋째, 커뮤니티 분석을 통해 한국연구재단의 학문분류표를 이용하여 세부 주제영역으로 규명한 결과 총 15군집, 총 12세부 주제영역을 확인하였다.

Abstract

This study clarified the intellectual structure of international collaboration in psychiatry based on analyzing networks in order to vitalize for international collaboration in psychiatry in South Korea. The data set was collected from Web of Science citation database during the period from 2009 to 2013. SU=“psychiatry” search formulary (means field of psychiatric medical research) was used through advanced retrieval function and a total of 18,590 articles were selected among international collaborations. A total of 85 different keywords were selected from the 18,590 articles, and the results of analysis were as follows. First, this study examined 8 sub-subject areas focusing on disorders, and found that major subject areas could be divided into a total of 8 sub-subject areas. Second, this study examined 6 keywords that have a strong impact, and extend subject areas by promoting intermediation between other keywords Third, this study examined sub-subject areas by using the Knowledge Classification Scheme of the National Research Foundation of Korea through community analysis, and found a total of 15 clusters and a total of 12 sub-subject areas.

3
서선경(한국과학기술정보연구원) ; 최호남(한국과학기술정보연구원) ; 김병규(KISTI) ; 최선희(한국과학기술정보연구원) ; 김정환(한국과학기술정보연구원) 2016, Vol.33, No.2, pp.157-176 https://doi.org/10.3743/KOSIM.2016.33.2.157
초록보기
초록

Cited-by Linking 서비스는 CrossRef에서 제공하는 주요 서비스 중 하나로 해당 논문이 DOI를 통하여 얼마나 인용되었는지 누적하여 집계된 데이터이다. 이에 본 연구에서는 KISTI의 학술정보통합관리시스템에서 월단위로 구축․관리하는 Cited-by Linking 데이터를 분석하여 자연과학과 공학 분야의 인용 패턴을 규명하고자 하였다. 이를 위해서 전체 기탁된 21만 건 중 자연과학과 공학 분야 총 170,999건(315종)을 분석 대상으로 하고, 2016년 3월까지 누적된 Cited-by Linking 데이터를 수집하였다. 연구의 분석 결과, 첫째, 글로벌하게 인용될 가능성에서 사용 언어는 영향을 미치고 있으며, 둘째, SCIE 및 SCOPUS 등재 여부 역시 인용가능성에 상당 부분 기여하고 있음을 확인하였다. 셋째, 자연과학 분야는 거의 동일한 주제 분야에서 인용을 받고 있으며, 상대적으로 공학 분야는 타주제 분야에서 더 인용 받고 있음을 파악하였다. 이러한 연구의 결과는 자연과학과 공학 분야의 세부주제 분야별 인용 행태를 규명하고, 향후, 인용 행태에 관한 연구에서 유용하게 활용될 것으로 기대한다.

Abstract

Cited-by Linking Service is one of the CrossRef’s information services that allows you to discover how your publications are being cited and to incorporate that information into your online publication platform. This study tries to investigate citation patterns in the field of both Natural Science and Engineering using all of DOI assigned articles and Cited-by Linking data which are accumulated and managed by KISTI. The investigating approach is designed to verify the theory of 1) cognitive accessibility, 2) ‘perceived quality and significance’ and 3) ‘subject relativity’. For cognitive accessibility verification the fulltext language portion of Korean and English between “Cited DOI Source Data” and “NOT Cited DOI Source Data” was compared. For perceived quality and significance verification the availability of the “Cited DOI Source Data” and “NOT Cited DOI Source Data” from SCIE and SCOPUS was employed. For subject relativity DOI data were classified and analysed on the basis of OECD subject classification scheme. Findings are that global citability is closely related to the fulltext language of the articles and their quality and significance. And in the natural science field most of citations are from the same subject categories, while relatively more citations are from other subject categories in the engineering field.

정보관리학회지