바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: feature selection, 검색결과: 20
초록보기
초록

이 논문의 목적은 SVM(지지벡터기계) 분류기의 성능을 문헌간 유사도를 이용해서 향상시키는 것이다. 는 문헌 벡터 자질 표현에 기반한 SVM 문헌자동분류를 제안하였다. 제안한 방식은 분류 자질로 색인어 대신 문헌 벡터를, 자질값으로 가중치 대신 벡터유사도를 사용한다. 제안한 방식에 대한 실험 결과, SVM 분류기의 성능을 향상시킬 수 있었다. 실행 효율 향상을 위해서 문헌 벡터 자질 선정 방안과 범주 센트로이드 벡터를 사용하는 방안을 제안하였다. 실험 결과 소규모의 벡터 자질 집합만으로도 색인어 자질을 사용하는 기존 방식보다 나은 성능을 얻을 수 있었다.

Abstract

The purpose of this paper is to explore the ways to improve the performance of SVM(Support Vector Machines) text classifier using inter-document similarit ies. SVMs are powerful machine technique for automatic document classification. In this paper text categorization via SVMs aproach based on feature representation with document vectors is suggested. In this appr oach, document vectors instead stead of term weights are used as feature values. Experiments show that SVM clasifier with do cument vector features can improve the document classification performance. For the sake o f run-time efficiency, two methods are developed: One is to select document vector feature s, and the other is to use category centroid vector features instead. Experiments on these two methods show that we the performance of conventional methods with index term features.

초록보기
초록

본 연구의 목적은 국내 학술논문 데이터베이스에서 검색한 언어 네트워크 분석 관련 53편의 국내 학술논문들을 대상으로 하는 내용분석을 통해, 언어 네트워크 분석 방법의 기초적인 체계를 파악하기 위한 것이다. 내용분석의 범주는 분석대상의 언어 텍스트 유형, 키워드 선정 방법, 동시출현관계의 파악 방법, 네트워크의 구성 방법, 네트워크 분석도구와 분석지표의 유형이다. 분석결과로 나타난 주요 특성은 다음과 같다. 첫째, 학술논문과 인터뷰 자료를 분석대상의 언어 텍스트로 많이 사용하고 있다. 둘째, 키워드는 주로 텍스트의 본문에서 추출한 단어의 출현빈도를 사용하여 선정하고 있다. 셋째, 키워드 간 관계의 파악은 거의 동시출현빈도를 사용하고 있다. 넷째, 언어 네트워크는 단수의 네트워크보다 복수의 네트워크를 구성하고 있다. 다섯째, 네트워크 분석을 위해 NetMiner, UCINET/NetDraw, NodeXL, Pajek 등을 사용하고 있다. 여섯째, 밀도, 중심성, 하위 네트워크 등 다양한 분석지표들을 사용하고 있다. 이러한 특성들은 언어 네트워크 분석 방법의 기초적인 체계를 구성하는 데 활용할 수 있을 것이다.

Abstract

The purpose of this study is to perform content analysis of research articles using the language network analysis method in Korea and catch the basic point of the language network analysis method. Six analytical categories are used for content analysis: types of language text, methods of keyword selection, methods of forming co-occurrence relation, methods of constructing network, network analytic tools and indexes. From the results of content analysis, this study found out various features as follows. The major types of language text are research articles and interview texts. The keywords were selected from words which are extracted from text content. To form co-occurrence relation between keywords, there use the co-occurrence count. The constructed networks are multiple-type networks rather than single-type ones. The network analytic tools such as NetMiner, UCINET/NetDraw, NodeXL, Pajek are used. The major analytic indexes are including density, centralities, sub-networks, etc. These features can be used to form the basis of the language network analysis method.

13
심지영(연세대학교) ; 김태수(연세대학교) 2002, Vol.19, No.3, pp.5-30 https://doi.org/10.3743/KOSIM.2002.19.3.005
초록보기
초록

본 연구는 음악의 내용에 해당하는 음렬 패턴을 대상으로 분류자질을 선정하고 이를 기준으로 음렬간 유사도를 측정한 후 음렬간 군집을 형성하였다. 이는 내용기반음악검색 시스템에서 유사한 음렬을 검색 결과로 제시함으로써 이용자 탐색을 용이하게 하기 위함이다. 실험문헌집단으로는 「A Dictionary of Musical Themes」에 수록된 주제소절의 kern 형식 파일을 사용하였으며, 음렬 처리도구로는 Humdrum Toolkit version 1.0을 사용하였다. 음렬의 분절 여부와 시작 위치에 따른 네 가지 형태의 유사도 행렬을 대상으로 계층적 클러스터링 기법을 사용하여 유사한 음렬간 군집을 형성하였다. 이들 결과에 대한 평가는 외적 기준이 되는 수작업 분류표가 있는 경우 WACS 척도를 사용하였고, 음렬 내 임의의 위치에서부터 시작한 음렬을 대상으로 한 경우, 클러스터링 결과로부터 얻어낸 군집 내 공통 자질 패턴 분포를 통해 내적 기준을 마련하여 평가하였다. 평가 결과에 의하면 음렬의 시작 위치와 무관하게 분절한 자질을 사용하여 클러스터링한 결과가 그렇지 않은 것에 비해 뚜렷한 차이를 보이며 높게 나타났다.

Abstract

In this paper, classification feature is selected with focus of musical content, note sequences pattern, and measures similarity between note sequences followed by constructing clusters by similar note sequences, which is easier for users to search by showing the similar note sequences with the search result in the CBMR system. Experimental document was 「A Dictionary of Musical Themes」, the index of theme bar focused on classical music and obtained kern-type file. Humdrum Toolkit version 1.0 was used as note sequences treat tool. The hierarchical clustering method is by stages focused on four-type similarity matrices by whether the note sequences segmentation or not and where the starting point is. For the measurement of the result, WACS standard is used in the case of being manual classification and in the case of the note sequences starling from any point in the note sequences, there is used common feature pattern distribution in the cluster obtained from the clustering result. According to the result, clustering with segmented feature unconnected with the starting point Is higher with distinct difference compared with clustering with non-segmented feature.

초록보기
초록

본 논문에서는 OpenURL을 이용한 전자자원 링킹시스템의 개요를 기술하고 있다 이어서 16개의 OpenURL link resolver를 선정해서 서버설치여부, 보유하고 있는 저널종수, 서비스 커스터마이제이션, 사용통계서비스 등을 기준으로 비교분석하였다. 분석결과는 각 도서관 및 유관기관에서 링킹시스템을 구입 또는 구축해서 이용할 경우 자관에 맞는 시스템을 선정하는데 도움이 될 것이다.

Abstract

This study describes the concept of link resolvers using OpenURL. Then, the study analyzed the commercially available link resolvers in terms of remote & local hosting, title list, customization of the services and usage statistics. The results will help the libraries select the appropriate link resolvers that are relevant to the features of the libraries.

15
김신영(숭의여자대학) ; 이창수(경북대학교) 2004, Vol.21, No.2, pp.45-67 https://doi.org/10.3743/KOSIM.2004.21.2.045
초록보기
초록

본 연구는 인쇄잡지 중심의 소장 패러다임 대 전자잡지 위주의 접근 패러다임이 대립하는 상황에서 대학도서관의 하이브리드형 학술지 수집정책의 이론적 토대가 되는 평가요소를 분석하여 한국적 실정을 고려한 외국 학술지의 평가모형 개발에 필요한 기초자료를 마련하는데 그 목적이 있다. 구체적으로 질문지법을 통하여 학술지 수집규모 상위 40개 대학도서관의 외국학술지 선정과정에서 예비평가지표(인쇄형 27개, 전자형 37개)의 적용도를 조사하고, 그 데이터를 다양한 통계적기법으로 분석하였다. 인쇄학술지 평가지표의 요인별 상대적 중요성은 응답 평균값으로 산출하였는데 그 결과는 학과당 구독종수, 이용도, 선정권한, 전자학술지 구독조건, ISI 영향지수, 국제성과 지명도, 구독가격, ILL/DDS, 수장공간 순으로 나타났다. 한편, 전자학술지는 구독가격, 접근성, 전자학술지 구독조건, 컨소시엄, 선정권한, 접근확장성, 학과당 구독종수, 대학의 학문적 특성, ISI 영향지수, ILL/DDS, 국제성과 지명도 순으로 나타났다.

Abstract

The purposes of this study are to compare and analyze the evaluation indicators for selection of journal suggested by scholars and organizations and to prepare theoretical background for the ideal model to meet opposing paradigms of collection management in academic libraries. A web survey method was employed to investigate applications of various selection criteria (27 for printed and 37 for electronic academic Journal) from the top 40 academic libraries in Korea. In addition, data were analysed statistically using factor analysis, t-test, Analysis of Variance(ANOVA), and Spearman's Rank Oder Correlation. The mean ranking for 9 evaluation indicators for printed were as follows: subscribing volumes per departments, degree of use, selection authority, electronic/print bundle, ISI impact factor, Internationality and reputation, costs for subscription, ILL & DDS, space considerations for printed materials. But, 11 evaluation indicators for electronic were as follows: costs for subscription, accessibility, electronic/print bundle, consortia, selection authority, access expandability, subscribing volumes per departments, scholarly features of the university, ISI impact factor, ILL & DDS, internationality and reputations.

16
민기은(진성고등학교) ; 정영미(연세대학교) 2007, Vol.24, No.4, pp.73-96 https://doi.org/10.3743/KOSIM.2007.24.4.073
초록보기
초록

이 연구에서는 웹과 학술지를 통한 학술 커뮤니케이션의 특성을 각각 분석하고, 웹상에서의 학술 커뮤니케이션 패턴이 학문 분야에 따라 어떤 차이를 보이는지 비교하였다. 경제학과 컴퓨터공학정보시스템 분야에서 키워드를 추출하여 이와 관련된 학술적 웹페이지와 학술지 논문을 수집하였고, 이를 학술적 웹페이지의 특성, 웹페이지 동시링크와 학술지 논문 동시인용 데이터의 다차원척도(MDS) 분석, 시간의 흐름에 따른 학술 활동의 변화 등 세 가지 측면에서 분석하였다. 분석 결과, 웹과 학술지를 통한 학술 커뮤니케이션에는 공통점과 차이점이 나타났으며, 이런 현상은 두 학문 분야에서 모두 확인되었다. 그리고 웹을 통한 학술 커뮤니케이션의 경우 같은 학문 분야 내의 세부 주제에 따라서 고유한 특성이 나타나는 것을 볼 수 있었다.

Abstract

In this study, the characteristics of scholarly communication through the Web and scientific journals are explored, and scholarly communication patterns in two scientific disciplines are compared to reveal the difference. Economics and Computer Science-Information Systems are selected as two disciplines to be analyzed. In the data collection process, 10 keywords are extracted from a database for each subject field, and scholarly Web pages and journal articles related to these keywords are collected and analyzed. Our investigation includes the characteristics of scholarly Web pages, Multi-Dimensional Scaling (MDS) analysis of co-linked Web pages as well as co-cited journal articles, and changes in the scholarly communication activities occurring on the Web and in scientific journals respectively over time. We found certain differences as well as common features in scholarly communication patterns between the Web and scientific journals for both fields of Economics and Computer Science. We also found that scholarly communication occurring on the Web displays unique features for each subtopic within the same field of study.

17
서은경(한성대학교) ; 이원경(한성대학교) 2008, Vol.25, No.2, pp.25-48 https://doi.org/10.3743/KOSIM.2008.25.2.025
초록보기
초록

Abstract

The purpose of this study is to suggest retrieval interfaces for Korean paintings which support users to retrieve specific digitalized images of them through various access points and to widely browse based on unique features Korean paintings. The study, first, develops a set of descriptive elements suitable for Korean paintings. Twenty-six core elements and one hundred seventy-two attributes are selected as descriptive items for Korean paintings based on the opinion of 8 experts. Then, to gain realistic evidence of what descriptive elements of image serve users as access points, it is investigated which elements are used as retrieval access points among 26 core elements by 300 peered users who are consisted with two groups such as common users and domain specialists. The study, in final, designs two(general and advanced) types of search interfaces and display interfaces based on the most popular top 15 descriptive elements. This access-enhanced platform which enables user-oriented searches will satisfy users in image retrieving.

18
남재우(중앙대학교) ; 남태우(중앙대학교) 2010, Vol.27, No.4, pp.153-168 https://doi.org/10.3743/KOSIM.2010.27.4.153
초록보기
초록

스마트폰의 이용증가에 따라 도서관의 정보서비스는 새로운 패러다임을 맞이하고 있다. 본 연구는 도서관 모바일 웹사이트에 나타난 콘텐츠를 분석하여 정보의 구성현황 및 특징을 알아보기 위한 연구이다. 이를 위해 국외 26개 도서관을 선별하여 해당기관의 모바일 웹사이트를 조사하였고 사이트에 포함된 콘텐츠를 분석하였다. 그 결과로 모바일 웹사이트의 정보구조 및 핵심 콘텐츠를 분석하여 제시하였으며, 모바일 웹사이트에서 가장 많이 제공되고 있는 콘텐츠의 유형을 분석하였다. 연구의 결과는 도서관의 모바일 웹사이트 구축을 위한 참고자료가 될 수 있을 것이다.

Abstract

The information service of library is getting into a new paradigm as the smart phone usage increases. This study analyzes the contents reflected on the library mobile website to figure out the structural condition and features of the information. For this study, 26 academic libraries in U.S. are selected for an examination of their mobile websites, and the contents on the sites were analyzed. This study analyzed the most frequent type of contents provided in the mobile website. As a result, this study suggested the information structure and core contents of the mobile website in detail. The outcome of this study is expected to be a reference for building the mobile website of library.

19
백지원(이화여자대학교) ; 정연경(이화여자대학교) 2014, Vol.31, No.1, pp.31-51 https://doi.org/10.3743/KOSIM.2014.31.1.031
초록보기
초록

본 연구의 목적은 국립중앙도서관 주제명표목표의 이용자 접근 및 검색 시스템 기능 개선 방안을 제안하는 것이다. 이를 위하여 첫째, 국내외 주요 주제명표목표의 주제명 접근 및 검색 방식을 분석하여 시사점을 도출하였다. 둘째, 포커스 그룹 인터뷰와 검색 시스템 분석을 통해 주제명 접근, 이용 방식과 절차 등 국립중앙도서관 주제명표목표의 이용 현황 및 검색 시스템의 문제점을 파악하였다. 셋째, IFLA의 국가 서지 주제 접근 지침과 FAST의 적용 사례에 나타난 주제 접근 도구의 발전 방향 및 국내외 사례의 시사점 등을 바탕으로 국립중앙도서관 주제명표목표의 검색 시스템 개선안을 기능, 인터페이스, 질의, 부가 서비스 등 4가지 부문으로 나누어 제안하였다.

Abstract

This study aims to suggest several improvement strategies for the access and retrieval system of National Library of Korea Subject Headings (NLKSH). For this purpose, first of all, the access and retrieval systems in five selected subject headings were examined. Second, focus group interviews and system analysis were conducted to reveal the current condition and suggest the future development strategies. Third, IFLA’s Guidelines for Subject Access in National Bibliographies and FAST application cases were analyzed to suggest implications on the improvement strategies. Upon these analysis, recommendations for improving access and retrieval systems of the NLKSH were proposed in four areas as follows: functionalities, interfaces, queries, and other front-end features.

20
이용구(계명대학교) ; 정영미(연세대학교) 2007, Vol.24, No.1, pp.321-342 https://doi.org/10.3743/KOSIM.2007.24.1.321
초록보기
초록

이 연구에서는 수작업 태깅없이 기계가독형 사전을 이용하여 자동으로 의미를 태깅한 후 학습데이터로 구축한 분류기에 대해 의미를 분류하는 단어 중의성 해소 모형을 제시하였다. 자동 태깅을 위해 사전 추출 정보 기반 방법과 연어 공기 기반 방법을 적용하였다. 실험 결과, 자동 태깅에서는 복수 자질 축소를 적용한 사전 추출 정보 기반 방법이 70.06%의 태깅 정확도를 보여 연어 공기 기반 방법의 56.33% 보다 24.37% 향상된 성능을 가져왔다. 사전 추출 정보 기반 방법을 이용한 분류기의 분류 정학도는 68.11%로서 연어 공기 기반 방법의 62.09% 보다 9.7% 향상된 성능을 보였다. 또한 두 자동 태깅 방법을 결합한 결과 태깅 정확도는 76.09%, 분류 정확도는 76.16%로 나타났다.

Abstract

This study presents an effective word sense disambiguation model that does not require manual sense tagging process by automatically tagging the right sense using a machine-readable dictionary, and attempts to classify the senses of those words using a classifier built from the training data. The automatic tagging technique was implemnted by the dictionary information-based and the collocation co-occurrence-based methods. The dictionary information-based method that applied multiple feature selection showed the tagging accuracy of 70.06%, and the collocation co-occurrence-based method 56.33%. The sense classifier using the dictionary information-based tagging method showed the classification accuracy of 68.11%, and that using the collocation co-occurrence-based tagging method 62.09%. The combined tagging method applying data fusion technique achieved a greater performance of 76.09% resulting in the classification accuracy of 76.16%.

정보관리학회지