바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Selecting, 검색결과: 171
11
김수연(연세대학교) ; 정영미(연세대학교) 2006, Vol.23, No.3, pp.147-165 https://doi.org/10.3743/KOSIM.2006.23.3.147
초록보기
초록

이 연구에서는 전체 문헌집단으로부터 초기 질의어에 대한 연관용어 선정 시 사용할 수 있는 최적의 기법을 찾기 위해 연관규칙 마이닝과 용어 클러스터링 기법을 이용하여 연관용어 선정 실험을 수행하였다. 연관규칙 마이닝 기법에서는 Apriori 알고리즘을 사용하였으며, 용어 클러스터링 기법에서는 연관성 척도로 GSS 계수, 자카드계수, 코사인계수, 소칼 & 스니스 5, 상호정보량을 사용하였다. 성능평가 척도로는 연관용어 정확률과 연관용어 일치율을 사용하였으며, 실험결과 Apriori 알고리즘과 GSS 계수가 가장 좋은 성능을 나타냈다.

Abstract

In this study, experiments for selection of association terms were conducted in order to discover the optimum method in selecting additional terms that are related to an initial query term. Association term sets were generated by using support, confidence, and lift measures of the Apriori algorithm, and also by using the similarity measures such as GSS, Jaccard coefficient, cosine coefficient, and Sokal & Sneath 5, and mutual information. In performance evaluation of term selection methods, precision of association terms as well as the overlap ratio of association terms and relevant documents' indexing terms were used. It was found that Apriori algorithm and GSS achieved the highest level of performances.

초록보기
초록

국내 학술연구의 동향을 구체적으로 파악하여 연구개발 활동의 체계적인 지원 및 평가는 물론 현재와 미래의 연구 방향을 설정할 수 있는 기초 데이터로서, 개별 학술지 논문에 표준화된 주제 범주(통제키워드)를 부여할 수 있는 효율적인 방안을 모색하였다. 이를 위해 한국연구재단 「학술연구분야분류표」 상의 분류 범주를 국내 학술지 논문에 자동 할당하는 과정에서, 자질선정 기법을 중심으로 자동분류의 성능에 영향을 미치는 주요 요소들에 대한 다각적인 실험을 수행하였다. 그 결과, 실제 환경의 불균형 데이터세트(imbalanced dataset)인 국내 학술지 논문의 자동분류에서는 보다 단순한 분류기와 자질선정 기법, 그리고 비교적 소규모의 학습집합을 사용하여 상당히 좋은 수준의 성능을 기대할 수 있는 것으로 나타났다.

Abstract

As basic data that can systematically support and evaluate R&D activities as well as set current and future research directions by grasping specific trends in domestic academic research, I sought efficient ways to assign standardized subject categories (control keywords) to individual journal papers. To this end, I conducted various experiments on major factors affecting the performance of automatic classification, focusing on feature selection techniques, for the purpose of automatically allocating the classification categories on the National Research Foundation of Korea’s Academic Research Classification Scheme to domestic journal papers. As a result, the automatic classification of domestic journal papers, which are imbalanced datasets of the real environment, showed that a fairly good level of performance can be expected using more simple classifiers, feature selection techniques, and relatively small training sets.

13
노동조(상명대학교) ; 남민석(성균관대학교) 2013, Vol.30, No.3, pp.229-247 https://doi.org/10.3743/KOSIM.2013.30.3.229
초록보기
초록

본 연구는 대학도서관에서 주제전문사서제에 의한 도서선정의 효과를 입증하기 위하여 주제전문사서제도가 도입되기 이전과 이후에 선정된 개별 도서에 대한 대출 현황을 조사하여 그 효과성의 차이를 분석하였다. 이를 위하여 조사대상이 된 S대학교 도서관에서 주제전문사서제도를 도입한 2005년 9월을 기점으로 이전과 이후 3년씩 총 6년 동안에 선정된 도서 186,435권에 대한 총 대출 현황(622,213권)을 t-test와 ANOVA를 통하여 검정하였다. 연구 결과, 첫째, 주제전문사서제의 도입 이후에는 사서에 의한 도서선정의 비율이 높아졌다. 둘째, 주제전문사서제의 도입 이전과 비교하여 도입 이후에는 교수와 사서에 의해 선정된 국외서에 대한 대출이 유의미하게 증가하였다. 셋째, 주제전문사서제의 도입 이전과 비교하여 도입 이후에는 교수가 선정한 도서에 대한 대출 횟수가 유의미하게 증가한 학문분야가 많아진 반면, 학생이 선정한 도서는 대출 횟수가 유의미하게 감소한 분야가 많았다.

Abstract

This study analyzed the difference between the two situations to verify the effectiveness of the book selection by the subject professionals in a academic library. In this, some circulation statistics before and after introduction to subject specialists were compared. Moreover, by using Minitab and t-test, ANOVA among other statistical techniques, 186,435 books selected 3 years before September 2005 and after 3 years and 622,213 circulation statistics about those books in ‘S’ University Library were compared and analysed. The results were as follows: (1) After introduction to the subject librarian, the proportion of books selected by librarians were increased. (2) After introduction to subject reference librarian, the foreign books selected by the faculty and the librarians were statistically significantly increased. (3) By academic field, the academic fields of the books selected by the faculty were significantly increased, but the academic fields of the books selected by the students were significantly decreased.

14
박혜선(경기도 고양시 한산초등학교) ; 김기영(연세대학교) 2016, Vol.33, No.3, pp.239-262 https://doi.org/10.3743/KOSIM.2016.33.3.239
초록보기
초록

본 연구는 초등학교도서관의 자료 선정 과정 중 나타나는 사서(교사)의 자기 검열에 영향을 미치는 요인을 확인하여 자기 검열 행위를 줄일 수 있는 구조적 방안을 모색하는 데에 그 목적이 있다. 연구를 위하여 국내외 문헌 연구를 통해 자기 검열의 개념을 살펴보고 심층 면담을 통해 설문지를 개발하여 설문조사를 시행 후 통계적 분석을 실시하였다. 그 결과, 장서 개발 정책과 학교도서관운영위원회, 도서관 장서 관련 민원 요소에서 집단 간 유의한 자기 검열 차이를 발견하였고, 이용자 및 도서관 장서에 대한 사서(교사)의 인식에서 자기 검열 영향 요인을 확인하였다. 이를 바탕으로 학교도서관운영위원회의 심의 기능 강화, 이용자 항의 대응 지침이 포함된 장서 개발 정책 마련, 학교도서관 소장 자료의 폐기 절차 간소화 등을 제안하였다.

Abstract

This study aims to explore ways to improve self-censorship tendency in teacher librarians by identifying factors that influence the self-censorship which appears during collection development in elementary school libraries. For this purpose, first, we examined the concept of self-censorship through a review of related literature, then carried out a series of in-depth interviews as a pilot study to develop a questionnaire, which was used for a questionnaire survey. Finally, the survey data was analyzed statistically with SPSS 21.0, a statistical package. As a result, we have discovered statistically significant relationships between self-censorship and the characteristics in collection development policies, school library committees, and the complaints related with the library collections. Based on these results, the factors on the self-censorship were identified in the perception of the school librarians. Based on these results, we suggest to reinforce the function of review and approval of book selection in the school library committee, developed and approved a collection development policy include guidelines for dealing with users’ complaints related to library collection, and stipulated a regulation for school library operation to remove inappropriate books from the library collection.

15
홍현진(전남대학교) ; 노영희(건국대학교) ; 정혜경(KDI국제정책대학원대학교) ; 이미영(성북정보문화센터) 2005, Vol.22, No.1, pp.87-104 https://doi.org/10.3743/KOSIM.2005.22.1.087
초록보기
초록

본 연구에서는 해외 비영리기관의 학술 데이터베이스를 도입하기 위해 학술 데이터베이스 현황을 조사하고 그 품질을 평가한 뒤, 실제적인 도입가능성과 방법을 제시한다. 특히 지금까지 국내에서 공동 활용이 불가능한 비영어권 국가의 해외 비영리기관 소장 학술 데이터베이스를 제공함으로써 기존의 학술 데이터베이스와는 다른 차원의 다양한 유형의 자료 발굴 및 자료 범위 확대를 목적으로 한다. 이러한 목적하에 진행된 본 연구는 지금까지 영리기관의 상용 데이터베이스에 거의 의존해왔던 해외 정보 자료수집과정을 저비용-고효율 구조로 개선시켜, 학술 연구의 생산성을 제고시킬 수 있을 것이다.

Abstract

The purpose of this study was to delve into the academic databases of overseas nonprofit organizations, to assess their quality and to discuss whether or not it's possible to introduce them in the nation and in which way that could be done. And it's also attempted to provide information on the academic databases of nonprofit organizations in nonEnglish-speaking countries in a bid to prepare a wide variety of academic materials about broader fields that would be distinguished from those offered by existing academic databases, since it's not currently possible to take advantage of academic materials possessed by such nations. The efforts by this study was expected to gather international information at a lower cost and in a more efficient way and eventually to contribute to improving the productivity of academic research.

16
이원영(국회기록보존소) ; 임효정(이화여자대학교) 2006, Vol.23, No.3, pp.187-204 https://doi.org/10.3743/KOSIM.2006.23.3.187
초록보기
초록

기록관리의 가장 궁극적인 목표는 기관의 기능과 활동을 역사로 남기는 것이다. 기관의 활동을 반영하는 많은 기록물들 가운데 어떤 기록물들이 장기적으로 보존할 가치가 있는가를 객관적으로 평가하여 가치 있는 기록물들만을 선별해 내는 것은 기록관리의 핵심이면서도 대단히 어려운 작업이다. 현대기록은 그 양적인 폭증 및 복잡성의 증대, 전자화 현상을 특징으로 하며, 이는 정보화 환경과 맞물려, 기록물의 전 생애주기에 걸친 관리, 통제라는 연속체적 개념의 성립을 가져 왔다. 본 연구는 장기보존할 가치가 있는 기록물을 기록물관리 초기 단계에서부터 선별하기 위한 객관적인 가이드 라인으로서 기관의 기능과 조직이라는 거시적인 요소와 개별 기록물의 내용평가(증거적가치)라는 미시적인 요소가 결합된 업무분석적 평가방안을 제안하였다.

Abstract

The main purpose of the archives is to maintain a history of the organization's functions and activities. Selecting valuable records for the permanent archives through objective appraisal from among many records that reflects the activities of organization is very important but also very difficult. The quantity and complexity of comtemporary records has rapidly expanded because of electronic storage, and with the information environment, and it is now possible to manage and control the records an entire lifetime. In this study, it is proposed the appraisal methods based on a business analysis that is combined the macro-appraisal factor and micro-appraisal factor; The former is functions and organizations as the objective guideline of selecting valuable records from the beginningand the latter is a contents appraisal (evidential value) of the individual records.

초록보기
초록

IT 아웃소싱은 전략적 차원에서 추진되는 조직의 중요 사안이나 이를 추진함에 있어 명확한 목표와 분명한 계약이 없이 단순한 생각으로 접근했을 경우는 그 결과에 대해 주관적인 실패로 인식하기 쉽다. 특히 아웃소싱 관리에서는 공급자와 고객 간의 계약 특히 심리적 계약에 근거한 관계 관리가 매우 중요하다고 인식되며, 본 연구는 아웃소싱 관계 수준과 아웃소싱 성과에 영향을 미치는 아웃소싱 공급자와 수혜자인 고객의 책무 사항에 초점을 두고 이루어졌다. IT 아웃소싱에 대한 공급자의 책임영역은 아웃소싱 수행 기반적 요소 및 수행 능력과 관련된 요소로 대별할 수 있으며, 고객의 책임영역은 아웃소싱 수용 환경적 요소 및 수용 능력과 관련된 요소로 대별할 수 있다. 본 연구의 결과로는 수행기반, 수행능력, 수용능력이 아웃소싱 관계수준에 영향을 미치고, 아웃소싱 관계수준은 아웃소싱 성과에 영향을 미치는 것으로 나타났다. 그리고 공급자의 수행능력은 아웃소싱 성과에 직접적인 영향을 미치기도 한다. 그리고 공급자와 고객의 4가지 책임영역은 상호간에도 유의적 관계가 있다.

Abstract

IT outsourcing has become a critical component of organizations, but improper expectations, ambiguous contracts and unclear goals frequently cause the failure of IT outsourcing. Especially we have to be concerned about the uncareful management of customer-supplier relationships based on a psychological contract perspective. This study focuses on the obligations of contractual parties for IT outsourcing which influence the outsourcing relationship(OR) and the successful performance of IT outsourcing(OP). The supplier obligations consist of the achievable infrastructure(S1) and capability(S2), and the customer obligations is composed of the acceptable environment(C1) and acceptability(C2) for IT outsourcing. This paper shows that the S1, S2, and C2 have an effect on the OR, the OR on the OP, and the S2 also on the OP directly. The four components of customer-supplier obligations are mutually related to each other. What is more, we must notice that the S2 has strong connections with the C2.

18
이신원(중원대학교) ; 안동언(전북대학교) ; 정성종(전북대학교) 2004, Vol.21, No.4, pp.173-185 https://doi.org/10.3743/KOSIM.2004.21.4.173
초록보기
초록

정보통신의 기술이 발달하면서 정보의 양이 많아지고 사용자의 질의에 대한 검색 결과 리스트도 많이 추출되므로 빠르고 고품질의 문서 클러스터링 알고리즘이 중요한 역할을 하고 있다. 많은 논문들이 계층적 클러스터링 방법을 이용하여 좋은 성능을 보이지만 시간이 많이 소요된다. 반면 K-means 알고리즘은 시간 복잡도를 줄일 수 있는 방법이다. 본 논문에서는 계층적 클러스터링 시스템인 콘도르(Condor) 시스템에서 간단하고 고품질이며 효율적으로 정보 검색 할 수 있도록 구현하였다. 이 시스템은 K-Means Algorithm을 이용하였으며 클러스터 계층 깊이와 초기값을 조절하여 88%의 정확율을 보였다.

Abstract

Fast and high-quality document clustering algorithms play an important role in providing data exploration by organizing large amounts of information into a small number of meaningful clusters. Many papers have shown that the hierarchical clustering method takes good-performance, but is limited because of its quadratic time complexity. In contrast, with a large number of variables, K-means has a time complexity that is linear in the number of documents, but is thought to produce inferior clusters. In this paper, Condor system using K-Means algorithm Compares with regular method that the initial centroids have been established in advance, our method performance has been improved a lot.

19
남영준(중앙대학교 문헌정보학과 교수) 2021, Vol.38, No.3, pp.311-334 https://doi.org/10.3743/KOSIM.2021.38.3.311
초록보기
초록

이 연구의 목적은 합리적인 장서관리정책 수립을 위한 이론적 근거와 계량화된 객관적 기준점 제시이다. 본 연구의 연구결과를 요약하면 다음과 같다. 스테디셀러는 정기간행물 형태의 학습서가 대부분이었다. 또한, 현대소설로서 스테디셀러는 특정 작가에 의존하는 현상을 확인할 수 있었다. 베스트셀러는 출판사와 저자의 영향을 받는 것으로 조사되었다. 특히 만화와 아동용 교재를 출판하는 출판사의 도서는 베스트셀러 선정에 상당부분 상관성을 갖고 있었다. 추천된 도서 한 권당 추천 도서의 대출 수 평균은 14,871권이었으며, 베스트셀러로 선정된 도서 한 권당 평균 대출 수는 53,531권이었다. 한편 대출데이터를 기준으로 약 80~82%의 도서가 전체 상위권 대출의 90%를 감당하고 있고, 약 27~29%의 도서가 전체 상위권 대출의 50%를 감당하고 있었다. 이는 일련의 파레토법칙이 공공도서관 대출패턴에서도 굳건히 적용될 수 있음을 보여주고 있다. 문학의 대출은 전체 대출에서 50.6%를 차지하였으며, 문학 중에서 한국문학작품이 전체 51.3%를 차지하였다. 자연과학은 다른 주제분야에 비해 상대적으로 작은 수의 문헌으로 더 많은 대출을 발생시키고 있었다.

Abstract

The purpose of this study is to present the theoretical basis and quantified objective standards for the establishment of collection management policy. The study results are summarized as follows. Most of the study books were in the form of periodicals as a steady seller. Most of the steady sellers were textbooks which published periodically. As a modern novel, a steady seller was able to confirm the phenomenon of dependence on a specific author. Bestsellers were investigated to be influenced by publishers and authors. Books of publishers that publish comics and children’s textbooks had a significant correlation with the selection of bestsellers. The average number of recommended books borrowed per recommended book was 14,871. The average number of loans per book selected as a bestseller was 53,531. Based on the loan data, about 80-82% of all top-tier loans were covered by 90%, and about 27-29% of all top-ranked loans were covered by 50%. This shows that the Pareto Principle can be firmly applied to public library lending patterns. Loans in the field of literature accounted for 50.6% of the total loans. Among literature, Korean literature accounted for 51.3% of the total. The natural sciences were generating more loans with a relatively small pool of literature compared to other subject fields.

초록보기
초록

로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부여 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

Abstract

This study examines various weighting methods for improving the performance of automatic classification based on Rocchio algorithm on two collections(LISA, Reuters-21578). First, three factors for weighting are identified as document factor, document factor, category factor for each weighting schemes, the performance of each was investigated. Second, the performance of combined weighting methods between the single schemes were examined. As a result, for the single schemes based on each factor, category-factor-based schemes showed the best performance, document set-factor-based schemes the second, and document-factor-based schemes the worst. For the combined weighting schemes, the schemes(idf*cat) which combine document set factor with category factor show better performance than the combined schemes(tf*cat or ltf*cat) which combine document factor with category factor as well as the common schemes(tfidf or ltfidf) that combining document factor with document set factor. However, according to the results of comparing the single weighting schemes with combined weighting schemes in the view of the collections, while category-factor-based schemes(cat only) perform best on LISA, the combined schemes(idf*cat) which combine document set factor with category factor showed best performance on the Reuters-21578. Therefore for the practical application of the weighting methods, it needs careful consideration of the categories in a collection for automatic classification.

정보관리학회지