바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: library optimization, 검색결과: 6
1
노영희(건국대학교) ; 김태경(국립중앙도서관 도서관연구소) 2015, Vol.32, No.2, pp.25-61 https://doi.org/10.3743/KOSIM.2015.32.2.025
초록보기
초록

본 연구에서는 도서관 개인정보 가이드라인(안)을 제안하되, 관종을 구분하지 않고 어느 도서관에서나 적용가능하도록 하였다. 개개 도서관은 이 가이드라인(안)을 기초로 하여 자관의 실정에 맞게 수정․보완하여 사용할 수 있도록 하였다. 목적, 용어정의, 개인정보의 범위, 관련법 및 정책, 일반적인 내용, 도서관의 업무수행상 개인정보처리, 도서관의 외주업체 등으로 구분하여 도서관 개인정보보호 가이드라인을 개발하였으며, 개정된 「개인정보 보호법」 시행에 따른 도서관의 대처방향 마련, 개인정보처리지침의 도서관 최적화, 관련법령에의 반영, 도서관 개인정보 가이드라인 표준화 지향 등을 고려하였다.

Abstract

This study was designed to propose library privacy guidelines to be applicable in any library without distinguishing library types. Individual libraries can refine, modify, and use them to fit their situation, using the guidelines as a base. The library privacy protection guidelines developed in this study are composed of purposes, definitions, scope of privacy, law and policy, general information, the library’s job performance on the handling of personal information, and library subcontractors. The development objectives and utilization direction of the library privacy guidelines developed in this study are meant to provide a guide for change according to the amended provision of library “Privacy Act” implementation, optimization of library Privacy Directive, a reflection of the relevant laws and regulations, and the standardization-oriented library privacy guidelines.

2
노영희(건국대학교 문헌정보학과 교수) ; 장로사(중앙대학교 문헌정보학과 강사) 2019, Vol.36, No.4, pp.53-81 https://doi.org/10.3743/KOSIM.2019.36.4.053
초록보기
초록

IFLA의 UN 2030 Agenda, 도서관정보정책위원회의 제3차 도서관발전종합계획(2019-2023)에서 사회적 포용을 실천하는 도서관의 역할을 강조함에 따라 최근 국내외를 막론하고 정보불평등을 해소하기 위한 공공서비스기관으로서 도서관이 새롭게 조명되고 있다. 이에 본 연구에서는 도서관에 적합한 정보불평등 측정지표를 개발하였으며, 이를 위해 전문가 집단의 검증단계로서 FGI 및 델파이기법을 실시하였다. 그 결과, 최종지표는 총 3개의 평가영역, 총 12개의 평가항목, 총 30개의 평가지표로 도출되었다. 구체적으로 첫째, 접근 평가영역에서는 3개의 평가항목, 8개의 평가지표가 도출되었으며, 둘째, 역량 평가영역에서는 5개의 평가항목, 12개의 평가지표가 도출되었고, 셋째, 활용 평가영역에서는 4개의 평가항목, 10개의 평가지표가 도출되었다. 본 연구는 현재 범지구적으로 도서관에 적용 가능한 정보불평등 측정지표가 전무한 상황에서 개발되었다는 점에서 무엇보다 그 의미와 가치가 클 것으로 사료된다.

Abstract

The 3rd Library Comprehensive Development Plan (2019-2023) of the Committee on Library and Information Policy under IFLA-UN 2030 Agenda emphasize the role of libraries in practicing social inclusion. At home and abroad, this is shedding new light on libraries as the public service institutions aimed at resolving information inequality. This study thus developed the information inequality measurement indicator optimized for libraries. For this purpose, FGI and Delphi technique were implemented as the verification stage of the expert group. As a result, the final indicators were derived in three evaluation areas, twelve evaluation items, and 30 evaluation indicators. Specifically, first, 3 evaluation items and 8 evaluation indicators were derived in the access evaluation area; second, 5 evaluation items and 12 evaluation indicators were derived in the competency evaluation area; and third, 4 evaluation items and 10 evaluation indicators were derived in the utilization evaluation area. This study is considered to be of great significance in that the information inequality measurement indicators optimized for libraries were developed, the first of its kind.

3
윤희윤(대구대학교 문헌정보학과) ; 김종애(경기대학교 문헌정보학과) ; 오선경(경상대학교) 2020, Vol.37, No.3, pp.51-75 https://doi.org/10.3743/KOSIM.2020.37.3.051
초록보기
초록

모든 공공도서관은 장서 기반의 지식문화서비스 기관이다. 이를 위해 가장 먼저 수립해야 할 필수적 정책인 동시에 전략적 메뉴가 장서개발정책이다. 특히 시도 단위의 종합지식정보센터 및 공동보존서고로서의 법정 업무를 수행해야 할 지역대표도서관은 최적 장서개발정책을 수립․적용해야 한다. 본 연구는 주요 선진국의 대도시 공공도서관 장서개발정책과 국내의 권역별 지역대표도서관 장서개발지침(안) 및 규정을 분석하였다. 그 결과, 대다수 선진국의 정책은 구성체계 및 내용적 측면에서 충실한 반면에 국내는 공식화된 정책문서가 없는 실무지침에 불과하였다. 따라서 모든 지역대표도서관은 장서개발의 중요성 인식, 미래지향적 사고, 전략적 판단 등을 전제로 장서개발정책을 수립․문서화해야 하며, 이를 위한 기본원칙과 구성체계를 제언하였다.

Abstract

All public libraries are collection-based knowledge and cultural service institutions. To this end, a collection development policy is an essential and a strategic menu that every library should establish first. Regional central libraries should establish and apply optimal collection development policies to conduct the legal duties as knowledge and information centers and cooperative preservation facilities of the cities and provinces. Thus, this study analyzed and compared in detail the collection development guidelines (draft) and regulations of regional central libraries in Korea and the collection development policies of metropolitan public libraries abroad. Results showed that the policies of domestic regional central libraries were simply practical guidelines while those in most developed countries were substantial in format and content. All regional central library systems should establish and document collection development policies based on the importance of collection development, future-oriented thinking, and strategic decision. The study also suggested the basic principles and the format for this purpose.

초록보기
초록

대표적인 앙상블 기법으로서 랜덤포레스트(RF)를 문헌정보학 분야의 학술지 논문에 대한 자동분류에 적용하였다. 특히, 국내 학술지 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 트리 수, 자질선정, 학습집합 크기 등 주요 요소들에 대한 다각적인 실험을 수행하였다. 이를 통해, 실제 환경의 불균형 데이터세트(imbalanced dataset)에 대하여 랜덤포레스트(RF)의 성능을 최적화할 수 있는 방안을 모색하였다. 결과적으로 국내 학술지 논문의 자동분류에서 랜덤포레스트(RF)는 트리 수 구간 100〜1000(C)과 카이제곱통계량(CHI)으로 선정한 소규모의 자질집합(10%), 대부분의 학습집합(9〜10년)을 사용하는 경우에 가장 좋은 분류 성능을 기대할 수 있는 것으로 나타났다.

Abstract

Random Forest (RF), a representative ensemble technique, was applied to automatic classification of journal articles in the field of library and information science. Especially, I performed various experiments on the main factors such as tree number, feature selection, and learning set size in terms of classification performance that automatically assigns class labels to domestic journals. Through this, I explored ways to optimize the performance of random forests (RF) for imbalanced datasets in real environments. Consequently, for the automatic classification of domestic journal articles, Random Forest (RF) can be expected to have the best classification performance when using tree number interval 100〜1000(C), small feature set (10%) based on chi-square statistic (CHI), and most learning sets (9-10 years).

초록보기
초록

인터넷의 보급 및 이용 활성화에 따라 인터넷을 통한 정보의 검색 및 획득이 정보검색의 일차적인 행태가 되고 있다. 인터넷을 통한 정보검색의 보편화는 인터넷 정보검색 포털이 제공하는 검색서비스의 중요성을 증대시키고 있다. 포털에서 제공하는 정보검색 서비스의 효율화는 인터넷 정보검색 환경의 효율화로 직결될 수 있다. 이에 본 고에서는 인터넷 정보검색 포털에서 제공하고 있는 서비스 가운데 인터넷 정보자료를 선별하고 조직화하여 제공하고 있는 디렉토리 서비스의 분류체계에 대해 고찰하였다. 구체적인 연구주제로 전통적인 문헌분류법에서 여러 주제분야에 공통적으로 적용될 수 있는 형식, 접근법을 모아 구성한 표준구분(standard subdivision) 항목들을 디렉토리 분류체계에서 어떻게 전개하고 있는 지 현황을 분석해 보았다. 이러한 분석을 기반으로 전통적인 문헌분류법의 표준구분에 포함된 항목들을 디렉토리 서비스에서 전개하는 방안을 제시하였다.

Abstract

With the rapid distribution and active usage of the Internet, information search and retrieval through Internet has become a primary form of information access. This ubiquity of information access through Internet means the increased significance of search performance offered by Internet portals, since the optimization of search performance by portal has strong implication for the effective access of information through Internet in general. In this context, this paper investigates the classification scheme used in the directory service of internet portals, which provides selected and organized access to Internet information. First, the author analyzes the deployment of directory classification of standard subdivision topics used in traditional library classification system, with emphasis on the table composed of the form and approach, which are applicable to diverse subject areas. Then, based on this analysis, he proposed a method of applying certain subdivisions of the standard subdivision to directory service of Internet portals.

초록보기
초록

이 연구는 짧은 텍스트인 서명에 단어 임베딩이 미치는 영향을 분석하기 위해 Word2vec, GloVe, fastText 모형을 이용하여 단행본 서명을 임베딩 벡터로 생성하고, 이를 분류자질로 활용하여 자동분류에 적용하였다. 분류기는 k-최근접 이웃(kNN) 알고리즘을 사용하였고 자동분류의 범주는 도서관에서 도서에 부여한 DDC 300대 강목을 기준으로 하였다. 서명에 대한 단어 임베딩을 적용한 자동분류 실험 결과, Word2vec와 fastText의 Skip-gram 모형이 TF-IDF 자질보다 kNN 분류기의 자동분류 성능에서 더 우수한 결과를 보였다. 세 모형의 다양한 하이퍼파라미터 최적화 실험에서는 fastText의 Skip-gram 모형이 전반적으로 우수한 성능을 나타냈다. 특히, 이 모형의 하이퍼파라미터로는 계층적 소프트맥스와 더 큰 임베딩 차원을 사용할수록 성능이 향상되었다. 성능 측면에서 fastText는 n-gram 방식을 사용하여 하부문자열 또는 하위단어에 대한 임베딩을 생성할 수 있어 재현율을 높이는 것으로 나타났다. 반면에 Word2vec의 Skip-gram 모형은 주로 낮은 차원(크기 300)과 작은 네거티브 샘플링 크기(3이나 5)에서 우수한 성능을 보였다.

Abstract

To analyze the impact of word embedding on book titles, this study utilized word embedding models (Word2vec, GloVe, fastText) to generate embedding vectors from book titles. These vectors were then used as classification features for automatic classification. The classifier utilized the k-nearest neighbors (kNN) algorithm, with the categories for automatic classification based on the DDC (Dewey Decimal Classification) main class 300 assigned by libraries to books. In the automatic classification experiment applying word embeddings to book titles, the Skip-gram architectures of Word2vec and fastText showed better results in the automatic classification performance of the kNN classifier compared to the TF-IDF features. In the optimization of various hyperparameters across the three models, the Skip-gram architecture of the fastText model demonstrated overall good performance. Specifically, better performance was observed when using hierarchical softmax and larger embedding dimensions as hyperparameters in this model. From a performance perspective, fastText can generate embeddings for substrings or subwords using the n-gram method, which has been shown to increase recall. The Skip-gram architecture of the Word2vec model generally showed good performance at low dimensions(size 300) and with small sizes of negative sampling (3 or 5).

정보관리학회지