바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Selecting, 검색결과: 9
1
김판준(신라대학교 문헌정보학과) 2023, Vol.40, No.1, pp.1-21 https://doi.org/10.3743/KOSIM.2023.40.1.001
초록보기
초록

본 연구는 텍스트 분류를 위한 효율적인 자질선정 방법으로 자질 순위화 기법의 성능을 구체적으로 검토하였다. 지금까지 자질 순위화 기법은 주로 문헌빈도에 기초한 경우가 대부분이며, 상대적으로 용어빈도를 사용한 경우는 많지 않았다. 따라서 텍스트 분류를 위한 자질선정 방법으로 용어빈도와 문헌빈도를 개별적으로 적용한 단일 순위화 기법들의 성능을 살펴본 다음, 양자를 함께 사용하는 조합 순위화 기법의 성능을 검토하였다. 구체적으로 두 개의 실험 문헌집단(Reuters-21578, 20NG)과 5개 분류기(SVM, NB, ROC, TRA, RNN)를 사용하는 환경에서 분류 실험을 진행하였고, 결과의 신뢰성 확보를 위해 5-fold cross validation과 t-test를 적용하였다. 결과적으로, 단일 순위화 기법으로는 문헌빈도 기반의 단일 순위화 기법(chi)이 전반적으로 좋은 성능을 보였다. 또한, 최고 성능의 단일 순위화 기법과 조합 순위화 기법 간에는 유의한 성능 차이가 없는 것으로 나타났다. 따라서 충분한 학습문헌을 확보할 수 있는 환경에서는 텍스트 분류의 자질선정 방법으로 문헌빈도 기반의 단일 순위화 기법(chi)을 사용하는 것이 보다 효율적이라 할 수 있다.

Abstract

This study specifically reviewed the performance of the ranking schemes as an efficient feature selection method for text classification. Until now, feature ranking schemes are mostly based on document frequency, and relatively few cases have used the term frequency. Therefore, the performance of single ranking metrics using term frequency and document frequency individually was examined as a feature selection method for text classification, and then the performance of combination ranking schemes using both was reviewed. Specifically, a classification experiment was conducted in an environment using two data sets (Reuters-21578, 20NG) and five classifiers (SVM, NB, ROC, TRA, RNN), and to secure the reliability of the results, 5-Fold cross-validation and t-test were applied. As a result, as a single ranking scheme, the document frequency-based single ranking metric (chi) showed good performance overall. In addition, it was found that there was no significant difference between the highest-performance single ranking and the combination ranking schemes. Therefore, in an environment where sufficient learning documents can be secured in text classification, it is more efficient to use a single ranking metric (chi) based on document frequency as a feature selection method.

2
김아현(중앙대학교 일반대학원 문헌정보학과 석사과정) ; 이승민(중앙대학교 사회과학대학 문헌정보학과 교수) 2023, Vol.40, No.3, pp.55-76 https://doi.org/10.3743/KOSIM.2023.40.3.055
초록보기
초록

본 연구는 대학도서관의 주제가이드 개발 및 개선을 위한 고려사항을 도출하기 위해 대학도서관의 주 이용자인 대학생을 중심으로 학술정보 탐색행태를 분석하였다. 분석 결과, 대학생들은 자신의 주관적 정보탐색능력 수준을 높게 평가하고 있었으나, 구체적인 검색어의 설정을 어려워하는 것으로 나타났다. 학술정보 이용 목적은 구체적이며, 하나의 데이터베이스에서 모든 정보탐색행위를 수행하고자 하는 경향을 보이고 있다. 또한 정보자원 선택 시 신뢰성, 적합성, 최신성을 주로 고려하고 있으며, 대학도서관 및 주제가이드에 대한 인식은 전반적으로 낮게 나타났으나 이에 대한 신뢰성은 높은 것으로 분석되었다. 이를 기반으로 향후 대학도서관에서 주제가이드를 개발하거나 개선할 때는 구체적인 정보탐색 목적에 따른 정보원 분류, 정보자원의 유형별 구성, 정보자원 선택 기준 관련 설명 요소 기술, 종합 데이터베이스에 대한 안내, 주제 키워드 추천, 도서관 마케팅 및 내부 기관과의 긴밀한 협업 관계를 고려하는 것이 필요하다.

Abstract

This study analyzed academic information seeking behavior, focusing on university students, the main users of the university library, to derive considerations for the development and improvement of the subject guide of the university library. As a result of the analysis, university students highly evaluated their subjective information seeking ability, but it was found that it was difficult to set specific search terms. The purpose of using academic information is specific, and it has been shown that there is a tendency to perform all information search activities in one database. In addition, when selecting information resources, reliability, suitability, and recency are primarily taken into consideration. Awareness of university libraries and subject guides was generally low, but their reliability was found to be high. Based on this, it is necessary to consider the classification of information sources according to specific information seeking purposes, the composition of information resources, explanatory element technology related to information resource selection criteria, comprehensive database, topic keyword recommendation, library marketing, and close cooperation with internal institutions.

3
김영범(전남대학교 대학원 기록관리학 석사) ; 장우권(전남대학교 문헌정보학과 교수) 2023, Vol.40, No.3, pp.99-118 https://doi.org/10.3743/KOSIM.2023.40.3.099
초록보기
초록

이 연구의 목적은 기록물의 맥락정보를 담고 있는 메타데이터를 활용하여 기록물 자동분류 과정에서의 성능요소를 파악하는데 있다. 연구를 위해 2022년 중앙행정기관 원문정보 약 97,064건을 수집하였다.수집한 데이터를 대상으로 다양한 분류 알고리즘과 데이터선정방법, 문헌표현기법을 적용하고 그 결과를 비교하여 기록물 자동 분류를 위한 최적의 성능요소를 파악하고자 하였다. 연구 결과 분류 알고리즘으로는 Random Forest가, 문헌표현기법으로는 TF 기법이 가장 높은 성능을 보였으며, 단위과제의 최소데이터 수량은 성능에 미치는 영향이 미미하였고 자질은 성능변화에 명확한 영향을 미친다는 것이 확인되었다.

Abstract

The objective of this study is to identify performance factors in the automatic classification of records by utilizing metadata that contains the contextual information of records. For this study, we collected 97,064 records of original textual information from Korean central administrative agencies in 2022. Various classification algorithms, data selection methods, and feature extraction techniques are applied and compared with the intent to discern the optimal performance-inducing technique. The study results demonstrated that among classification algorithms, Random Forest displayed higher performance, and among feature extraction techniques, the TF method proved to be the most effective. The minimum data quantity of unit tasks had a minimal influence on performance, and the addition of features positively affected performance, while their removal had a discernible negative impact.

4
심지영(연세대학교 대학도서관발전연구소) 2023, Vol.40, No.4, pp.279-306 https://doi.org/10.3743/KOSIM.2023.40.4.279
초록보기
초록

본 연구는 다양한 관점의 이용요구가 혼재되어있는 독서자료의 속성을 파악하기 위해, 도서의 동시이용(동시대출, 동시구매) 데이터에 기반하여 독서자료의 선택 및 이용과 관계된 서지적 속성을 분석하였다. KDC 주제, 독자대상, 이용자 연령 관련 26개 하위 속성 단위로 구분하여 서지적 속성 용어의 동시출현행렬을 생성하고 네트워크 분석을 수행한 결과, 독서자료의 서지적 속성의 세부 내용 및 두드러진 매개 역할을 파악하였다. 본 연구의 결과는 향후 도서관 OPAC을 비롯한 독서정보 시스템의 패싯 설계에 도움이 될 것이다.

Abstract

This study analyzed bibliographic attributes related to the selection and use of reading materials based on data on books borrowed or purchased together in order to understand the properties of reading materials that have complex user needs from various perspectives. As a result of creating co-occurrence matrices of bibliographic attribute terms by dividing them into 26 sub-attribute units related to KDC main class, target reader, and user age, and performing network analyses, the details and prominent mediating role of bibliographic attributes of reading materials were identified. The results of this study will be helpful in designing facets of reading information systems, including library OPAC, in the future.

5
감미아(연세대학교 문헌정보학과) ; 이지연(연세대학교 문헌정보학과) 2023, Vol.40, No.1, pp.121-148 https://doi.org/10.3743/KOSIM.2023.40.1.121
초록보기
초록

본 연구는 ‘우수한 성능의 메타데이터 속성 유사도 기반의 학술 문헌추천시스템’을 제안하는 데에 목적을 두고 있다. 본 연구에서는 정보조직에서 다루는 메타데이터의 활용과 계량정보학에서 다루고 있는 동시인용, 저자-서지결합법, 동시출현 빈도, 코사인 유사도의 개념을 활용한 문헌정보학 기반의 학술 문헌 추천기법을 제안하고자 하였다. 실험을 위해 수집한 ‘불평등’, ‘격차’ 관련 총 9,643개의 논문 메타데이터를 정제하여 코사인 유사도를 활용한 저자, 키워드, 제목 속성 간의 상대적 좌표 수치를 도출하였고, 성능 좋은 가중치 조건 및 차원의 수를 선정하기 위해 실험을 수행하였다. 실험 결과를 제시하여 이용자의 평가를 거쳤으며, 이를 이용해 기준노드와 추천조합 특성 분석 및 컨조인트 분석, 결과 비교 분석을 수행하여 연구질문 중심의 논의를 수행하였다. 그 결과 전반적으로는 저자 관련 속성을 제한 조합 혹은 제목 관련 속성만 사용하는 경우 성능이 뛰어난 것으로 나타났다. 본 연구에서 제시한 기법을 활용하고 광범위한 표본의 확보를 이룬다면, 향후 정보서비스의 문헌 추천 분야뿐 아니라 사회의 다양한 분야에 대한 추천기법 성능 향상에 도움을 줄 수 있을 것이다.

Abstract

The purpose of this study is to propose a scholarly paper recommendation system based on metadata attribute similarity with excellent performance. This study suggests a scholarly paper recommendation method that combines techniques from two sub-fields of Library and Information Science, namely metadata use in Information Organization and co-citation analysis, author bibliographic coupling, co-occurrence frequency, and cosine similarity in Bibliometrics. To conduct experiments, a total of 9,643 paper metadata related to “inequality” and “divide” were collected and refined to derive relative coordinate values between author, keyword, and title attributes using cosine similarity. The study then conducted experiments to select weight conditions and dimension numbers that resulted in a good performance. The results were presented and evaluated by users, and based on this, the study conducted discussions centered on the research questions through reference node and recommendation combination characteristic analysis, conjoint analysis, and results from comparative analysis. Overall, the study showed that the performance was excellent when author-related attributes were used alone or in combination with title-related attributes. If the technique proposed in this study is utilized and a wide range of samples are secured, it could help improve the performance of recommendation techniques not only in the field of literature recommendation in information services but also in various other fields in society.

초록보기
초록

이 연구는 우리나라 지자체가 운영하는 통합도서관들을 대상으로 통합검색 서비스의 기능적 특성을 분석하는 것을 목적으로 한다. 분석대상은 서울시의 25개 지자체에서 운영하는 통합도서관들이며, 분석항목은 통합검색과 관련된 12가지 영역의 서비스 기능들로 선택하였다. 연구의 결과는 다음과 같다. 첫째, 통합도서관은 자치구 내 공공도서관과 작은도서관의 연합체이며, 통합검색 서비스를 제공하고 있다. 제공되는 통합검색 서비스의 기능, 서지정보의 항목과 패싯의 유형이 다양하지 못하다. 둘째, 검색결과의 레코드는 타이틀 형식이 아니라, 대부분 아이템 형식이었다. 셋째, 도서정보를 보완하는 보강정보는 책에 대한 소개와 연관정보, 책과 관련된 키워드, 대출관련 정보 등으로 구성된다. 넷째, 통합검색이 디스커버리형 검색보다, 통합목록DB를 기반으로 하는 통합OPAC의 형태를 나타내고 있다. 자치구 내 공공도서관이나 작은도서관들에 분산되어 있는 소장목록DB들에 대한 통합검색을 제공하는데 집중하고 있다. 다섯째, 대부분의 통합도서관은 유사한 서비스 형태를 제공한다. 이 결과를 바탕으로 국내 공공도서관들이 디스커버리형 통합검색 서비스를 기대할 수 있는 개선방안을 제안하였다.

Abstract

The purpose of this study is to analyze the characteristics of the integrated search services for integrated libraries operated by local governments in Korea. The target of analysis was integrated libraries operated by 25 local governments in Seoul, and the analysis elements were selected from service functions in 12 areas related to integrated search. The results of the study are as follows. First, the integrated library is an association of public libraries and small libraries in autonomous districts and provides integrated search services. The provided integrated search service function, types of bibliographic information, and facets are not diverse. Second, the records in the search results were mostly item types, not title types. Third, enrichment information supplementing book information consists of book introductions, related information, book-related keywords, and loan-related information. Fourth, integrated search shows the form of integrated OPAC based on integrated catalog DB rather than discovery-type search. It concentrates on providing an integrated search for catalog DBs distributed in public libraries or small libraries in the autonomous district. Fifth, most integrated libraries provide similar service types. Based on these results, improvement plans were proposed for domestic public libraries to expect discovery-type integrated search services.

7
안병군(한국과학기술정보연구원) ; 변제연(성균관대학교 문헌정보학과) 2023, Vol.40, No.1, pp.225-258 https://doi.org/10.3743/KOSIM.2023.40.1.225
초록보기
초록

본 연구는 국내 연구자가 저술한 논문의 데이터 가용성 진술(DAS)에 명시된 데이터 공유 메커니즘과 리포지터리를 조사함으로써 국내 연구자의 연구데이터 공유 현황과 특징을 탐구하는 것을 목적으로 한다. 이를 위하여 2014년부터 2022년까지 PLOS ONE에 게재된 국내기관 소속 연구자의 논문을 연구의 대상으로 선정하였다. 우선 논문 내 DAS 존재 현황을 파악하고 선행연구를 활용하여 데이터 공유 메커니즘의 유형을 분석하였으며, 시간의 흐름에 따른 데이터 공유 메커니즘별 변화 추이 등을 조사하였다. 그 결과, 대상 논문의 99.6%에 DAS가 작성되어 있으며 데이터 공유 메커니즘의 유형별 언급 양상은 국제적인 양상과 유사하되, 시간의 흐름에 따라 선호되는 유형이 변화하고 있음을 파악하였다. 이후 데이터 공유 메커니즘 중 리포지터리에 주목하여 DAS에 언급된 리포지터리의 횟수와 비율을 파악하고 다수 언급된 5개 리포지터리의 이용 변화 추이를 시계열적으로 분석하였다. 또한 리포지터리와 함께 언급된 데이터 접근점의 제시 방식과 유형, 유효성 등도 함께 조사하였다. 이를 통해 빈번하게 언급되는 상위 5개 리포지터리가 전체 리포지터리 언급의 60%를 차지하며 데이터 코드를 다루는 리포지터리의 이용이 증가하는 현황이 확인되었고, 리포지터리와 함께 제시된 데이터의 접근점은 대부분 유효하다는 사실을 파악할 수 있었다.

Abstract

The purpose of this study is to investigate the current status and characteristics of research data sharing by domestic researchers by analyzing the data sharing mechanism and repository specified in DAS of papers authored by domestic researchers. To this end, in this study, papers of researchers belonging to domestic institutions published in PLOS ONE from 2014 to 2022 were selected as the subject of the study. First of all, the status of DAS’s existence in the papers was identified, the types of data-sharing mechanisms were analyzed using precedent studies, and the trend of changes in each data-sharing mechanism over time was investigated. As a result, it was found that DAS was written in 99.6% of the target papers, and the types of data-sharing mechanisms were similar to international patterns, but preferred types were changing over time. Afterward, focusing on repositories among data sharing mechanisms, the number and ratio of repositories mentioned in DAS were identified, and the trend of changes in use of the five repositories mentioned a lot was analyzed in a time series. In addition, the presentation method, type, and validity of the data access point mentioned along with the repository were also investigated. It was confirmed that the top five frequently mentioned repositories account for 60% of all repository mentions, and the use of a repository dealing with data codes is increasing; in addition, it was found that most of the data access points presented with the repository were valid.

8
정문지(연세대학교 교육대학원 사서교육전공) ; 이지연(연세대학교 문헌정보학과) 2023, Vol.40, No.4, pp.229-257 https://doi.org/10.3743/KOSIM.2023.40.4.229
초록보기
초록

본 연구는 독서공간으로서의 학교도서관에 주목하고 독서를 위한 학교도서관 이용 시 공간특성 요소에 대한 중학생 이용자의 인식을 파악하는데 목적이 있다. 선행연구와 예비 연구를 통해 공간특성 요소를 선정하고 각 공간특성 요소에 대해 학생들이 중요하게 생각하는 정도와 충족하는 정도를 살펴보고자 하였다. 그리고 이용자의 인식이 이용현황 및 학교도서관 독서활동 경험에 따라 차이가 있는지 살펴보았으며, 학교도서관 이용자 만족도와 지속이용의도에 영향을 미치는지 파악하였다. 더불어 공간특성 요소의 인식이 지속이용의도에 영향을 미치는데 있어 학교도서관 이용자 만족도가 매개 역할을 하는지 검증하고자 하였다. 이를 위해 중학교 4곳에 재학 중인 342명의 학생을 대상으로 설문조사를 진행하였다. 연구 결과, 공간특성 요소 중 소통성, 다양성, 안전성, 편의성에 대한 이용자의 인식이 이용현황에 따라 차이를 보였으며, 소통성, 쾌적성, 분위기가 이용자 만족도에, 심미성과 소통성이 지속이용의도에 긍정적인 영향을 주는 것으로 나타났다. 이 중 소통성, 쾌적성, 분위기는 학교도서관 이용자 만족도를 매개하여 지속이용의도에 영향을 미치는 것으로 확인되었다. 본 연구는 독서를 위한 공간으로서 학교도서관을 조사함으로써 학생들의 독서 지원을 위한 방안을 제시하였다는 점에서 의의를 찾을 수 있다.

Abstract

This study aims to understand students’ perceptions of the spatial characteristics of school libraries when they use them for reading. We selected a set of spatial characteristics by reviewing the literature and conducting a preliminary investigation. Then, we examined how students perceived the importance of and how satisfied they were with each characteristic. In addition, we investigated how students’ perceptions differ by the library uses and reading-related activities. We also studied whether the satisfaction of school library users affects their continued use of the libraries. We also verified whether school library user satisfaction is an intervening variable in continued-use intention, which is affected by spatial characteristics perception. We conducted a survey of 342 students from four middle schools. The analysis of the survey outcomes shows differences in library use due to spatial characteristics such as convenience, communicability, diversity, and safety. Factors such as communicability, comfortability, and ambience affected user satisfaction positively. Both aesthetics and communicability also positively influenced the continued-use intention. Furthermore, we identified that communicability, comfortability, and ambience eventually impacted the continued-use intention via user satisfaction, an intervening variable. The significance of this study is that it considered the direction of the school library to support students’ reading by regarding the school library as a space for reading.

9
배서영(이화여자대학교 일반대학원 문헌정보학과) ; 김지현(이화여자대학교 문헌정보학과 교수) 2023, Vol.40, No.3, pp.25-54 https://doi.org/10.3743/KOSIM.2023.40.3.025
초록보기
초록

오픈 데이터가 국제적인 흐름으로 주목받는 현시점에서 데이터 공유를 지원하는 한국의 국제 학술지 역할에 대한 논의가 이루어질 필요가 있다. 이에 본 연구에서는 국내 발간 국제 학술지의 편집인 설문 조사와 인터뷰를 바탕으로 데이터 공유 정책 도입에 영향을 미치는 요인을 확인하고 해당 학술지 편집인의 데이터 공유 정책 도입 및 구성요소에 대한 인식을 살펴보았다. 그 결과 정책을 도입하였거나 도입할 예정인 학술지에서는 데이터 공유가 국제적인 추세이며 연구발전에 기여할 수 있다는 점을 인식하였지만, 여전히 데이터 공유에 대한 인식 개선 노력이 필요함을 강조하였다. 이에 학술지 및 학술공동체 차원에서의 교육 활동이나 데이터 공유에 따른 보상을 통해 데이터 공유에 대한 인식을 개선할 필요가 있었다. 또한 중요도가 높으며, 필수 구성요소로 편집인의 절반 이상이 선택한 구성요소로 ‘데이터 가용성 표기’, ‘데이터 공유 수준’, ‘데이터 공유 방법’, ‘데이터 인용’이 있었다. 이들 학술지에서 데이터 공유를 반드시 의무화할 필요는 없지만 데이터 가용성 표기를 통해 데이터를 공유할 수 없는 상황에 대해 언급하는 것은 필요하다고 보았다. 국내 상황에 적합한 리포지터리 개발 및 실행을 책임질 기관의 역할 또한 강조되었다. 더불어 정책 도입에 영향을 주는 요인에 따라 정책 도입 비율의 차이를 확인한 결과, 영향력지수 사분위, 출판 유형, 주제 분야에서 유의한 차이가 나타났다. 영향력지수가 높은 학술지는 데이터 공유를 지원하는 자원을 보유할 가능성이 높고 오픈액세스 혹은 하이브리드 학술지는 오픈사이언스의 일환인 오픈 데이터에 관심을 가지는 경향이 있다고 볼 수 있었다. 의학 분야에서는 학술공동체 차원의 데이터 공유를 위한 적극적인 움직임이 데이터 공유 정책 도입을 촉진하였음을 알 수 있었다. 국내에서 학술지 데이터 공유 정책 도입 및 운영을 활성화하는 기초자료로서 본 연구가 활용될 수 있을 것이다.

Abstract

At a time when open data receives attention as an international trend, there is a need to discuss the role of international journals in Korea to support data sharing. Based on surveys and interviews of editors from the international journals, we identified factors affecting the policy adoption and examined the journal editors' perception on the adoption and components of the data sharing policy. As a result, scholarly journals that have adopted or are planning to adopt policies have recognized that data sharing is an international trend and can contribute to research development, but they stressed that efforts to improve the perception of data sharing were still necessary. Educational activities and compensation for sharing data were needed at scholarly journals’ and communities’ level. Also, components perceived important and selected by more than half of the editors as mandatory were ‘data availability statement’, ‘data sharing level’, ‘data sharing method’, and ‘data citation’. While scholarly journals do not always need to mandate data sharing, it was necessary to mention conditions where data cannot be shared through data availability statements. The role of the organization developing and operating a repository appropriate for situations in Korea was also emphasized. In addition, by identifying factors affecting the policy adoption, significant differences were found in Journal Impact Factor quartiles, publication type, and subject area. This finding indicated that journals with a high impact factor are likely to have resources to support data sharing, and open access or hybrid journals are likely to have interest in open data as a part of open science. In the medical research area, active movements for data sharing in academic communities have promoted the adoption of data sharing policies. This study would be used as basic data to facilitate the adopton and operation of scholarly journals’ data sharing policies in Korea.

정보관리학회지