바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Use Study, 검색결과: 30
11
김판준(신라대학교 문헌정보학과) 2023, Vol.40, No.1, pp.1-21 https://doi.org/10.3743/KOSIM.2023.40.1.001
초록보기
초록

본 연구는 텍스트 분류를 위한 효율적인 자질선정 방법으로 자질 순위화 기법의 성능을 구체적으로 검토하였다. 지금까지 자질 순위화 기법은 주로 문헌빈도에 기초한 경우가 대부분이며, 상대적으로 용어빈도를 사용한 경우는 많지 않았다. 따라서 텍스트 분류를 위한 자질선정 방법으로 용어빈도와 문헌빈도를 개별적으로 적용한 단일 순위화 기법들의 성능을 살펴본 다음, 양자를 함께 사용하는 조합 순위화 기법의 성능을 검토하였다. 구체적으로 두 개의 실험 문헌집단(Reuters-21578, 20NG)과 5개 분류기(SVM, NB, ROC, TRA, RNN)를 사용하는 환경에서 분류 실험을 진행하였고, 결과의 신뢰성 확보를 위해 5-fold cross validation과 t-test를 적용하였다. 결과적으로, 단일 순위화 기법으로는 문헌빈도 기반의 단일 순위화 기법(chi)이 전반적으로 좋은 성능을 보였다. 또한, 최고 성능의 단일 순위화 기법과 조합 순위화 기법 간에는 유의한 성능 차이가 없는 것으로 나타났다. 따라서 충분한 학습문헌을 확보할 수 있는 환경에서는 텍스트 분류의 자질선정 방법으로 문헌빈도 기반의 단일 순위화 기법(chi)을 사용하는 것이 보다 효율적이라 할 수 있다.

Abstract

This study specifically reviewed the performance of the ranking schemes as an efficient feature selection method for text classification. Until now, feature ranking schemes are mostly based on document frequency, and relatively few cases have used the term frequency. Therefore, the performance of single ranking metrics using term frequency and document frequency individually was examined as a feature selection method for text classification, and then the performance of combination ranking schemes using both was reviewed. Specifically, a classification experiment was conducted in an environment using two data sets (Reuters-21578, 20NG) and five classifiers (SVM, NB, ROC, TRA, RNN), and to secure the reliability of the results, 5-Fold cross-validation and t-test were applied. As a result, as a single ranking scheme, the document frequency-based single ranking metric (chi) showed good performance overall. In addition, it was found that there was no significant difference between the highest-performance single ranking and the combination ranking schemes. Therefore, in an environment where sufficient learning documents can be secured in text classification, it is more efficient to use a single ranking metric (chi) based on document frequency as a feature selection method.

12
신혜원((전)숙명여자대학교 문헌정보학과 석사과정) ; 신동희(숙명여자대학교 문헌정보학과 조교수) 2023, Vol.40, No.3, pp.245-271 https://doi.org/10.3743/KOSIM.2023.40.3.245
초록보기
초록

본 연구는 전자책 이용률이 높은 디지털 네이티브 세대인 20대를 대상으로 전자책 구독서비스에 대한 인식을 파악하고자 하였다. 설문조사와 사용성 평가(usability testing)를 병행한 혼합연구 방법을 통해 전자책 이용률이 높은 20대 대학생의 전자책 구독 서비스이용 실태 및 서비스에 대한 인식을 조사하였다. 설문조사를 통해 국내 대학생 202명의 의견을 수집하였고, 전자책 비이용자와 이용자를 구분하여 분석하였다. 설문 결과, 비이용자와 이용자 간의 전자책에 인식의 차이가 나타났으며, 휴대성 및 편의성은 두 연구 참여자 그룹에게 공통적으로 나타나는 전자책의 장점으로 조사되었다. 사용성 평가에서 사용된 ‘밀리의 서재’ 애플리케이션은 가장 대중적인 전자책 플랫폼으로 해당 서비스를 활용하여 전자책 이용 경험이 없는 20대 대학생 10명을 대상으로 평가가 진행되었다. 실험 결과, 연구 참여자들은 전자책의 편의성, 디자인, 다양한 부가 기능, 가성비 등에 대해 긍정적인 반응을 보인 반면, 흥미 부족, 기능 실용성, 터치 오류 및 오작동, 장서 부족, 시스템 문제에 대해서는 부정적인 의견을 나타냈다.

Abstract

The purpose of this study was to assess the perception of e-book subscription services among the digitally native generation in their twenties, who have a high e-book usage rate. This study employed a mixed-methods approach, combining survey responses and usability testing. It aimed to assess the awareness and usage of e-book subscription services among university students in their twenties, a demographic known for their high utilization of electronic devices and e-books. The survey was conducted among 202 university students, and the responses were categorized and examined based on whether they were users or non-users. As a result of the survey, I found there is different awareness of e-book between users and non-users, on the other hand, convenience and portability are the strong point of e-books for users and non-users commonly also. Usability testing was performed on a group of 10 university students in their twenties who had not previously used the ‘Millies Library’ application, which is renowned as the most widely-used e-book platform. Following the experiment, participants expressed positive feedback regarding various optional features, convenience, design, and cost-effectiveness. However, they also had negative reactions concerning touch errors, malfunctions, functional practicality, a lack of interest, system issues, and the absence of a library.

초록보기
초록

저작권은 디지털도서관 서비스의 범위와 방법을 결정하는 법률적인 기준이다. 보호기간 만료저작물은 저작권 보호가 종료되어 누구나 자유롭게 이용할 수 있다. 이런 까닭에 디지털도서관 구축과 서비스에서 우선 고려 대상이 된다. 이 연구는 실제로 도서관이 보호기간 만료저작물을 서비스에 얼마나 적극적으로 활용하고 있는가를 점검하기 위한 것이다. 이를 위해서 먼저 디지털도서관의 구축과 서비스에 적용되는 저작권법의 관련 조항들을 망라해서 정리하고, 아울러 저작권 보호기간이 가지는 의미를 이론적으로 살펴보았다. 그리고 나서 국립중앙도서관의 보호기간 만료저작물 온라인 서비스 현황을 김유정, 이효석, 채만식 세 명의 일제강점기 작가들의 저작물을 중심으로 살펴보면서, 보호기간 만료저작물의 구체적인 서비스 실태를 점검하였다. 국립중앙도서관은 법률의 허용하는 범위를 충분히 활용하지 못하고 있으며, 이러한 사정이 도서 내에 포함된 다른 저작자의 권리와 연결되어 있음을 밝혔다. 이러한 결과를 바탕으로 서비스 단위를 저작물을 중심으로 변경할 필요성과 전거레코드를 활용해서 저작자의 생몰년 관리를 체계화할 필요가 있음을 제안하였다.

Abstract

Copyright is a legal criterion for determining the scope and method of digital library service. Works with expired protection periods correspond to the public domain and can be freely used by anyone. For this reason, it is a priority consideration in digital library construction and services. The purpose of this study is to examine how actively libraries are using expired protected works for digital library services. To this end, the relevant provisions of the Copyright Act applied to the construction and service of digital libraries were first summarized, and the meaning of the copyright protection period was theoretically examined. The current status of online services for expired works by the National Library of Korea was examined, focusing on the works of three Japanese colonial era writers, Kim Yoo-jung, Lee Hyo-seok, and Chae Man-sik, to check the specific service status of expired works. It reveals that the National Library of Korea is not fully utilizing the scope of the law, and that this situation is linked to the rights of other authors included in the book. Based on these results, it suggests that there is a need to change the service unit to focus on copyrighted works and to use authority records to systematize the management of authors’ death years.

14
곽지영곽지영(법원도서관 사서) 2023, Vol.40, No.3, pp.143-162 https://doi.org/10.3743/KOSIM.2023.40.3.143
초록보기
초록

본 연구는 법원도서관 법마루 도서대출 데이터를 분석하여 이용자 대출 패턴을 파악하고 분석 결과를 향후 이용자 서비스에 반영하는 방안을 제안하였다. 2022년 법마루의 소장 도서는 212,608권이었으며, 법률서가 73%를 차지하고 있었다. 그러나 실제 대출은 일반서가 83%의 비중을 차지하고 있었다. 주제별 이용계수를 살펴보면 문학 분야가 5.85로 가장 활발히 이용되고 있었고 법학 분야가 0.23으로 가장 저조하게 이용되고 있었다. 상호대차의 경우, KERIS 가입 회원기관과 대한변호사협회 모두 제법 분야, 민법 분야, 사법소송절차 분야 순으로 대출 비율이 높았다. 다만, 법학계인 KERIS 가입 회원기관이 실무계인 대한변호사협회에 비해 더 다양한 주제 분야의 법률서를 대출하고 있었다. 법률정보의 접근권 향상을 위해 법마루 대국민 대출서비스를 시행했지만 실제로는 열람 공간의 이용이 높았고, 대출 역시 일반서의 비중이 월등히 높다는 것을 확인할 수 있었다. 이를 개선하기 위해서는 법마루 대출 서비스 홍보 강화 및 개인화 서비스 제공, 도서대출 규정 정비 온라인서비스 강화 및 협력네트워크 구축 등이 필요할 것으로 보인다.

Abstract

This study analyzed the Beopmaru, Supreme Court Library of Korea, circulation data to identify user lending patterns and proposed a plan to reflect the analysis results in future user services. In 2022, Beopmaru's collection of books was 212,608, with law books accounting for 73%. However, general books accounted for 83% of actual circulation. Looking at the usage coefficient by topic, the literature field was the most actively used at 5.85, and the law field was the least used at 0.23. In the case of interlibrary loan, both KERIS member institutions and the Korean Bar Association had the highest loan ratios in the legal field, civil law field, and judicial litigation procedure field, in that order. However, member institutions affiliated with KERIS, a legal academic community, were lending law books on a wider range of subject areas than the Korean Bar Association, a practical organization. To improve access to legal information, the Beopmaru public service was implemented, but in reality, the use of reading space was high, and the proportion of general books loaned was much higher. In order to improve this, it seems necessary to strengthen the promotion of Beopmaru loan services, provide personalized services, improve book lending regulations, strengthen online services, and establish a cooperative network.

15
한나은(한국과학기술정보연구원) 2023, Vol.40, No.1, pp.51-71 https://doi.org/10.3743/KOSIM.2023.40.1.051
초록보기
초록

본 연구는 공공데이터 품질관리 모델, 빅데이터 품질관리 모델, 그리고 연구데이터 관리를 위한 데이터 생애주기 모델을 분석하여 각 품질관리 모델에서 공통적으로 나타나는 구성 요인을 분석하였다. 품질관리 모델은 품질관리를 수행하는 객체인 대상 데이터의 특성에 따라 생애주기에 맞추어 혹은 PDCA 모델을 바탕으로 구축되고 제안되는데 공통적으로 계획, 수집 및 구축, 운영 및 활용, 보존 및 폐기의 구성요소가 포함된다. 이를 바탕으로 본 연구는 연구데이터를 대상으로 한 품질관리 프로세스 모델을 제안하였는데, 특히 연구데이터를 대상 데이터로 하여 서비스를 제공하는 연구데이터 서비스 플랫폼에서 데이터를 수집하여 서비스하는 일련의 과정에서 수행해야하는 품질관리에 대해 계획, 구축 및 운영, 활용단계로 나누어 논의하였다. 본 연구는 연구데이터 품질관리 수행 방안을 위한 지식 기반을 제공하는데 의의를 갖는다.

Abstract

This study analyzed the government data quality management model, big data quality management model, and data lifecycle model for research data management, and analyzed the components common to each data quality management model. Those data quality management models are designed and proposed according to the lifecycle or based on the PDCA model according to the characteristics of target data, which is the object that performs quality management. And commonly, the components of planning, collection and construction, operation and utilization, and preservation and disposal are included. Based on this, the study proposed a process model for research data quality management, in particular, the research data quality management to be performed in a series of processes from collecting to servicing on a research data platform that provides services using research data as target data was discussed in the stages of planning, construction and operation, and utilization. This study has significance in providing knowledge based for research data quality management implementation methods.

16
임진솔(전북대학교 일반대학원 기록관리학과) ; 한희정(한국국토정보공사 운영지원부) ; 오효정(전북대학교) 2023, Vol.40, No.2, pp.137-156 https://doi.org/10.3743/KOSIM.2023.40.2.137
초록보기
초록

사회․정치적 패러다임의 변화에 따라 공공기관의 기관업무 및 직제는 시시각각 신설되거나 통합 또는 폐지된다. 효과적인 기록관리 관점에서는 이러한 변화를 반영하여 이전에 구축된 기록물 분류체계와 현행 업무 맥락이 적정한지 검토할 필요가 있다. 그러나 대부분 기관에서는 분류체계 재정비 과정이 실무담당자나 기관 기록물 담당자의 실무 경험적 판단에 의존한 수작업으로 진행되고 있어, 기업의 변화가 적시에 반영되거나 전체 큰 맥락을 통합적으로 파악하기가 어렵다. 이에 본 연구는 이러한 문제를 보완하고 나아가 기록의 효율적인 관리를 위해 자동화 및 지능화 기술을 활용한 기록물 분류체계 재정비 방안을 제안한다. 또한 제안된 방법론을 실제 공공기관에 적용하고, 도출된 결과물을 기관의 기능분류 담당 실무자와 면담을 수행하여 그 실효성과 한계점을 검증하였다. 이를 통해 재정비한 기록물 분류체계의 정확도와 신뢰도를 높여 기록물 관리의 표준화 실현을 도모하고자 한다.

Abstract

As social and political paradigms change, public institution tasks and structures are constantly created, integrated, or abolished. From an effective record management perspective, it is necessary to review whether the previously established record classification schemes reflect these changes and remain relevant to current tasks. However, in most institutions, the restructuring process relies on manual labor and the experiential judgment of practitioners or institutional record managers, making it difficult to reflect changes in a timely manner or comprehensively understand the overall context. To address these issues and improve the efficiency of record management, this study proposes an approach using automation and intelligence technologies to restructure the classification schemes, ensuring records are filed within an appropriate context. Furthermore, the proposed approach was applied to the target institution, its results were used as the basis for interviews with the practitioners to verify the effectiveness and limitations of the approach. It is, aiming to enhance the accuracy and reliability of the restructured record classification schemes and promote the standardization of record management.

17
김선욱(경북대학교 사회과학대학 문헌정보학과) ; 이혜경(경북대학교 문헌정보학과) ; 이용구(경북대학교) 2023, Vol.40, No.2, pp.183-209 https://doi.org/10.3743/KOSIM.2023.40.2.183
초록보기
초록

이 연구의 목적은 ChatGPT가 도서의 표지, 표제지, 판권기 데이터를 활용하여 생성한 더블린코어의 품질 평가를 통하여 ChatGPT의 메타데이터의 생성 능력과 그 가능성을 확인하는 데 있다. 이를 위하여 90건의 도서의 표지, 표제지와 판권기 데이터를 수집하여 ChatGPT에 입력하고 더블린 코어를 생성하게 하였으며, 산출물에 대해 완전성과 정확성 척도로 성능을 파악하였다. 그 결과, 전체 데이터에 있어 완전성은 0.87, 정확성은 0.71로 준수한 수준이었다. 요소별로 성능을 보면 Title, Creator, Publisher, Date, Identifier, Right, Language 요소가 다른 요소에 비해 상대적으로 높은 성능을 보였다. Subject와 Description 요소는 완전성과 정확성에 대해 다소 낮은 성능을 보였으나, 이들 요소에서 ChatGPT의 장점으로 알려진 생성 능력을 확인할 수 있었다. 한편, DDC 주류인 사회과학과 기술과학 분야에서 Contributor 요소의 정확성이 다소 낮았는데, 이는 ChatGPT의 책임표시사항 추출 오류 및 데이터 자체에서 메타데이터 요소용 서지 기술 내용의 누락, ChatGPT가 지닌 영어 위주의 학습데이터 구성 등에 따른 것으로 판단하였다.

Abstract

The purpose of this study is to evaluate the Dublin Core metadata generated by ChatGPT using book covers, title pages, and colophons from a collection of books. To achieve this, we collected book covers, title pages, and colophons from 90 books and inputted them into ChatGPT to generate Dublin Core metadata. The performance was evaluated in terms of completeness and accuracy. The overall results showed a satisfactory level of completeness at 0.87 and accuracy at 0.71. Among the individual elements, Title, Creator, Publisher, Date, Identifier, Rights, and Language exhibited higher performance. Subject and Description elements showed relatively lower performance in terms of completeness and accuracy, but it confirmed the generation capability known as the inherent strength of ChatGPT. On the other hand, books in the sections of social sciences and technology of DDC showed slightly lower accuracy in the Contributor element. This was attributed to ChatGPT’s attribution extraction errors, omissions in the original bibliographic description contents for metadata, and the language composition of the training data used by ChatGPT.

초록보기
초록

본 연구에서는 성격유형과 흥미유형에 따른 독서 감상문에 나타난 독서에 대한 반응의 차이를 탐구하였다. 이를 위해 대전의 D과학고등학교 3학년 학생 81명을 대상으로 성격유형분석 데이터, 흥미유형분석 데이터, 교과독서 활동으로 작성된 독서 감상문 데이터를 수집하였다. 수집된 독서 감상문의 토픽 분석을 수행하고, 성격유형(사고형, 감정형)과 흥미유형(탐구형, 탐구형 외)에 따른 독서 감상문의 토픽 발현 확률을 통계적으로 검증하였다. 이어서 키워드 네트워크 분석을 통해 단어들의 개념 연결 구조를 측정하고, 중심성 지표를 통해 토픽모델링의 분석 결과를 보완하였다. 연구 결과, 토픽 회귀분석을 통해 토픽2(이해와 공부)와 토픽3(읽기와 사고)에서 사고형(T)과 감정형(F) 간에 통계적으로 유의한 차이를 확인할 수 있었으며, 토픽2(이해와 공부)에서 탐구형과 탐구형 외 간에 통계적으로 유의한 차이가 확인되었다. 본 연구의 결과는 맞춤형 도서 추천이나 개인화를 고려한 독서교육의 기초자료로 활용될 수 있을 것이다.

Abstract

This study aimed to investigate the difference in response to reading as shown in book reports by personality type and interest type. For this purpose, personality type analysis data, interest type analysis data, and book report data written in subject reading activities were collected from 81 third graders at D Science High School in Daejeon. Topic analysis was conducted on the collected book reports, and the probability of a topic being mentioned was statistically tested according to personality type (thinking type, feeling type) and interest type (investigative type, types other than investigative). Subsequently, the conceptual connection structure of words was measured by keyword network analysis, and the analysis results of topic modeling were complemented by the centrality index. As a result of the study, the topic regression analysis showed statistically significant differences between thinking type (T) and feeling type (F) in topic 2 (understanding and studying) and topic 3 (reading and thinking), and statistically significant differences between investigative type and non-investigative type in topic 2 (understanding and studying). The results of this study can be used as a basis for tailored book recommendations and personalized reading education.

19
박해인(연세대학교 교육대학원) ; 이지연(연세대학교) 2023, Vol.40, No.2, pp.33-57 https://doi.org/10.3743/KOSIM.2023.40.2.033
초록보기
초록

본 연구는 과학영재학교 재학생을 대상으로 심층면담을 실시하여 정보요구와 정보이용행태를 분석하는데 목적이 있다. 선행연구를 바탕으로 연구를 설계하고, 전국 8개의 과학영재학교 중 6개 학교에 재학 중인 10명의 학생들을 대상으로 반구조화된 면담을 진행하여 정보요구와 정보이용행태 전반을 탐색하였다. 과학영재학교 학생들의 정보요구를 교과 활동과 교과 외 활동 영역으로 확인할 수 있었고, 학생들의 주요 관심 주제인 수업 및 학습, 연구 활동에서의 정보이용행태를 ISP 모형 기반으로 살펴보았다. 정보 이용의 전 과정에서 선호정보원을 파악하고, 이를 종합하여 과학영재학교 학생들의 정보이용행태의 특이점과 시사점을 논의하였다. 본 연구는 영재학교 도서관 연구를 위한 기초자료로 사용되며, 과학 주제 분야에 심화적인 관심과 재능이 있는 학생들을 위한 서비스를 제공하기 위한 자료로도 활용할 수 있는 점에서 그 의의를 찾을 수 있다.

Abstract

This study aims to analyze students’ information needs and information-seeking behavior at science schools for gifted through in-depth interviews. The research design was conducted based on previous studies. Through in-depth interviews, this study examined ten students from six out of eight science schools for the gifted in Korea for information needs and overall information-seeking behavior. The results showed the information needs of students at science schools for gifted in the areas of curricular and extracurricular activities as well as the information-seeking behavior in teaching, learning, and research activities, which were the main topics of interest to students based on the ISP model. Based on these results, we identified the preferred information sources in the information-seeking process and discussed the peculiarities and implications of students’ information-seeking behavior. The research is meaningful as it can be used as a basis for further research on the science school for gifted library and as a resource for providing services for students with deep interests and talents in science subject areas.

20
이용구(경북대학교 문헌정보학과) 2023, Vol.40, No.4, pp.307-327 https://doi.org/10.3743/KOSIM.2023.40.4.307
초록보기
초록

이 연구는 짧은 텍스트인 서명에 단어 임베딩이 미치는 영향을 분석하기 위해 Word2vec, GloVe, fastText 모형을 이용하여 단행본 서명을 임베딩 벡터로 생성하고, 이를 분류자질로 활용하여 자동분류에 적용하였다. 분류기는 k-최근접 이웃(kNN) 알고리즘을 사용하였고 자동분류의 범주는 도서관에서 도서에 부여한 DDC 300대 강목을 기준으로 하였다. 서명에 대한 단어 임베딩을 적용한 자동분류 실험 결과, Word2vec와 fastText의 Skip-gram 모형이 TF-IDF 자질보다 kNN 분류기의 자동분류 성능에서 더 우수한 결과를 보였다. 세 모형의 다양한 하이퍼파라미터 최적화 실험에서는 fastText의 Skip-gram 모형이 전반적으로 우수한 성능을 나타냈다. 특히, 이 모형의 하이퍼파라미터로는 계층적 소프트맥스와 더 큰 임베딩 차원을 사용할수록 성능이 향상되었다. 성능 측면에서 fastText는 n-gram 방식을 사용하여 하부문자열 또는 하위단어에 대한 임베딩을 생성할 수 있어 재현율을 높이는 것으로 나타났다. 반면에 Word2vec의 Skip-gram 모형은 주로 낮은 차원(크기 300)과 작은 네거티브 샘플링 크기(3이나 5)에서 우수한 성능을 보였다.

Abstract

To analyze the impact of word embedding on book titles, this study utilized word embedding models (Word2vec, GloVe, fastText) to generate embedding vectors from book titles. These vectors were then used as classification features for automatic classification. The classifier utilized the k-nearest neighbors (kNN) algorithm, with the categories for automatic classification based on the DDC (Dewey Decimal Classification) main class 300 assigned by libraries to books. In the automatic classification experiment applying word embeddings to book titles, the Skip-gram architectures of Word2vec and fastText showed better results in the automatic classification performance of the kNN classifier compared to the TF-IDF features. In the optimization of various hyperparameters across the three models, the Skip-gram architecture of the fastText model demonstrated overall good performance. Specifically, better performance was observed when using hierarchical softmax and larger embedding dimensions as hyperparameters in this model. From a performance perspective, fastText can generate embeddings for substrings or subwords using the n-gram method, which has been shown to increase recall. The Skip-gram architecture of the Word2vec model generally showed good performance at low dimensions(size 300) and with small sizes of negative sampling (3 or 5).

정보관리학회지