바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 문헌범주화, 검색결과: 22
11
강인서(공주대학교 문헌정보교육과 박사과정,대전자운초등학교 교사) ; 김혜진(공주대학교 문헌정보교육과 조교수) 2020, Vol.37, No.2, pp.333-352 https://doi.org/10.3743/KOSIM.2020.37.2.333
초록보기
초록

본 연구는 문헌정보학에서 다뤄지는 정보격차 연구동향을 분석하기 위해서 문헌정보학관련 4개 학술지에서 발행한 195편의 논문을 수집하고, 해당 문헌을 대상으로 연구대상(11개 하위 범주), 연구목적(4개 하위 범주), 연구방법(4개 하위 범주)로 코딩하였다. 이것을 저자 키워드와 함께 패스파인더 알고리즘을 적용한 키워드 네트워크를 구축하여 분석을 진행하였다. 분석 결과, 정보취약계층(연구대상) 중 장애인, 다문화가정, 고령자에 대한 연구가 79.5%로 특정 계층에 집중되어있는 것으로 나타났다. 그리고 정보격차, 장애인, 공공도서관을 중심으로, 다문화, 고령자 등에 대한 정보취약 실태와 해소방안을 목적으로 활발히 연구가 진행되었으나, 정보취약 해소효과, 정보취약의 영향요인을 목적으로 한 연구는 고령자, 독서치료, 정보화교육, 정보활용, 독서프로그램을 구안하고 적용하여 효과를 검증하는 연구에 국한되어 있었다. 마지막으로 정보격차에서 가장 많이 활용되는 연구방법은 문헌연구와 함께 사례연구 또는 설문조사를 동시에 이용하는 것으로 나타났다.

Abstract

This study aimed to analyze research trends of ‘digital divide’ in Library and Information Science. To this end, we coded research subjects with 11 subcategories, and research objectives with 4 subcategories, and research methods with 4 subcategories, and constructed keyword networks to which a pathfinder algorithm was applied. As a result of the analysis, 79.5% of studies are on the disabled, multicultural families, and the elderly among information vulnerable groups, and it was found to be concentrated in specific groups. In addition, digital divide related studies have been actively conducted for the purpose of resolving information vulnerabilities such as people with disabilities. We also found that these studies focused on verifying the effectiveness by designing and applying treatments such as informatization education, information utilization, and reading programs. Lastly, the most frequently used research method in the digital divide was found to use case studies or questionnaires simultaneously with literature research.

초록보기
초록

최근 문헌정보학의 관련 분야로 주목받고 있는 데이터과학은 오랫동안 문헌정보학에서 해오던 정보의 수집, 저장, 조직, 분석, 활용 등의 활동을 데이터에 적용하여 그 가치를 이해하려는 학문이며, 통계학과 컴퓨터공학 등 다른 학문분야와의 연계가 필요한 분야이다. 이러한 데이터과학 분야의 연구 영역을 파악하기 위하여 동시출현단어 분석을 사용하여 Web of Science 핵심컬렉션에 수록된 문헌들 중 데이터과학 관련 자료들을 수집하고, 그 주제범주를 활용하여 네트워크분석을 실시하였다. 총 667건의 자료에 대한 159개의 주제범주를 기술분석하여 데이터과학 관련 연구가 많이 이루어지고 있는 학문분야를 조사하였고, 네트워크분석을 통해 데이터과학 분야 연구영역의 지적구조를 시각적으로 파악하였다. 분석결과, 데이터과학 분야의 연구들은 2개 영역 9개 군집으로 구분되었으며, 주제범주의 용어들 중 중심성이 높은 용어들을 통해 각 군집의 대표적인 주제들을 선정하였다. 연구의 결과는 데이터과학 분야의 연구들에 대한 지적구조를 파악하는데 도움이 될 수 있고, 문헌정보학과의 연계융합전공으로서의 데이터과학 교과과정 개발에 방향성을 제시할 수도 있을 것이다.

Abstract

Data Science is emerging as a closely related field of study to Library and Information Science (LIS), and as an interdisciplinary subject combining LIS, statistics and computer science in an attempt to understand the value of data by applying what LIS has been doing for collecting, storing, organizing, analyzing, and utilizing information. To investigate which subject fields other than LIS, statistics, and computer science are related to Data Science, this study retrieved 667 materials from Web of Science Core Collection, extracted terms representing Web of Science Categories, examined subject fields that are studying Data Science using descriptive analysis, analyzed the intellectual structure of the field by co-word analysis and network analysis, and visualized the results as a Pathfinder network with clustering created with the PNNC clustering algorithm. The result of this study might help to understand the intellectual structure of the Data Science field, and may be helpful to give an idea for developing relatively new curriculum.

초록보기
초록

국내 학술회의 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히 구현이 쉽고 컴퓨터 처리 속도가 빠른 로치오 알고리즘을 사용하여 『한국정보관리학회 학술대회 논문집』의 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 분류기 생성 방법, 학습집합 규모, 가중치부여 기법, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 파라미터(β, λ)와 학습집합의 크기(5년 이상)를 적절하게 적용하는 것이 효과적이며, 동등한 성능 수준이라면 보다 단순한 단일 가중치부여 기법을 사용하여 분류의 효율성을 높일 수 있음을 발견하였다. 또한 국내 학술회의 논문의 분류는 특정 논문에 하나 이상의 범주가 부여되는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있으므로, 이러한 환경을 고려하여 주요 성능 요소들의 특성에 기초한 최적의 분류 모델을 개발할 필요가 있다.

Abstract

This study examined the factors affecting the performance of automatic classification for the domestic conference papers based on machine learning techniques. In particular, In view of the classification performance that assigning automatically the class labels to the papers in Proceedings of the Conference of Korean Society for Information Management using Rocchio algorithm, I investigated the characteristics of the key factors (classifier formation methods, training set size, weighting schemes, label assigning methods) through the diversified experiments. Consequently, It is more effective that apply proper parameters (β, λ) and training set size (more than 5 years) according to the classification environments and properties of the document set. and If the performance is equivalent, I discovered that the use of the more simple methods (single weighting schemes) is very efficient. Also, because the classification of domestic papers is corresponding with multi-label classification which assigning more than one label to an article, it is necessary to develop the optimum classification model based on the characteristics of the key factors in consideration of this environment.

14
채현수(연세대학교 문헌정보학과 박사과정) ; 김예원(연세대학교 문헌정보학과 석사과정) ; 김혜영(청주대학교 문헌정보학과) ; 이지연(연세대학교 문헌정보학과) 2023, Vol.40, No.4, pp.95-121 https://doi.org/10.3743/KOSIM.2023.40.4.095
초록보기
초록

본 연구는 대학도서관 실무자인 사서의 인식을 바탕으로 대학도서관 서비스 범주별로 활용할 수 있는 4차 산업혁명 기술 조합을 탐색하고 효과적인 서비스 전략을 모색하는 데 목적이 있다. 문헌조사를 바탕으로 4차 산업혁명 기술의 개념과 유형을 파악하였고, 국내외 도서관 서비스의 기술 활용 사례를 살펴보았다. 국내 대학도서관이 서비스하고 있는 항목들을 조사하고 범주화하여 대학도서관 서비스 분야-범주-항목 체계를 정립하였고, 이를 바탕으로 설문조사를 실시하여 대학도서관 사서들이 인식하고 있는 서비스별 기술 도입 필요성과 적정 서비스 자동화 수준을 파악하였다. 조사 결과 우선적으로 고려할 필요가 있는 대학도서관 서비스-기술 조합 9가지를 선별할 수 있었다. 조사 및 분석 결과를 종합하여 서비스 범주별 서비스-기술 전략을 제안하였다. 본 연구는 대학도서관 서비스의 고도화 및 효율화를 위해 신기술 도입 및 활용 가능성을 탐색하고, 실무자들이 공감하고 있는 인식을 통해 서비스-기술 결합을 위해 추진해야 할 방향성을 살펴보았다는 점에서 의의가 있다.

Abstract

This study aims to explore the combinations of services and technologies for academic libraries to use based on librarians’ perception and establish effective service strategies accordingly. The literature review facilitated an understanding of Fourth Industrial Revolution technologies impacting the libraries. We discovered how technologies are transforming library services. We analyzed the academic library services to categorize their service structure. The survey revealed the necessity of introducing technology for each service category and the appropriate automation levels of services based on the perception of librarians. The survey results identified nine prioritized combinations of academic library services and technologies. Based on the analysis, we proposed the service-technology strategies for each category. This study has significance in exploring the potential for introducing and utilizing new technologies to enhance academic library services and exploring ways to combine services and technologies based on the common opinion of librarians.

15
김성훈(성균관대학교) ; 오삼균(성균관대학교) 2015, Vol.32, No.2, pp.193-219 https://doi.org/10.3743/KOSIM.2015.32.2.193
초록보기
초록

온톨로지의 평가는 잘 구축된 기존 온톨로지와 비교하는 방법, 활용될 애플리케이션에 적용해보는 방법, 원천데이터와의 적합성․관련성을 판단해보는 방법을 통해 이뤄지고 있다. 이와 같은 방법론은 온톨로지를 통해 얻게 된 결과에 치중되어 온톨로지의 체계, 의미표현, 상호운용성과 같은 내재적인 영역의 평가에 어려움이 있다. 본 연구는 온톨로지 전문가를 통해 온톨로지 품질평가를 위한 항목을 도출하였다. 문헌조사를 통해 온톨로지의 내재적 평가를 위한 범주를 추출하였고, 각 범주에 대한 평가항목을 델파이조사를 통해 전문가들에게 수집한 뒤, 수집된 평가항목을 재검증하였다. 그 결과, 처음 수집된 70개의 평가 항목에서 최종적으로 53개의 평가항목을 선정하였다. 또한 수집된 평가항목을 온톨로지 평가에 활용하여 봄으로써 평가항목의 신뢰도를 측정하였다.

Abstract

The focus of traditional evaluations of ontologies is largely performance-based. A comparison of a new ontology with well-established ones, testing of ontologies in different applications, as well as any judgment of an ontology’s appropriateness and relatedness to source data heavily rely on what results that ontology seems to manifest. This study, on the other hand, is an attempt to evaluate the quality of a particular ontology as manifested by its structure, representation, and interoperability. To that end, major categories of quality evaluations were first identified through an extensive survey of literature. Evaluation questions were formulated from these categories using the Delphi method and were validated by ontology experts. The entire process produced a set of 53 evaluation questions, which was then employed to test the quality of a newly-developed smartphone ontology.

초록보기
초록

본 연구는 복합적인 주제 영역인 이민정책에 관한 다양한 정보를 효과적으로 조직하고 최적의 정보 서비스를 제공할 수 있는 분류표를 개발하기 위해 관련 문헌 연구와 다양한 문헌분류표를 조사하였다. 먼저, 문헌 연구를 통해 이민정책의 학문적 개념과 범주를 정의하고, 이를 바탕으로 핵심 주제 영역을 선정하였다. 다음으로, 듀이십진분류표, 미의회도서관분류표, 한국십진분류표, 국제십진분류표에서 이민정책 분야의 구조와 전개 항목, 특성을 비교 분석하였다. 그리고 이들 분류표 중 전 세계적으로 가장 많이 사용하고 있으며, 정기적으로 개정되고 있는 DDC 23판을 바탕으로 이민정책 분야를 수정 전개하기 위한 설계 원칙과 본표, 보조표를 제안하였다. 수정 전개된 듀이십진분류표는 이민정책을 다루는 주요 분야에 적용될 수 있으며, 이민 정책 관련 전문 연구기관이나 도서관에서 소장 자료를 효과적으로 분류하고 조직하며 이민정책 전문 정보를 통합 관리하기 위한 기초 자료로 활용될 것이다.

Abstract

This study investigated and analyzed various library classification systems and related literature in order to suggest some modifications and expansion of the Dewey Decimal Classification, the 23rd edition (DDC 23) in the area of immigration policy - an interdis- ciplinary subject - for the best information organization and services. First of all, definitions and scopes of the immigration policy were dealt with and then primary subject areas of it were selected. And then, DDC, Library of Congress Classification, Korean Decimal Classification, and Universal Decimal Classification were compared and analyzed according to the structures, headings and characteristics. Finally, modified classification schedules in immigration policy of the DDC 23 - the most frequently used one with an regular revision was proposed with their principles and main schedules with an auxiliary table. It can be used for an effective information organization in immigration policy area and it will be useful for many libraries and research institutes on immigration policy.

17
송성전(연세대학교) ; 정영미(연세대학교) 2012, Vol.29, No.2, pp.205-224 https://doi.org/10.3743/KOSIM.2012.29.2.205
초록보기
초록

자동 분류에서 문헌을 표현하는 일반적인 방식인 BOW는 용어를 독립적으로 처리하기 때문에 주변 문맥을 반영하지 못한다는 한계가 있다. 이에 본 연구는 각 용어마다 주제범주별 문맥적 특징을 파악해 프로파일로 정의하고, 이 프로파일과 실제 문헌에서의 문맥을 비교하는 과정을 통해 동일한 형태의 용어라도 그 의미나 주제적 배경에 따라 구분하고자 하였다. 이를 통해 주제가 서로 다름에도 불구하고 특정 용어의 출현만으로 잘못된 분류 판정을 하는 문제를 극복하고자 하였다. 본 연구에서는 이러한 문맥적 요소를 용어 가중치, 분류기 결합, 자질선정의 3가지 항목에 적용해 보고 그 분류 성능을 측정했다. 그 결과, 세 경우 모두 베이스라인보다 분류 성능이 향상되었고 가장 큰 성능 향상을 보인 것은 분류기 결합이었다. 또한 제안한 방법은 학습문헌 수가 많고 적음에 따라 발생하는 성능의 편향을 완화하는데도 효과적인 것으로 나타났다.

Abstract

One of the limitations of BOW method is that each term is recognized only by its form, failing to represent the term’s meaning or thematic background. To overcome the limitation, different profiles for each term were defined by thematic categories depending on contextual characteristics. In this study, a specific term was used as a classification feature based on its meaning or thematic background through the process of comparing the context in those profiles with the occurrences in an actual document. The experiment was conducted in three phases; term weighting, ensemble classifier implementation, and feature selection. The classification performance was enhanced in all the phases with the ensemble classifier showing the highest performance score. Also, the outcome showed that the proposed method was effective in reducing the performance bias caused by the total number of learning documents.

초록보기
초록

디자인분야 대학생들이 학업능력을 향상시키고 독립적인 전문가로 성장하기 위해서는 일반적 정보문해 교육에서 추구하는 일반적인 정보문해능력 이외에 보다 복잡하고 전문적인 정보문해능력이 요구된다. 따라서 본 연구는 국내 4개 대학교의 디자인분야 교육목표와 교육과정, 그리고 미국 디자인분야 교육 인증기관인 국립미술디자인학교협회의 디자인분야 학사학위 프로그램 기준과 지침에 대한 문헌조사를 실시하고, 문헌조사를 통해 분석된 디자인분야의 핵심 정보문해능력에 대한 검증을 위하여 디자인분야 전문가를 대상으로 한 델파이 조사를 실시하였다. 연구결과 디자인분야는 7개 범주 26개의 핵심 정보문해능력을 공통적으로 필요로 하며, 이러한 정보문해능력들은 정보문해 교육의 시기와도 관련이 있는 것으로 분석되었다. 또한 제품디자인 등 세부전공분야별로는 보다 더 전문적인 특정 정보문해능력이 추가적으로 필요하며, 이러한 디자인분야 특정 핵심 정보문해능력 이외에 디자인분야에는 일반영역/기초능력관련 일반학문분야에 대한 정보문해능력도 필요한 것으로 분석되었다.

Abstract

Design discipline requires more specialized and sophisticated information literacy competencies necessary to effectively find and apply the information that students need for their learning and the future independent designer than are outlined in general information literacy competencies. Therefore, The goal of this study is to identify specific core information literacy competencies within the Design Discipline through the analysis of design goals & curriculum of four domestic universities and NASAD standards & guidelines. The result showed that design discipline requires commonly 26 specific core competencies in seven broad categories and the these competencies are related to the time for information literacy Instruction. Also, The result analyzed that such majors in design as product design require additionally more specialized and detailed competencies with specific focus and that in addition to design-specific core information literacy competencies, design discipline requires the information literacy competencies about general studies & fundamental ability.

초록보기
초록

본 연구는 도서관 장서의 분류를 위하여 기존의 문헌 분류체계 대신 주제어 기반의 분류를 적용하고자 할 때 필수적인 주제명 개발의 필요성을 논하고, 개발 방법론의 하나로 기존의 다양한 지식조직체계의 주제어를 활용하는 방법의 가능성을 모색하는데 목적이 있다. 이를 위하여 분석 대상 저작을 선정하고 이에 대하여 부여된 문헌분류, 주제명표목, 국내외 대형 서점의 분류, 서가명 및 주제어, 이용자 태그 등 다양한 지식조직체계의 주제어를 수집하여 그 특성을 비교 분석하였다. 이러한 분석의 결과, 전통적인 도서관 중심의 지식조직체계와 상업성이 중심이 되는 지식조직체계의 성격과 범주화의 방식이 다름을 확인할 수 있었다. 한편, 이용자 태그는 최상위 빈도수의 태그인 경우 전통적인 지식조직체계 및 상업적 영역의 지식조직체계와 어휘의 측면에서 거의 차이가 없는 결과를 나타냈으나, 이용자 중심의 주제어로서 독특한 특성을 가지고 있음을 파악하였다. 이러한 분석을 바탕으로 분류를 대체하는 주제명 작성을 위해 기존의 지식조직체계를 활용할 때 고려해야 할 각각의 특성 및 상호 관계를 분석하였고, 국내에서의 적용을 위한 실질적인 고려사항을 제안하였다.

Abstract

This study aims to analyse the necessity of the subject heading construction for the word based classification and to suggest a methodology that uses various knowledge organization systems(KOS). For this purpose, six kinds of KOS were collected for the 20 selected works in each subject. The collected subjects were analysed in terms of constructing a subject heading for the word based classification. The result of the analysis shows that there is a noticeable difference between the library oriented KOS and commercial oriented KOS. In addition, user oriented tags are more similar to the commercial sector's concerning subject categorization than the library oriented ones. However, there is no noticeable difference among the library oriented KOS, commercial sector oriented KOS, and user oriented tags regarding the subject vocabulary. Some practical implications were suggested for the application to the Korean libraries based on the findings of this study.

초록보기
초록

대표적인 앙상블 기법으로서 랜덤포레스트(RF)를 문헌정보학 분야의 학술지 논문에 대한 자동분류에 적용하였다. 특히, 국내 학술지 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 트리 수, 자질선정, 학습집합 크기 등 주요 요소들에 대한 다각적인 실험을 수행하였다. 이를 통해, 실제 환경의 불균형 데이터세트(imbalanced dataset)에 대하여 랜덤포레스트(RF)의 성능을 최적화할 수 있는 방안을 모색하였다. 결과적으로 국내 학술지 논문의 자동분류에서 랜덤포레스트(RF)는 트리 수 구간 100〜1000(C)과 카이제곱통계량(CHI)으로 선정한 소규모의 자질집합(10%), 대부분의 학습집합(9〜10년)을 사용하는 경우에 가장 좋은 분류 성능을 기대할 수 있는 것으로 나타났다.

Abstract

Random Forest (RF), a representative ensemble technique, was applied to automatic classification of journal articles in the field of library and information science. Especially, I performed various experiments on the main factors such as tree number, feature selection, and learning set size in terms of classification performance that automatically assigns class labels to domestic journals. Through this, I explored ways to optimize the performance of random forests (RF) for imbalanced datasets in real environments. Consequently, for the automatic classification of domestic journal articles, Random Forest (RF) can be expected to have the best classification performance when using tree number interval 100〜1000(C), small feature set (10%) based on chi-square statistic (CHI), and most learning sets (9-10 years).

정보관리학회지