바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: subject classification, 검색결과: 26
11
김인후(중앙대학교 문헌정보학과 대학원) ; 김성희(중앙대학교 문헌정보학과) 2022, Vol.39, No.3, pp.293-310 https://doi.org/10.3743/KOSIM.2022.39.3.293
초록보기
초록

본 연구에서는 한국어 데이터로 학습된 BERT 모델을 기반으로 문헌정보학 분야의 문서를 자동으로 분류하여 성능을 분석하였다. 이를 위해 문헌정보학 분야의 7개 학술지의 5,357개 논문의 초록 데이터를 학습된 데이터의 크기에 따라서 자동분류의 성능에 어떠한 차이가 있는지를 분석, 평가하였다. 성능 평가척도는 정확률(Precision), 재현율(Recall), F 척도를 사용하였다. 평가결과 데이터의 양이 많고 품질이 높은 주제 분야들은 F 척도가 90% 이상으로 높은 수준의 성능을 보였다. 반면에 데이터 품질이 낮고 내용적으로 다른 주제 분야들과 유사도가 높고 주제적으로 확실히 구별되는 자질이 적을 경우 유의미한 높은 수준의 성능 평가가 도출되지 못하였다. 이러한 연구는 미래 학술 문헌에서 지속적으로 활용할 수 있는 사전학습모델의 활용 가능성을 제시하기 위한 기초자료로 활용될 수 있을 것으로 기대한다.

Abstract

In this study, we analyzed the performance of the BERT-based document classification model by automatically classifying documents in the field of library and information science based on the KoBERT. For this purpose, abstract data of 5,357 papers in 7 journals in the field of library and information science were analyzed and evaluated for any difference in the performance of automatic classification according to the size of the learned data. As performance evaluation scales, precision, recall, and F scale were used. As a result of the evaluation, subject areas with large amounts of data and high quality showed a high level of performance with an F scale of 90% or more. On the other hand, if the data quality was low, the similarity with other subject areas was high, and there were few features that were clearly distinguished thematically, a meaningful high-level performance evaluation could not be derived. This study is expected to be used as basic data to suggest the possibility of using a pre-trained learning model to automatically classify the academic documents.

12
김아현(중앙대학교 일반대학원 문헌정보학과 석사과정) ; 이승민(중앙대학교 사회과학대학 문헌정보학과 교수) 2023, Vol.40, No.3, pp.55-76 https://doi.org/10.3743/KOSIM.2023.40.3.055
초록보기
초록

본 연구는 대학도서관의 주제가이드 개발 및 개선을 위한 고려사항을 도출하기 위해 대학도서관의 주 이용자인 대학생을 중심으로 학술정보 탐색행태를 분석하였다. 분석 결과, 대학생들은 자신의 주관적 정보탐색능력 수준을 높게 평가하고 있었으나, 구체적인 검색어의 설정을 어려워하는 것으로 나타났다. 학술정보 이용 목적은 구체적이며, 하나의 데이터베이스에서 모든 정보탐색행위를 수행하고자 하는 경향을 보이고 있다. 또한 정보자원 선택 시 신뢰성, 적합성, 최신성을 주로 고려하고 있으며, 대학도서관 및 주제가이드에 대한 인식은 전반적으로 낮게 나타났으나 이에 대한 신뢰성은 높은 것으로 분석되었다. 이를 기반으로 향후 대학도서관에서 주제가이드를 개발하거나 개선할 때는 구체적인 정보탐색 목적에 따른 정보원 분류, 정보자원의 유형별 구성, 정보자원 선택 기준 관련 설명 요소 기술, 종합 데이터베이스에 대한 안내, 주제 키워드 추천, 도서관 마케팅 및 내부 기관과의 긴밀한 협업 관계를 고려하는 것이 필요하다.

Abstract

This study analyzed academic information seeking behavior, focusing on university students, the main users of the university library, to derive considerations for the development and improvement of the subject guide of the university library. As a result of the analysis, university students highly evaluated their subjective information seeking ability, but it was found that it was difficult to set specific search terms. The purpose of using academic information is specific, and it has been shown that there is a tendency to perform all information search activities in one database. In addition, when selecting information resources, reliability, suitability, and recency are primarily taken into consideration. Awareness of university libraries and subject guides was generally low, but their reliability was found to be high. Based on this, it is necessary to consider the classification of information sources according to specific information seeking purposes, the composition of information resources, explanatory element technology related to information resource selection criteria, comprehensive database, topic keyword recommendation, library marketing, and close cooperation with internal institutions.

초록보기
초록

본 연구는 새로운 분석법으로 떠오르는 처방적 분석 기법을 소개하고, 이를 분류 기반의 시스템에 효율적으로 적용하는 방안을 제시하는 것을 목적으로 한다. 처방적 분석 기법은 분석의 결과를 제시함과 동시에 최적화된 결과가 나오기까지의 과정 및 다른 선택지까지 제공한다. 새로운 개념의 분석 기법을 도입함으로써 문헌 분류를 기반으로 하는 응용 시스템을 더욱 쉽게 최적화하고 효율적으로 운영하는 방안을 제시하였다. 최적화의 과정을 시뮬레이션하기 위해, 대용량의 학술문헌을 수집하고 기준 분류 체계에 따라 자동 분류를 실시하였다. 처방적 분석 개념을 적용하는 과정에서 대용량의 문헌 분류를 위한 동적 자동 분류 기법과 학문 분야의 지적 구조 분석 기법을 동시에 활용하였다. 실험의 결과로 효과적으로 서비스 분류 체계를 수정하고 재적용할 수 있는 몇 가지 최적화 시나리오를 효율적으로 도출할 수 있음을 보여 주었다.

Abstract

This study aims to introduce an emerging prescriptive analytics method and suggest its efficient application to a category-based service system. Prescriptive analytics method provides the whole process of analysis and available alternatives as well as the results of analysis. To simulate the process of optimization, large scale journal articles have been collected and categorized by classification scheme. In the process of applying the concept of prescriptive analytics to a real system, we have fused a dynamic automatic-categorization method for large scale documents and intellectual structure analysis method for scholarly subject fields. The test result shows that some optimized scenarios can be generated efficiently and utilized effectively for reorganizing the classification-based service system.

초록보기
초록

이 연구는 보존 기록 자료로서의 우리의 고전 장서를 보다 안전하게 보호하고 연구자나 이용자들에게는 시공을 초월한 열람이 가능토록 하기 위한 디지털 도서관으로서의 방법을 모색하는 데 목적이 있다. 즉, 우선 동양 전래의 사부 분류법과 현대적인 주제 분류, 그리고 색인어 등을 통해 다양한 접근점을 제공하고, 둘째, MARC나 XML 등을 활용한 DL시스템을 구축하되, 서지적 기술요소를 최대한 확대시키며, 셋째, 쉬운 해제와 색인어로 이용자의 이해를 극대화하고, 마지막으로 원본의 손상을 막기 위해 원문 DB를 구축하여 열람용으로 사용한다. 이는 향후 국내외 한국 고전 관련기관과 협력, 공유할 수 있는 네트워크 체제를 통해 국제적 서지통정으로 발전될 수 있을 것이다.

Abstract

The most of all, this study is planned to search an ideal methods to develop the digital library system for our korean ancient books for their safe preservation and, at the same time, for their perusal of transcendental time and space : first, to offer the various access points like traditional oriental Four parts Classics classification, current subject classification and index keyword, etc. ; second, to program a digital library system using MARC or XML, but with all bibliographic descriptive elements as possible; third, to prepare the more easy annotated bibliography and index for users' better comprehension, and last, to build original text database for practical reading to avoid the damage of original text. This type of korean ancient books digital library will be developed to the real international bibliographic control by networking enter the same kinds of internal and external organizations.

15
김은주(중앙대학교) ; 노성원(한양의대병원) ; 남태우(중앙대학교) 2016, Vol.33, No.1, pp.53-84 https://doi.org/10.3743/KOSIM.2016.33.1.053
초록보기
초록

이 연구는 한국의 정신의학 분야 국제공동연구 활성화를 위하여, 네트워크 분석에 중점을 두어 정신의학 분야 국제공동연구의 핵심 연구동향을 반영하는 지적구조를 규명하였다. 이를 위해 데이터는 Web of Science를 기반으로 수집하였으며, 검색 대상 기간은 2009년에서 2013년까지로 하였다. 고급검색 기능을 통해 정신의학 연구 분야를 의미하는 SU=“psychiatry”의 검색 식을 사용하였으며, 국제공동연구만을 선택해 총 18,590건의 논문을 수집하였다. 총 18,590건 논문의 저자 키워드와 WoS에서 부여한 키워드를 합쳐 최종 선정된 85개 키워드를 대상으로 분석한 결과는 다음과 같다. 첫째, 질환을 중심으로 총 8개의 세부 주제 영역을 확인하였다. 둘째, 높은 영향력을 가지며 다른 키워드들 간의 매개를 도모하여 주제영역을 확장시키는 총 6개의 핵심 키워드를 확인하였다. 셋째, 커뮤니티 분석을 통해 한국연구재단의 학문분류표를 이용하여 세부 주제영역으로 규명한 결과 총 15군집, 총 12세부 주제영역을 확인하였다.

Abstract

This study clarified the intellectual structure of international collaboration in psychiatry based on analyzing networks in order to vitalize for international collaboration in psychiatry in South Korea. The data set was collected from Web of Science citation database during the period from 2009 to 2013. SU=“psychiatry” search formulary (means field of psychiatric medical research) was used through advanced retrieval function and a total of 18,590 articles were selected among international collaborations. A total of 85 different keywords were selected from the 18,590 articles, and the results of analysis were as follows. First, this study examined 8 sub-subject areas focusing on disorders, and found that major subject areas could be divided into a total of 8 sub-subject areas. Second, this study examined 6 keywords that have a strong impact, and extend subject areas by promoting intermediation between other keywords Third, this study examined sub-subject areas by using the Knowledge Classification Scheme of the National Research Foundation of Korea through community analysis, and found a total of 15 clusters and a total of 12 sub-subject areas.

16
서선경(한국과학기술정보연구원) ; 최호남(한국과학기술정보연구원) ; 김병규(KISTI) ; 최선희(한국과학기술정보연구원) ; 김정환(한국과학기술정보연구원) 2016, Vol.33, No.2, pp.157-176 https://doi.org/10.3743/KOSIM.2016.33.2.157
초록보기
초록

Cited-by Linking 서비스는 CrossRef에서 제공하는 주요 서비스 중 하나로 해당 논문이 DOI를 통하여 얼마나 인용되었는지 누적하여 집계된 데이터이다. 이에 본 연구에서는 KISTI의 학술정보통합관리시스템에서 월단위로 구축․관리하는 Cited-by Linking 데이터를 분석하여 자연과학과 공학 분야의 인용 패턴을 규명하고자 하였다. 이를 위해서 전체 기탁된 21만 건 중 자연과학과 공학 분야 총 170,999건(315종)을 분석 대상으로 하고, 2016년 3월까지 누적된 Cited-by Linking 데이터를 수집하였다. 연구의 분석 결과, 첫째, 글로벌하게 인용될 가능성에서 사용 언어는 영향을 미치고 있으며, 둘째, SCIE 및 SCOPUS 등재 여부 역시 인용가능성에 상당 부분 기여하고 있음을 확인하였다. 셋째, 자연과학 분야는 거의 동일한 주제 분야에서 인용을 받고 있으며, 상대적으로 공학 분야는 타주제 분야에서 더 인용 받고 있음을 파악하였다. 이러한 연구의 결과는 자연과학과 공학 분야의 세부주제 분야별 인용 행태를 규명하고, 향후, 인용 행태에 관한 연구에서 유용하게 활용될 것으로 기대한다.

Abstract

Cited-by Linking Service is one of the CrossRef’s information services that allows you to discover how your publications are being cited and to incorporate that information into your online publication platform. This study tries to investigate citation patterns in the field of both Natural Science and Engineering using all of DOI assigned articles and Cited-by Linking data which are accumulated and managed by KISTI. The investigating approach is designed to verify the theory of 1) cognitive accessibility, 2) ‘perceived quality and significance’ and 3) ‘subject relativity’. For cognitive accessibility verification the fulltext language portion of Korean and English between “Cited DOI Source Data” and “NOT Cited DOI Source Data” was compared. For perceived quality and significance verification the availability of the “Cited DOI Source Data” and “NOT Cited DOI Source Data” from SCIE and SCOPUS was employed. For subject relativity DOI data were classified and analysed on the basis of OECD subject classification scheme. Findings are that global citability is closely related to the fulltext language of the articles and their quality and significance. And in the natural science field most of citations are from the same subject categories, while relatively more citations are from other subject categories in the engineering field.

초록보기
초록

이미지 색인은 이미지 정보로의 접근에 핵심적인 역할을 수행하는 부분으로 다양한 이미지 색인 방법 및 시스템이 이미지 정보의 종류에 따라 소개되어 왔다. 이미지 색인은 Panofsky의 정보의 단계별 색인에서 출발하여 시소러스, 분류체계, 이미지 기술요소, 범주화 방식 등을 이용하는 방식으로 발전하여 왔다. 이 연구는 Panofsky의 이미지 정보 중 이차 이미지 정보의 색인(iconographical analysis of image information)에 있어 이용자들을 대상으로 하여 그 객관성을 측정하고, 색인의 객관성과 관련된 이미지 기술요소들을 밝혀내고자 하였다. 이미지 속의 인물이나 물체 등 사실적이고 정형화된 일차 이미지 정보와는 대조적으로, 보다 주관적이고 해석적인 이차 이미지 정보의 예로 감정정보를 택하여 48명의 이용자들을 대상으로 2차에 걸친 실험을 하였다. 1차 실험에서는 같은 이미지 안에서 각각의 이용자들이 읽어내는 감정정보의 일치도를 측정하였고 2차 실험에서는 이용자들이 이미지 탐색 과정 중 검색된 이미지에 부여된 색인어에 대한 동의 정도를 통하여 색인의 객관성을 측정하였다. 1차와 2차 실험 결과는 이용자들이 같은 이미지에 대하여 다양한 해석을 내리고 있으며 주관적인 해석이나 개인차가 이차 이미지 정보의 색인에 영향을 미치는 요소로 작용하고 있음을 보여 주었다. 이 연구의 결과는 이차 이미지 정보에 대한 이용자들의 주관적인 반응을 수렴할 수 있는 색인 시스템이나 탐색기법에 대한 계속적인 연구 및 개발의 필요성을 강조하고 있다.

Abstract

Developing good methods for image description and indexing is fundamental for successful image retrieval, regardless of the content of images. Researchers and practitioners in the field of image indexing have developed a variety of image indexing systems and methods with the consideration of information types delivered by images. Such efforts in developing image indexing systems and methods include Panofsky''''s levels of image indexing and indexing systems adopting different approaches such as thesauri-based approach, classification approach. description element-based approach, and categorization approach. This study investigated users'''' perception of the objectiveness of image indexing, especially the iconographical analysis of image information advocated by Panofsky. One of the best examples of subjectiveness and conditional-dependence of image information is emotion. As a result, this study dealt with visual emotional information. Experiments were conducted in two phases : one was to measure the degree of agreement or disagreement about the emotional content of pictures among forty-eight participants and the other was to examine the inter-rater consistency defined as the degree of users'''' agreement on indexing. The results showed that the experiment participants made fairly subjective interpretation when they were viewing pictures. It was also found that the subjective interpretation made by the participants resulted from the individual differences in terms of their educational or cultural background. The study results emphasize the importance of developing new ways of indexing and/or searching for images, which can alleviate the limitations of access to images due to the subjective interpretation made by different users.

초록보기
초록

본 연구는 최근 7년간 문헌정보학분야에 게재된 논문 1,752건을 대상으로 빈도 분석과 네트워크텍스트 분석을 실시하여 다양한 주제 개념의 분포와 그 관계성을 도출하였다. 더불어 보다 최근의 연구 경향을 분석하고 변화 양상을 살펴보기 위해, 최근 2년 사이에 연구된 482건을 추출하여 2차 분석을 실시하였다. 분석 결과, 최근 7년간 문헌정보학 분야는 “공공도서관”과 “대학도서관” 개념을 중심으로 하는 연구가 가장 높은 출현 빈도를 보였으며, “평가”, “교육”, “웹”은 가장 높은 연결 중심성을 나타내 다양한 문헌정보학의 주제 개념들과 관련을 맺고 연구되고 있는 개념으로 파악할 수 있었다. 최근 2년간을 대상으로 한 2차 분석 결과에서는 “웹”, “분류” 개념이 종전보다 높은 상대 빈도를 보였으며, 네트워크 텍스트 분석 결과에서는 “이용자” 연구와 “공공도서관” 개념이 종전보다 더 다양한 주제 개념들과 관련을 맺고 수행되고 있음을 확인할 수 있었다.

Abstract

In this study, Network Text Analysis was performed on 1,752 articles which had been published in recent 7 years and drew the subject concept distribution and their relations in Library and Information Science research areas. Furthermore, for analyzing more recent trends and changing aspects, this study performed secondary analysis based on 482 articles published in recent 2 years. Results show that “public library”, and “academic library” concepts were most frequently studied in the field and “evaluation”, “education”, and “web” concepts showed the highest-degree centrality during the recent 7 years. In the result of recent two years analysis, “web”, and “classification” concepts showed high frequency and “user”, and “public library” showed an improvement in high degree centrality.

초록보기
초록

웹 상의 의학 분야 자료들은 방대한 규모로 존재하며, 각 검색엔진에서는 이를 분류하여 제공하고 있으나 그 구성에 있어서 일관성과 체계성이 부족하다. 따라서 본 논문은 검색엔진에서 의학 분야 웹 자료 분류체계를 구성하기 위하여 의학 전문 문헌분류표인 NLMC를 준용하고, 항목의 배열이 주제간 관련성을 기반으로 이루어져야 한다는 것을 제안하였다. 또한 순환성을 고려한 1차 분류 및 2차 분류 항목에서의 중복 분류시, 그에 대한 명확한 기준이 설정되어야 하며, 분류 항목명을 의학 분야 표준 용어집인 MeSH와 의학용어집의 용어로 선택하여 기존의 도서관 정보검색시스템과의 상호호환성을 높여야 한다는 것을 제안하였다.

Abstract

There are lots of Web materials in the field of medicine and many search engines classify the medical materials on the Web through directories. But the organization of these directories are wanting in consistency and systematization. In order for manager of search engines to organize medical materials on the Web systematically, this paper suggests several guidelines. NLMC, a special classification system for medicine, need to be applied to develop directories of medicine in search engines. Also, items of the directories should be arranged based on the relevance of subjects among subfields of medical science. For classifying an item to several directories repeatedly, clear criteria should be established. In addition to, controlled vocabularies or glossaries for medicine such as MeSH and the English-Korean, Korean-English Medical Terminology Collection should be used for selection of the name of items in medical directories.

초록보기
초록

이 논문에서는 학술지 인용 데이터와 웹 링크 데이터를 이용하여 8개 과학기술 분야의 학제적 구조를 파악하고 각 학문분야 간 학제성을 비교하였다. 분석 대상이 되는 학술지와 웹 페이지의 주제적 성격을 파악하기 위해 기존의 과학기술 분류체계를 재구성하여 이용하였다. 이 연구에서 학제성은 여러 학문분야 간 학제적 연결의 측면에서 파악하였으며, 학제성의 정도는 연관 학문분야의 수로 측정한 학제적 다양성과 자기인용률에 의해 평가하였다. 분석 결과 학술지 인용 분석에서는 밝혀내지 못한 새로운 학제적 연결을 웹 링크 분석에 의해 파악하였으며, 이를 통해 웹 링크 분석이 학제성을 연구하는 수단으로서 유용함을 알 수 있었다. 또한 인용 분석과 링크 분석에서 모두 자연과학 분야에 비해 공학 분야의 학제성이 대체로 더 높게 나타났다.

Abstract

This study identifies the interdisciplinary structures of 8 scientific disciplines in science and technology using the data from journal citations and web links, and compares the interdisciplinarity among these scientific disciplines. The interdisciplinarity refers to interdisciplinary connections among scientific fields and the degree of interdisciplinarity is measured by the number of associated fields and the rate of self-citation. A re-arranged classification scheme for science and technology was adopted to identify subject categories of journals and web pages. Web link analysis revealed a few additional interdisciplinary connections that were not identified by the journal citation analysis, thus demonstrating that it is useful means of investigating the interdisciplinarity of scientific fields. Besides, in most of the cases the interdisciplinarity of the engineering fields were found greater than that of the fields in natural sciences in both analyses.

정보관리학회지