바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: frequency analysis, 검색결과: 2
초록보기
초록

이 연구는 최근 접근 및 활용이 높아지고 있는 목차에 대해 품사 측면과 주제 측면에서 가지는 기술 통계와 비교 분석을 수행하였다. 이를 위해 대학 도서관의 수서 목록에서 사회과학분야 도서를 추출하고 해당하는 도서에 대해 종합목록으로부터 DDC 분류기호를, 인터넷 서점으로부터 목차 정보를 추출하였다. 서명과 목차를 대상으로 형태소 분석하여 명사 중심의 어휘에 대해 기술통계와 빈도 분석을 실시하였다. 그 결과 형태소 측면에서 서명과 목차는 명사가 대략 절반가량 차지하며, 서명과 비교하여 목차는 50배 정도 더 많은 명사를 가지며, 목차에 출현한 명사 중에 목차만이 고유하게 가지는 비율이 95.2%에 달하는 것으로 파악되었다. 또한 목차는 사회과학 학문분야에 따라 길이가 차이가 나는 것으로 나타났다.

Abstract

Recently, the table of contents (TOC) has been becoming increasingly accessible and utilized. The study conducted descriptive statistics and comparative analysis of the table of contents in terms of parts of speech and subject in text. For this purpose, this study chose the books of the social sciences field from acquisition lists of an academic library, obtained Dewey class numbers of target books from KERIS union catalog, and extracted TOC data from online bookstore. Morphological analysis was performed on each book titles and TOCs, and descriptive statistics and frequency analysis were carried out. As a result, nouns made up roughly half of the morphemes of titles or the TOCs. TOCs had about 50 times more nouns than titles. The percentage of unique nouns that appeared only in the table of contents is estimated to be 95.2% of the TOC’s total nouns. The table of contents also showed a differences in its lengths depending on the field of social science.

2
이혜경(경북대학교 문헌정보학과) ; 이용구(경북대학교) 2023, Vol.40, No.2, pp.157-182 https://doi.org/10.3743/KOSIM.2023.40.2.157
초록보기
초록

이 연구는 국립중앙도서관에서 개발한 주제명표목표의 구성 현황과 2003년부터 2022년까지 국가서지 1,218,867건에 부여된 주제명의 현황을 분석하였다. 그 결과 첫째, 주제명표목표의 전체 주제명 중 우선어는 257,103개로 전체 용어의 50.2% 이상이었으며, 외국어가 169,466개(33.1%), 비우선어가 61,442개(12.0%) 등으로 구성되었다. 우선어 중에 활용된 주제명은 57,312종으로 22.3%에 해당하며 이 중 54.7%인 31,351종의 주제명은 부여횟수 5회 미만으로, 전체 중에서 적은 수의 주제명만을 활용하고 있음을 파악하였다. 둘째, 관계지시기호의 빈도는 RT, BT, NT 순으로 나타났으며, 최상위 주제명은 12,602종, 최하위 주제명은 143,704종이었고 최대 심도는 17수준이었다. 셋째, 서지 당 평균 1.72회의 주제명이 부여되었으며, 자료의 내용이 특정적일수록 주제명 부여 횟수가 많아지고 심도도 깊어지는 경향을 보였다. 그리고 최근에 입력한 서지일수록 부여된 주제명 수가 증가하였고 심도도 깊어졌으나, KDC 주류에 따라 서지 당 부여된 주제명 수는 편차가 있는 것으로 나타났다. 현황 분석을 통해 결과적으로 주제명표목표가 수록한 용어의 범위에 대한 평가와 주제명의 계층 관계 및 심도의 재정비가 요구되며, 주제명표목표의 세목 개발을 통한 개선이 필요한 것으로 판단하였다.

Abstract

This study analyzed the structure and utilization of subject headings in the National Library of Korea Subject Headings List (NLSH) based on an analysis of subject headings assigned to 1,218,867 national bibliographies from 2003 to 2022. The findings of the study are as follows: Firstly, among all subject headings in the NLSH, there were 257,103 preferred terms, accounting for 50.2% of the total terms. Foreign language terms constituted 33% (169,466), while non-preferred terms comprised 12% (61,442). Among the preferred terms, 57,312 subject headings were used, accounting for 22.3%. However, it was observed that 54.7% (31,351) of these subject headings were assigned less than 5 times, indicating that only a small number of subject headings were frequently utilized. Secondly, the frequency of relationship indicators appeared in the order of RT, BT, and NT. The NLSH consisted of 12,602 top-level subject headings and 143,704 lowest-level subject headings, with a maximum depth of 17 levels. Thirdly, on average, 1.72 subject headings were assigned per bibliographic record. The number of subject headings assigned and the depth of the hierarchy increased for materials with more specific contents. Recent bibliographic records have been assigned more subject headings and deeper into the hierarchy of the NLSH. It was also found that the number of subject headings assigned per bibliography varied depending on the main class of KDC. Based on the findings, it is recommended to evaluate the coverage of terms in the NLSH, reorganize hierarchical relationships and depth of subject headings, and enhance the development of subdivisions within the NLSH.

정보관리학회지