바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: classification, 검색결과: 95
11
김송이(이화여자대학교) ; 정연경(이화여자대학교) 2014, Vol.31, No.3, pp.7-27 https://doi.org/10.3743/KOSIM.2014.31.3.007
초록보기
초록

한국십진분류법(Korea Decimal Classification) 5판에서는 건축학 분야가 건축공학과 건축술이라는 두 항목으로 나뉘어 분류되었으나 2013년 6판에서는 ‘건축, 건축학’으로 통합되었다. 본 연구는 KDC 5판과 KDC 6판의 비교 분석과 DDC, NDC, UDC의 비교 분석을 통하여 개정된 KDC 6판의 건축학 분야를 살펴보고 개선방안을 제안하였다. 주요 십진분류법과의 비교 분석결과 건축학은 항목 통합으로 인한 재분류의 필요성, 이전보다 길어진 건축사 분류번호 문제가 발생하였으며, 한국 전통 건축에 대한 분류 전개 개선이 필요한 것으로 나타나 이에 대한 개선방안을 제안하였다.

Abstract

Constructions and Architecture fields were divided into Architecture engineering and Architecture in the 5th edition of Korean Decimal Classification (KDC), but those were combined in the 6th edition of KDC published in 2013. The purposes of this study are to find problems and to suggest modifications through comparing and analyzing the 5th and the 6th editions of KDC, Dewey Decimal Classification, Nippon Decimal Classification and Universal Decimal Classification. The necessity of reclassification, a long classification number for History of Architecture and addition of categories of traditional building and architectural engineering are required to improve the 6th edition of KDC and the improvements and modifications of those problems are suggested.

12
박소연(계명대학교) ; 이준호(숭실대학교) 2002, Vol.19, No.3, pp.111-122 https://doi.org/10.3743/KOSIM.2002.19.3.111
초록보기
초록

본 연구에서는 웹 검색 이용자들의 전반적인 검색 행태를 이해하기 위하여 국내에서 널리 사용되고 있는 웹 검색 서비스 네이버에서 생성된 검색 트랜잭션 로그를 분석하였다. 본 연구에서는 웹 검색 트랜잭션 로그 분석에 필요한 세션 정의 방법을 설명하고 로그 정제 및 질의 유형 분류방법을 제시하였으며, 한글 검색 트랜잭션 로그 분석에 필수절인 검색어 정의 방법을 제안하였다. 본 연구의 결과는 보다 효과적인 국내 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

Abstract

In order to investigate information seeking behavior of web search users, this study analyzes transaction logs posed by users of NAVER, a major Korean Internet search service. We present a session definition method for Web transaction log analysis, a way of cleaning original logs and a query classification method. We also propose a query term definition method that is necessary for Korean Web transaction log analysis. It is expected that this study could contribute to the development and implementation of more effective Web search systems and services.

초록보기
초록

조선총독부 공문서는 근대사 연구의 가장 핵심적인 정보원이다. 이 연구의 목적은 조선총독부 공문서를 원활히 활용할 수 있도록 지원하는 기능분류체계를 개발하기 위한 원칙과 단계를 제시하는 것이다. 우선, 기능적 분류체계를 위한 이론적 근거를 마련하기 위해 기록물 분류의 개념과 역할, 분류 원칙에 대해 살펴보고, ‘기능적 출처’ 개념 도입의 필요성을 제시하였다. 또한 조선총독부 공문서 분류에 왜 기능분류가 적합한지를 살펴보았고, 기능분류 사례와 그 시사점도 살펴보았다. 이러한 이론적 연구와 조선총독부 조직 및 기능 분석 결과를 토대로 조선총독부 기록물을 위한 분류체계 개발을 위한 원칙을 설정하였다. 아울러 개념화, 용어화, 기호화를 고려한 개발모형을 도출하였으며, 분류표와 함께 시소러스를 연계 구축할 수 있는 방안도 제시하였다.

Abstract

Public records, produced during the period of Government-General of Chosun, are essential sources for Korean modern history research. The purpose of this study is to provide a guideline for developing function-based classification scheme for the records. This present paper begins with analyzing archival principles regarding the function-based classification, and examines the problems of current arrangement practices. Based on these analyses, it suggests a guideline for constructing a classification system and a functional thesaurus for the public records of Government-General of Chosun. This guideline also covers functional analysis process and some considerations of different classification aspects which are conceptual, verbal and notational.

초록보기
초록

소설은 학교도서관에서 학생들이 가장 많이 열람하고 대출하는 장서이다. KDC는 학생들이 원하는 다양한 소설을 찾는데 제한점을 가진다. 이에 본 연구는 도서관과 서점, 출판사 등에서 사용하고 있는 소설 분류의 다양한 사례와 중학생의 소설 이용 행태를 설문 조사하여 이용자 요구에 맞게 소설 분류 개선안을 제안하였다. KDC 기호에 더하여 소설의 장르별 색띠를 부착하여 이용자들이 손쉽게 원하는 소설을 찾을 수 있도록 하였으며 추가적인 사항은 중학생들의 소설 접근성과 발견성을 향상시키고 향후 도서관이나 서점, 출판사에서 사용하는 소설 분야 세분에 대한 참고자료로 활용될 수 있을 것이다.

Abstract

Fiction is a collection that most students read and borrow in school libraries. KDC has several limitations when students look for fiction books they need. In line with this, we surveyed various cases of fiction classifications used in libraries, bookstores, and publishers and use behaviors of fiction of middle school students. Based upon the result of the surveys, we proposed a better way of classifying fiction books according to user needs. In addition to the KDC number, color bands were attached according to genres so that users could easily find the desired books. These suggestions and other information will enhance the accessibility and discoverability to fiction books for middle school students and may be used as reference materials for fiction classification in libraries, bookstores, and publishers in the future.

초록보기
초록

이 연구는 최근 접근 및 활용이 높아지고 있는 목차에 대해 품사 측면과 주제 측면에서 가지는 기술 통계와 비교 분석을 수행하였다. 이를 위해 대학 도서관의 수서 목록에서 사회과학분야 도서를 추출하고 해당하는 도서에 대해 종합목록으로부터 DDC 분류기호를, 인터넷 서점으로부터 목차 정보를 추출하였다. 서명과 목차를 대상으로 형태소 분석하여 명사 중심의 어휘에 대해 기술통계와 빈도 분석을 실시하였다. 그 결과 형태소 측면에서 서명과 목차는 명사가 대략 절반가량 차지하며, 서명과 비교하여 목차는 50배 정도 더 많은 명사를 가지며, 목차에 출현한 명사 중에 목차만이 고유하게 가지는 비율이 95.2%에 달하는 것으로 파악되었다. 또한 목차는 사회과학 학문분야에 따라 길이가 차이가 나는 것으로 나타났다.

Abstract

Recently, the table of contents (TOC) has been becoming increasingly accessible and utilized. The study conducted descriptive statistics and comparative analysis of the table of contents in terms of parts of speech and subject in text. For this purpose, this study chose the books of the social sciences field from acquisition lists of an academic library, obtained Dewey class numbers of target books from KERIS union catalog, and extracted TOC data from online bookstore. Morphological analysis was performed on each book titles and TOCs, and descriptive statistics and frequency analysis were carried out. As a result, nouns made up roughly half of the morphemes of titles or the TOCs. TOCs had about 50 times more nouns than titles. The percentage of unique nouns that appeared only in the table of contents is estimated to be 95.2% of the TOC’s total nouns. The table of contents also showed a differences in its lengths depending on the field of social science.

16
심원식(성균관대학교) ; 김성환(성균관대학교) 2007, Vol.24, No.4, pp.153-171 https://doi.org/10.3743/KOSIM.2007.24.4.153
초록보기
초록

본 연구는 이용이 매우 활발한 국내 학위논문의 원문 검색 서비스를 개선하기 위한 하나의 방법으로 한국직업능력개발원이 개발한 커리어넷의 학과정보 분류체계를 한국교육학술정보원이 운영하는 RISS에 포함된 학위논문 정보에 적용한 것이다. 연구 결과 커리어넷의 학과정보 분류체계는 최근 3년간 국내에서 생산되거나 이용된 학위논문을 분류하는데 비교적 적합한 것으로 나타났다. 최근 3개년 동안의 학과분류별 논문생산량과 논문이용량을 분석하였으며, 이를 바탕으로 학과분류 적용 가능성을 검토하고 활용방안을 모색하였다.

Abstract

This study suggests that improvement of theses and dissertations retrieval can be made by applying appropriate academic department classification. We applied the Korea Research Institute for Vocational Education and Training(KRIVET)'s department classification to these and dissertations being serviced by Korea Education & Research Information Service(KERIS). The results show that the chosen classification appropriately represents diverse academic department information contained in the theses and dissertations either published or used within the recent three year period. The study also makes a number of suggestions that will facilitate the application of an academic department classification to a live system.

초록보기
초록

이 연구에서는 분포 유사도를 문헌 클러스터링에 적용하여 전통적인 코사인 유사도 공식을 대체할 수 있는 가능성을 모색해보았다. 대표적인 분포 유사도인 KL 다이버전스 공식을 변형한 Jansen-Shannon 다이버전스, 대칭적 스큐 다이버전스, 최소 스큐 다이버전스의 세 가지 공식을 문헌 벡터에 적용하는 방안을 고안하였다. 분포 유사도를 적용한 문헌 클러스터링 성능을 검증하기 위해서 세 실험 집단을 대상으로 두 가지 실험을 준비하여 실행하였다. 첫 번째 문헌 클러스터링 실험에서는 최소 스큐 다이버전스가 코사인 유사도 뿐만 아니라 다른 다이버전스 공식의 성능도 확연히 앞서는 뛰어난 성능을 보였다. 두 번째 실험에서는 피어슨 상관계수를 이용하여 1차 유사도 행렬로부터 2차 분포 유사도를 산출하여 문헌 클러스터링을 수행하였다. 실험 결과는 2차 분포 유사도가 전반적으로 더 좋은 문헌 클러스터링 성능을 보이는 것으로 나타났다. 문헌 클러스터링에서 처리 시간과 분류 성능을 함께 고려한다면 이 연구에서 제안한 최소 스큐 다이버전스 공식을 사용하고, 분류 성능만 고려할 경우에는 2차 분포 유사도 방식을 사용하는 것이 바람직하다고 판단된다.

Abstract

In this study, measures of distributional similarity such as KL-divergence are applied to cluster documents instead of traditional cosine measure, which is the most prevalent vector similarity measure for document clustering. Three variations of KL-divergence are investigated; Jansen-Shannon divergence, symmetric skew divergence, and minimum skew divergence. In order to verify the contribution of distributional similarities to document clustering, two experiments are designed and carried out on three test collections. In the first experiment the clustering performances of the three divergence measures are compared to that of cosine measure. The result showed that minimum skew divergence outperformed the other divergence measures as well as cosine measure. In the second experiment second-order distributional similarities are calculated with Pearson correlation coefficient from the first-order similarity matrixes. From the result of the second experiment, second-order distributional similarities were found to improve the overall performance of document clustering. These results suggest that minimum skew divergence must be selected as document vector similarity measure when considering both time and accuracy, and second-order similarity is a good choice for considering clustering accuracy only.

18
이용구(경북대학교 문헌정보학과) 2023, Vol.40, No.4, pp.307-327 https://doi.org/10.3743/KOSIM.2023.40.4.307
초록보기
초록

이 연구는 짧은 텍스트인 서명에 단어 임베딩이 미치는 영향을 분석하기 위해 Word2vec, GloVe, fastText 모형을 이용하여 단행본 서명을 임베딩 벡터로 생성하고, 이를 분류자질로 활용하여 자동분류에 적용하였다. 분류기는 k-최근접 이웃(kNN) 알고리즘을 사용하였고 자동분류의 범주는 도서관에서 도서에 부여한 DDC 300대 강목을 기준으로 하였다. 서명에 대한 단어 임베딩을 적용한 자동분류 실험 결과, Word2vec와 fastText의 Skip-gram 모형이 TF-IDF 자질보다 kNN 분류기의 자동분류 성능에서 더 우수한 결과를 보였다. 세 모형의 다양한 하이퍼파라미터 최적화 실험에서는 fastText의 Skip-gram 모형이 전반적으로 우수한 성능을 나타냈다. 특히, 이 모형의 하이퍼파라미터로는 계층적 소프트맥스와 더 큰 임베딩 차원을 사용할수록 성능이 향상되었다. 성능 측면에서 fastText는 n-gram 방식을 사용하여 하부문자열 또는 하위단어에 대한 임베딩을 생성할 수 있어 재현율을 높이는 것으로 나타났다. 반면에 Word2vec의 Skip-gram 모형은 주로 낮은 차원(크기 300)과 작은 네거티브 샘플링 크기(3이나 5)에서 우수한 성능을 보였다.

Abstract

To analyze the impact of word embedding on book titles, this study utilized word embedding models (Word2vec, GloVe, fastText) to generate embedding vectors from book titles. These vectors were then used as classification features for automatic classification. The classifier utilized the k-nearest neighbors (kNN) algorithm, with the categories for automatic classification based on the DDC (Dewey Decimal Classification) main class 300 assigned by libraries to books. In the automatic classification experiment applying word embeddings to book titles, the Skip-gram architectures of Word2vec and fastText showed better results in the automatic classification performance of the kNN classifier compared to the TF-IDF features. In the optimization of various hyperparameters across the three models, the Skip-gram architecture of the fastText model demonstrated overall good performance. Specifically, better performance was observed when using hierarchical softmax and larger embedding dimensions as hyperparameters in this model. From a performance perspective, fastText can generate embeddings for substrings or subwords using the n-gram method, which has been shown to increase recall. The Skip-gram architecture of the Word2vec model generally showed good performance at low dimensions(size 300) and with small sizes of negative sampling (3 or 5).

19
박용부(PAX자료정보연구소) ; 김태수(연세대학교) 2011, Vol.28, No.3, pp.83-101 https://doi.org/10.3743/KOSIM.2011.28.3.083
초록보기
초록

국제 표준인 ISO 15489와 관련코드에 따르면 공공조직이든 민간조직이든지를 막론하고 안정적인 기록물 분류체계를 구현하게 하는 기능 분류 사용을 권고하고 있다. 기업에서도 이를 따라 업무 수행 기록물을 분류․축적하여 검색․활용할 수 있는 체계를 구축하는 것은 기업 성장을 위해서 중요하다. 따라서 기업의 기록물 분류체계 개발에 적용할 수 있는 분류기준이나 개발 방법론 연구 및 모형의 연구가 반드시 필요하다. 본 연구에서는 우리나라 대기업 3개 회사와 중소기업 4개 회사 등 총 7개의 종합건설기업의 기록물 분류체계 사례연구를 통하여 분류체계의 내용을 비교 분석하였다. 사례연구를 통하여 도출한 분류원칙을 정리 종합하여 핵심적인 건설기록물 분류기준을 제시하고, 건설기록물 분류체계 모형을 도출하기 위하여 대기업 사례기업의 본사조직 및 프로젝트조직의 대분류 및 중분류 항목 구성을 상호 비교하면서 표준적인 본사조직 및 프로젝트조직 기록물 분류 항목을 도출하는 과정을 기술하고 그 결과로 개발된 건설기록물 분류체계 모형을 제시하였다.

Abstract

The international standards, ISO 15489 and Family Code, recommend using functional classification method both in public and private organizations. In this study made a comparative analysis of the details of classification systems through case studies on records classification systems of a total of seven comprehensive construction companies in Korea including three large corporations and four small and medium-size businesses. Findings of this study suggester the direction of developing construction records classification system and its methodology. By summarizing classification standards derived from these case studies, key construction records classification standards were presented.

초록보기
초록

본 연구는 공공도서관과 대형서점 이용자의 요구 및 이용행태가 유사하다는 가정 하에 두 기관의 분류방식의 분석을 통해 이용자의 도서탐색을 용이하게 해주는 요인들을 조사하였다. 본 연구의 목적은 대형서점의 방식으로 공공도서관의 장서를 분류하는 것을 제안하기보다는 공공도서관과 대형서점 분류방식의 어떤 특징이 탐색을 용이하게 하는지를 알아보아, 공공도서관에서 보다 편리한 분류를 제공하기 위해 고려할 점들이 무엇인지를 알아보는데 있다. 이를 위해 먼저 공공도서관 이용자의 도서탐색의 특징과 공공도서관과 대형서점의 분류방식을 조사·분석한 후 설문지법을 통해 이용자의 도서탐색목적과 탐색영역, 탐색기준을 알아보고, 공공도서관과 대형서점의 분류표를 바탕으로 탐색에 더 편리한 분류방식과 그 원인을 분석하였다. 연구결과 이용자들은 대형서점의 분류방식이 도서탐색에 더 편리하다고 생각하고 있음이 밝혀졌다.

Abstract

The research was conducted to investigate factors that facilitate users’ finding books by analyzing classifications in public library and bookstore. This research was based on the assumption that the users’ needs and information behaviors are similar in both public library and bookstore. The main purpose of this study is not to recommend classifying public library collections the way a bookstore does, but to figure out what makes the users’ book finding more convenient by analyzing the classifications. To carry out the research, users’ book finding in public library and classifications of public library and bookstore are analyzed. Then, a survey was conducted to investigate users’ book finding behaviors, degree of convenience in finding books according to different classifications and the causes of the convenience. The results of the research showed that bookstore’s classification was more convenient for the users in finding books.

정보관리학회지