바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 용어분석, 검색결과: 36
21
정유경(연세대학교 근대한국학연구소 HK연구교수) ; 반재유(연세대학교 근대한국학연구소 HK연구교수) 2019, Vol.36, No.4, pp.7-19 https://doi.org/10.3743/KOSIM.2019.36.4.007
초록보기
초록

본 연구는 국한문 혼용 텍스트를 대상으로 한글 형태소 분석 기법과 한문 어조사를 반영한 색인어 추출기법을 제안하였다. 국한문 혼용체로 작성된 시사총보 논설을 대상으로 해당 시기에 사용된 고유명사 및 한자어 사전을 보완하였으며 한자어 불용어 리스트를 고려하여 색인어를 추출하였다. 본 연구에서 제안한 국한문 색인 시스템은 수작업 색인 결과를 기준으로, 중국어형태소 분석기에 비해 재현율과 정확률 측면에서 상대적으로 높은 성능을 보였으며, 어문법이 확립되지 않은 근현대 시기의 국한문 혼용체를 대상으로 한 첫 번째 색인어 추출기법을 제안하였다는 데에서 연구의 차별점이 있다.

Abstract

The aim of this study is to develop a technique for keyword extraction in Korean-Chinese text in the modern period. We considered a Korean morphological analyzer and a particle in classical Chinese as a possible method for this study. We applied our method to the journal “Sisachongbo,” employing proper-noun dictionaries and a list of stop words to extract index terms. The results show that our system achieved better performance than a Chinese morphological analyzer in terms of recall and precision. This study is the first research to develop an automatic indexing system in the traditional Korean-Chinese mixed text.

22
심지영(연세대학교 대학도서관발전연구소) 2023, Vol.40, No.4, pp.279-306 https://doi.org/10.3743/KOSIM.2023.40.4.279
초록보기
초록

본 연구는 다양한 관점의 이용요구가 혼재되어있는 독서자료의 속성을 파악하기 위해, 도서의 동시이용(동시대출, 동시구매) 데이터에 기반하여 독서자료의 선택 및 이용과 관계된 서지적 속성을 분석하였다. KDC 주제, 독자대상, 이용자 연령 관련 26개 하위 속성 단위로 구분하여 서지적 속성 용어의 동시출현행렬을 생성하고 네트워크 분석을 수행한 결과, 독서자료의 서지적 속성의 세부 내용 및 두드러진 매개 역할을 파악하였다. 본 연구의 결과는 향후 도서관 OPAC을 비롯한 독서정보 시스템의 패싯 설계에 도움이 될 것이다.

Abstract

This study analyzed bibliographic attributes related to the selection and use of reading materials based on data on books borrowed or purchased together in order to understand the properties of reading materials that have complex user needs from various perspectives. As a result of creating co-occurrence matrices of bibliographic attribute terms by dividing them into 26 sub-attribute units related to KDC main class, target reader, and user age, and performing network analyses, the details and prominent mediating role of bibliographic attributes of reading materials were identified. The results of this study will be helpful in designing facets of reading information systems, including library OPAC, in the future.

초록보기
초록

웹 문서 검색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

Abstract

For the users of information retrieval systems, natural language query is the more ideal interface, compared with keyword and boolean expressions. This paper proposes a retrieval technique with expanded keyword from syntactically-analyzed structures of natural language query as user input. Through the steps combining or splitting the compound nouns based on syntactic tree traversal of the query, and expanding the other-formed or shorten-formed into multiple keyword, it can enhance the precision and correctness of the retrieval system.

24
고영만(성균관대학교) ; 송인석(한국과학기술정보연구원) 2011, Vol.28, No.1, pp.145-170 https://doi.org/10.3743/KOSIM.2011.28.1.145
초록보기
초록

본 연구는 연구문헌의 지식구조를 반영하는 의미기반 지식조직체계의 실험적 모형을 제시하는 것을 목적으로 한다. 이를 위해 한국연구재단의 기초학문자료센터에 대한 사례분석을 하였다. 기초학문자료센터 연구성과물 DB와 학술용어 DR의 개념클래스 및 인스턴스를 대상으로 연구문헌의 지식구조를 파악하였으며, 기초학문자료센터 시스템의 학술적 이해형성 기능을 분석하였다. 또한 연구문헌의 지식구조와 색인어의 관계를 분석하였다. 이러한 분석을 통해 지식구조와 색인어의 관계구조, 26개의 연구문헌 지식구조 공리 및 11개의 의미관계 추론규칙으로 구성되는 온톨로지 모형, 즉 연구문헌의 지식구조와 그 의미관계에 의한 실험적 지식조직체계 모형을 제시하였다.

Abstract

The purpose of this paper is to suggest a pilot model of knowledge organizing system which reflects the knowledge structure of research papers, using a case analysis on the “Korean Research Memory” of the National Research Foundation of Korea. In this paper, knowledge structure of the research papers in humanities and social science is described and the function of the “Korean Research Memory” for scholarly sense-making is analysed. In order to suggest the pilot model of the knowledge organizing system, the study also analysed the relation between indexed keyword and knowledge structure of research papers in the Korean Research Memory. As a result, this paper suggests 24 axioms and 11 inference rules for an ontology based on semantic relation of the knowledge structure.

25
최재황(경북대학교) ; 조현양(경기대학교) 2005, Vol.22, No.3, pp.307-326 https://doi.org/10.3743/KOSIM.2005.22.3.307
초록보기
초록

오픈 액세스 운동은 출판된 과학적 연구결과물을 비용 없이 누구나가 인터넷을 통해 이용 가능해야 한다는 원칙을 지지하는 운동이다. 오픈 액세스라는 용어는 이 운동의 폭넓은 의미로 사용되고 있으며, BOAI에서는 이 목표를 달성하기 위해 ‘셀프 아카이빙’과 ‘오픈 액세스 저널’ 두 가지의 전략을 제시하고 있다. 본 연구에서는 최근 논의되고 있는 다양한 오픈 액세스 운동들의 개요와 수행전략 등을 소개하고, 사서, 대학, 출판사, 기금단체, 학회, 정부)들의 역할과 대응전략을 BOAI에서 제시하고 있는 두 전략의 관점에서 분석하고 있다.

Abstract

Open access movement supports the principle that the published output of scientific research should be available to everyone without charge. The term open access is used in the broad context of the wider movement. To achieve the objectives of open access to scholarly journal literature, BOAI (Budapest Open Access Initiative) recommends using two complementary strategies: ‘self-archiving’ in institutional/disciplinary repositories and ‘open access journals.’ This study introduces the strategies of open access movements and analyzes the ways to help the cause of open access by academic stakeholders (i.e., researchers, librarians, universities, publishers, foundations, learned societies, and government) from the perspective of two BOAI strategies.

초록보기
초록

본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.

Abstract

This study compared and analyzed 15 CBMR (Content-based Music Retrieval) systems accessible on the web in terms of DB size and type, query type, access point, input and output type, and search functions, with reviewing features of music information and techniques used for transforming or transcribing of music sources, extracting and segmenting melodies, extracting and indexing features of music, and matching algorithms for CBMR systems. Application of text information retrieval techniques such as inverted indexing, N-gram indexing, Boolean search, truncation, keyword and phrase search, normalization, filtering, browsing, exact matching, similarity measure using edit distance, sorting, etc. to enhancing the CBMR; effort for increasing DB size and usability; and problems in extracting melodies, deleting stop notes in queries, and using solfege as pitch information were found as the results of analysis.

초록보기
초록

조선총독부 공문서는 근대사 연구의 가장 핵심적인 정보원이다. 이 연구의 목적은 조선총독부 공문서를 원활히 활용할 수 있도록 지원하는 기능분류체계를 개발하기 위한 원칙과 단계를 제시하는 것이다. 우선, 기능적 분류체계를 위한 이론적 근거를 마련하기 위해 기록물 분류의 개념과 역할, 분류 원칙에 대해 살펴보고, ‘기능적 출처’ 개념 도입의 필요성을 제시하였다. 또한 조선총독부 공문서 분류에 왜 기능분류가 적합한지를 살펴보았고, 기능분류 사례와 그 시사점도 살펴보았다. 이러한 이론적 연구와 조선총독부 조직 및 기능 분석 결과를 토대로 조선총독부 기록물을 위한 분류체계 개발을 위한 원칙을 설정하였다. 아울러 개념화, 용어화, 기호화를 고려한 개발모형을 도출하였으며, 분류표와 함께 시소러스를 연계 구축할 수 있는 방안도 제시하였다.

Abstract

Public records, produced during the period of Government-General of Chosun, are essential sources for Korean modern history research. The purpose of this study is to provide a guideline for developing function-based classification scheme for the records. This present paper begins with analyzing archival principles regarding the function-based classification, and examines the problems of current arrangement practices. Based on these analyses, it suggests a guideline for constructing a classification system and a functional thesaurus for the public records of Government-General of Chosun. This guideline also covers functional analysis process and some considerations of different classification aspects which are conceptual, verbal and notational.

28
정힘찬(전북대학교) ; 김태영(전북대학교) ; 김용(전북대학교) ; 오효정(전북대학교) 2017, Vol.34, No.2, pp.137-158 https://doi.org/10.3743/KOSIM.2017.34.2.137
초록보기
초록

재난은 국민의 생명․신체․재산에 직접적인 영향을 미치는 사건으로, 재난 발생 시 신속하고 효과적인 대응을 위해서는 관련 정보들을 효율적으로 공유, 활용하는 협조 과정이 무엇보다도 중요하다. 현재 재난안전 유관기관별로 다양한 재난안전정보가 생산 및 관리되고 있지만, 각 기관별로 개별적인 용어와 의미를 정의하여 활용하고 있다. 이는 재난안전정보를 검색하고 접근하려는 실무자 입장에서 큰 걸림돌이며, 기관별 정보 활용도를 저해시키는 요인 중에 하나이다. 이러한 문제점을 해결하기 위해 재난안전정보의 통합적 관리를 위한 어휘자원의 표준화 작업의 선행 연구로, 본 연구에서는 재난안전 유관기관에서 관리하고 있는 어휘자원의 현황분석을 수행하였다. 또한 수집된 어휘자원을 대상으로 정보제공자 및 이용자 관점에서의 활용도 분석을 통해 어휘 그룹별 특성을 파악하고 이에 기반해 재난안전정보 관리를 위한 활용방안을 제안하였다.

Abstract

Disaster has a direct influence on the lives of the people, the body, and the property. For effective and rapid disaster responses, coordination process based on sharing and utilizing disaster information is the essential requirement Disaster and safety control agencies produce and manage heterogeneous information. They also develop and use word dictionaries individually. This is a major obstacle to retrieve and access disaster and safety information in terms of practitioners. To solve this problem, standardization of lexical resources related disaster and safety is essentially required. In this paper, we conducted current status analysis about lexical resources in disaster and safety domain. Consequently, we identified the characteristics according to lexical groups. And then we proposed the utilization plan of lexical resources for disaster and safety information management.

초록보기
초록

최근 인터넷의 급속한 보급과 네트워크자원을 비롯한 전자자료의 급증으로 목록분야에 있어 환경이 크게 급변하고 있다. IFLA에서는 이와 같은 변화에 대응하여 전자자료와 계속자료를 위한 서지기술법으로 ISBD(ER)과 ISBD(CR)을 새로이 제정하였다. AACR의 개정을 위한 합동운영위원회(JSC: Joint Steering Committee for Revision of AACR)에서는 이러한 상황을 반영하여 2002년 AACR2R 개정판을 발간하였다.본 연구에서는 JSC를 중심으로 진행된 그 동안의 경과과정과 AACR2R 2002 개정판의 개정내용, 특히 조항 0.24의 개정의의, 서지적 자료의 구분원리, 제3장(지도자료), 제9장(전자자료), 제12장(계속자료)의 개정내용, 새로운 용어정의, 그리고 MARC 21과 KORMARC과의 관계를 비교 분석하고자 한다.

Abstract

Due to rapid internet supply and the increase of electronic resources including network resources, there has been a sudden change in cataloguing fields. To deal with rapid changes, IFLA revised cataloguing rules for electronic and continuing resources; ISBD(ER) and ISBD(CR). JSC(Joint Steering Committee for Revision of AACR) has published the 2002 revision of Anglo-American Cataloguing Rules, Second Edition. Major changes in both content and format make the release of the 2002 revision momentous. This study is to analyze activities of JSC and rule revisions of AACR2R 2002 edition, expecially in regards with concepts of change to rule 0.24, new categories of bibliographic materials, changes to chapter 3(cartographic materials), chapter 9(electronic materials), chapter 12(continuing materials), definition of a new terminologies, changes in MARC 21 coding, and issues concerned with revision of KORMARC.

30
이혜경(경북대학교 문헌정보학과) ; 이용구(경북대학교) 2023, Vol.40, No.2, pp.157-182 https://doi.org/10.3743/KOSIM.2023.40.2.157
초록보기
초록

이 연구는 국립중앙도서관에서 개발한 주제명표목표의 구성 현황과 2003년부터 2022년까지 국가서지 1,218,867건에 부여된 주제명의 현황을 분석하였다. 그 결과 첫째, 주제명표목표의 전체 주제명 중 우선어는 257,103개로 전체 용어의 50.2% 이상이었으며, 외국어가 169,466개(33.1%), 비우선어가 61,442개(12.0%) 등으로 구성되었다. 우선어 중에 활용된 주제명은 57,312종으로 22.3%에 해당하며 이 중 54.7%인 31,351종의 주제명은 부여횟수 5회 미만으로, 전체 중에서 적은 수의 주제명만을 활용하고 있음을 파악하였다. 둘째, 관계지시기호의 빈도는 RT, BT, NT 순으로 나타났으며, 최상위 주제명은 12,602종, 최하위 주제명은 143,704종이었고 최대 심도는 17수준이었다. 셋째, 서지 당 평균 1.72회의 주제명이 부여되었으며, 자료의 내용이 특정적일수록 주제명 부여 횟수가 많아지고 심도도 깊어지는 경향을 보였다. 그리고 최근에 입력한 서지일수록 부여된 주제명 수가 증가하였고 심도도 깊어졌으나, KDC 주류에 따라 서지 당 부여된 주제명 수는 편차가 있는 것으로 나타났다. 현황 분석을 통해 결과적으로 주제명표목표가 수록한 용어의 범위에 대한 평가와 주제명의 계층 관계 및 심도의 재정비가 요구되며, 주제명표목표의 세목 개발을 통한 개선이 필요한 것으로 판단하였다.

Abstract

This study analyzed the structure and utilization of subject headings in the National Library of Korea Subject Headings List (NLSH) based on an analysis of subject headings assigned to 1,218,867 national bibliographies from 2003 to 2022. The findings of the study are as follows: Firstly, among all subject headings in the NLSH, there were 257,103 preferred terms, accounting for 50.2% of the total terms. Foreign language terms constituted 33% (169,466), while non-preferred terms comprised 12% (61,442). Among the preferred terms, 57,312 subject headings were used, accounting for 22.3%. However, it was observed that 54.7% (31,351) of these subject headings were assigned less than 5 times, indicating that only a small number of subject headings were frequently utilized. Secondly, the frequency of relationship indicators appeared in the order of RT, BT, and NT. The NLSH consisted of 12,602 top-level subject headings and 143,704 lowest-level subject headings, with a maximum depth of 17 levels. Thirdly, on average, 1.72 subject headings were assigned per bibliographic record. The number of subject headings assigned and the depth of the hierarchy increased for materials with more specific contents. Recent bibliographic records have been assigned more subject headings and deeper into the hierarchy of the NLSH. It was also found that the number of subject headings assigned per bibliography varied depending on the main class of KDC. Based on the findings, it is recommended to evaluate the coverage of terms in the NLSH, reorganize hierarchical relationships and depth of subject headings, and enhance the development of subdivisions within the NLSH.

정보관리학회지