바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 용어분석, 검색결과: 5
초록보기
초록

Abstract

The purpose of this study is to identify topic areas of academic library research using two informetric methods; word clustering and Pathfinder network. For the data analysis, 139 articles published in major library and information science journals from 2005 to 2009 were collected from the Korean Science Citation Index database. The keywords that represent research topics were gathered from two sections: an abstract and titles in references. Results showed that reference titles usefully represent topics in detail, and combining abstracts and reference titles can produce an expanded topic map.

2
최윤수(한국과학기술정보연구원) ; 정창후(한국과학기술정보연구원) ; 조현양(경기대학교) 2011, Vol.28, No.1, pp.89-104 https://doi.org/10.3743/KOSIM.2011.28.1.089
초록보기
초록

대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

Abstract

Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In order to extract these entities automatically from scientific documents at once, we developed a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer and terminology extractor.

초록보기
초록

OPAC으로 대표되던 도서관 목록에 많은 변화를 가져오고 있는 차세대 목록의 핵심 개념인 자원 발견 인터페이스 중의 하나인 패싯 내비게이션은 지나치게 많은 검색 결과를 이용자의 이용 편의에 맞는 하위 집합으로 세분하는 것이다. 이 연구에서는 자원 발견 인터페이스를 도입하여 사용하고 있는 국내외 9개 도서관의 패싯 내비게이션을 분석하였다. 패싯을 구성하는 용어가 지나치게 포괄적이거나 이용자가 사용하는 개념과 달라서 이용에 어려움을 줄 수도 있음을 알 수 있었다. 패싯 내비게이션 서비스를 이용자에게 제공하기 위해서는 패싯에서 사용하는 용어 사용의 일관성을 유지하는 것이 중요하며, 저자 패싯의 분석에서는 전거통제의 정확성의 정도를 파악할 수 있었다. 그리고 패싯 내비게이션을 도입할 공공도서관에서는 이용자 계층에 맞는 패싯을 포함시키는 것을 고려해야 하고, 대학도서관에서는 자원 유형을 상세하게 전개하는 것을 고려해야 한다.

Abstract

Faceted navigation has brought a lot of changes to traditional library catalog and is one of the resource discovery interfaces in next-gen library catalog. Faceted navigation usually divides too much retrieved results into some relevant facets for user's convenient navigation. The faceted navigation of 9 libraries adopting resource discovery interfaces was analyzed in this article. The terms are much broader or different from the users' terms so that the users can't properly use the facets. It is essential to maintain consistency with using the terms to provide users with faceted navigation service and this study has found how exactly authority work was done in analysis of the author facets. Also, public libraries introducing faceted navigation need to consider including some facets for various users and university libraries need to consider detailed division of resource types.

4
고영만(성균관대학교) ; 송인석(한국과학기술정보연구원) 2011, Vol.28, No.1, pp.145-170 https://doi.org/10.3743/KOSIM.2011.28.1.145
초록보기
초록

본 연구는 연구문헌의 지식구조를 반영하는 의미기반 지식조직체계의 실험적 모형을 제시하는 것을 목적으로 한다. 이를 위해 한국연구재단의 기초학문자료센터에 대한 사례분석을 하였다. 기초학문자료센터 연구성과물 DB와 학술용어 DR의 개념클래스 및 인스턴스를 대상으로 연구문헌의 지식구조를 파악하였으며, 기초학문자료센터 시스템의 학술적 이해형성 기능을 분석하였다. 또한 연구문헌의 지식구조와 색인어의 관계를 분석하였다. 이러한 분석을 통해 지식구조와 색인어의 관계구조, 26개의 연구문헌 지식구조 공리 및 11개의 의미관계 추론규칙으로 구성되는 온톨로지 모형, 즉 연구문헌의 지식구조와 그 의미관계에 의한 실험적 지식조직체계 모형을 제시하였다.

Abstract

The purpose of this paper is to suggest a pilot model of knowledge organizing system which reflects the knowledge structure of research papers, using a case analysis on the “Korean Research Memory” of the National Research Foundation of Korea. In this paper, knowledge structure of the research papers in humanities and social science is described and the function of the “Korean Research Memory” for scholarly sense-making is analysed. In order to suggest the pilot model of the knowledge organizing system, the study also analysed the relation between indexed keyword and knowledge structure of research papers in the Korean Research Memory. As a result, this paper suggests 24 axioms and 11 inference rules for an ontology based on semantic relation of the knowledge structure.

초록보기
초록

이 연구는 주요 국가의 국가도서관 목록에 나타나고 있는 한국관련 자료의 실태분석을 위해 한국관련 주제명의 주제별 특성과 레코드의 소장상황, 그리고 한국입장에서 쟁점이 되고 있거나 관심이 높은 일부 주제명을 중심으로 그 특성을 비교 분석한 것이다. 연구결과를 요약하면 아래와 같다. 첫째, 미국 등 일부 국가를 제외하고 대부분의 국가도서관에 저장되어 있는 한국관련 레코드가 절대적으로 부족하며, 일본관련 레코드와 비교할 때 대략 2∼3배 이상 적게 나타나고 있다. 둘째, 한국관련 레코드의 세부항목별 주제 분포에서 대체로 ‘역사’와 ‘경제’가 가장 많게 나타나고 있지만 대부분의 국가에서 ‘한국전쟁’이 많은 비중을 차지하고 있는 것은 한국에 대한 외국인의 인식이 왜곡될 가능성이 높다고 생각된다. 셋째, 한국관련 레코드가운데 대부분이 북한에 비해 남한관련 레코드가 1.5∼5배 이상 많게 나타나고 있지만 폴란드, 이탈리아, 멕시코는 오히려 북한이 많게 나타나고 있다. 넷째, 한국관련 주제명 가운데 ‘태권도’, ‘김치’, ‘독도’, ‘동해’ 등의 용어는 국가마다 미묘한 차이점이 드러나고 있지만, 우리의 주변 국가를 제외하고는 대부분 미국의회도서관의 주제명표기와 거의 일치하고 있다. 다섯째, 특히 우리의 인접국인 중국과 일본의 경우, 자국의 정치적, 역사적 입장을 철저하게 반영하여 나타냄으로써 일부 주제명의 표기에 문제점이 발견되고 있다.

Abstract

This research was conducted to analyze the actual condition of data related to Korea shown in the catalog of 15 countries. This study was to compare the subject characteristics of Korea-related subject heading, record collection, and the characteristics of several subject heading, which has been a major issue. The results are as follows. To begin with, Korea-related record in most other national libraries runs absolutely short except for some countries like United States. Korea-related record is generally 2 to 3 times less than Japan related record. Second, referring to the subject distribution in sub criteria of Korea-related record, subject related to ‘history’ and ‘economy’ is shown in the highest rate. Considering that ‘Korean war’ shows the highest rate in Italy and Canada, we can consider that this may cause the distortion of the perception of Korea. Third, in the case of Korea-related record, the record of South Korea is 1.5 to 5 times more than that of North Kore, except for some countries like United States. Forth, regarding the subject headings, the terms such as ‘Taekwondo’, ‘Kimchi’, ‘Tok-do’, ‘Tong-hae’ have different meanings in different countries. However, these terms agree to LCSH in most countries except for neighboring countries. Fifth, in case of China and Japan, the subject headings in reference to political and historical position are raising some problems.

정보관리학회지