바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 통합 검색, 검색결과: 33
초록보기
초록

최근 수년 동안 영상자료와 음성자료 분석에 대한 이론들이 텍스트자료 검색 시스템과 함께 사용되기 위해서 제안 되어 왔으며 데이터 처리 속도의 급격한 향상과 함께 발전되어 왔다. 일반적 검색 방법들은 단지 텍스트만을 사용하지만 텍스트와 그림을 동시에 사용하는 검색 방법 또한 최근에 제안되어 왔다. 본 연구는 다매체자료의 공통기술표현포맷(CRFMD)이라는 이름으로 화상자료와 텍스트자료를 하나의 자료 구조로 통합하는 방법을 제안하고 있으며, 주어진 테스트자료에 대한 화상자료의 유사성 분석에서 텍스트와 그림의 형태소를 함께 사용하였을 때 현격히 개선되어 짐을 보여주고 있다. CRFMD는 의료문서 검색, WWW 검색, 박물관 소장품 검색과 같은 다양한 분야의 다매체자료 검색 및 처리에 응용될 수가 있을 것이다.

Abstract

In recent years, theories of image and sound analysis have been proposed to work with text retrieval systems and have progressed quickly with the rapid progress in data processing speeds. This study proposes a common representation format for multimedia documents (CRFMD) composed of both images and text to form a single data structure. It also shows that image classification of a given test set is dramatically improved when text features are encoded together with image features. CRFMD might be applicable to other areas of multimedia document retrieval and processing, such as medical image retrieval, World Wide Web searching, and museum collection retrieval.

12
이창열(동의대학교) ; 정의석(고려대학교) 2006, Vol.23, No.4, pp.165-177 https://doi.org/10.3743/KOSIM.2006.23.4.165
초록보기
초록

한국정보문화진흥원이 관리하는 국가 지식정보자원은 여러 기관에 분산되어 있으며, 메타데이터 규격은 통합이 아니라 검색을 위한 개념적 수준의 권고 표준이었다. 그래서 데이터를 연계하거나 통합하는데 많은 문제가 발생하고 있다. 본 논문에서는 여러 기관에 분산된 지식정보자원에 대한 통합을 위하여 기존에 여러 기관에 분산된 메타데이터를 분석하여 문제점을 도출하고 이를 보완하며, 지속적으로 연계 및 통합할 수 있는 표준 모델을 제시하고자 한다.

Abstract

National Knowledge and Information Resources of KADO(Korea Agency for Digital Opportunity and Promotion) were distributed to the several data centers. The metadata for the resources was the conceptual level recommended standard. It was not for the integration, but the retrieval. So it is not easy to integrate to the central metadata DB or connect metadata among the data centers. In this paper, we analysed the metadata of the several data centers and provided the integrated standard model for the central metadata DB.

초록보기
초록

본 연구는 국내 해양전문정보센터에서 효율적인 정보서비스를 위해 필요한 멀티미디어 메타데이터베이스와 디지털도서관 통합정보시스템을 구현할 목적으로 선행연구를 조사하고 분석하였다. 연구대상자원은 해양분야의 인쇄매체, 네트워크자원, 원문화일, 동영상 등을 범위로 하였다. 본 연구에서는 인쇄매체를 포함한 각종 멀티미디어 컨텐츠 자원의 기술과 조직을 위해 LC표준으로 사용하고 있는 MODS를 기반으로 하여 통합정보검색서비스를 제공하고자 하였다. 이를 위해 본 연구에서는 해양분야 각종 정보자원 조사, 멀티미디어 정보처리, MODS 등 메타데이터 기술요소 분석, 메타데이터 분류체계, 시스템 구성 및 검색 구현방안의 연구를 수행하였다.

Abstract

A literature analysis for the planning and realization of the multimedia meta database and digital library's integrated information system was carried out to establish the various oceanographic resources in the Oceanographic Information Center, the first in Korea. The study targeted from printed matter, network resources, full-text and to VOD. The focus of the analysis lies in the providing practical integrated information retrieval service for oceanographic resources based on the framework of effective MODS metadata with network resources description. The analyses included oceanographic resources, multimedia information processing, MODS metadata descriptive elements, metadata classification, system organization, and retrieval for planning and implementation of the multimedia meta database system.

초록보기
초록

최근 연구데이터가 국가자산이라는 인식의 확산으로 원시데이터 관리 및 재사용의 필요성이 이슈이다. 본 연구에서는 데이터의 체계적인 관리를 위해, 스키마 클래스를 상속하는 방식의 메타데이터 설계 모델과 상속을 통해 생성된 스키마 객체들을 대상으로 메타데이터 통합 검색 모델을 제안하였다. 스키마 클래스를 상속한 스키마 객체가 데이터 컬렉션에 1대1의 관계를 갖도록 데이터 아키텍처를 설계하였으며, 제안된 모델의 검증을 위해서 가상 스키마 클래스 및 객체가 시스템적으로 구현 가능함을 증명하였다. 본 연구에서 제안하는 스키마 클래스 상속 및 통합검색 모델은 일반적으로 사용되는 ‘하향식 계층 모델’의 단점을 극복하는 모델로서, 정부 기관에서 생산되는 데이터를 독립적으로 관리하는데 활용될 수 있다고 사료된다.

Abstract

The necessity of the raw data management and reuse is issued by diffusion of the recognition that research data is a national asset. In this paper, a metadata design model by schema class inheritance and a metadata integrated search model by schema objects are suggested for a structural management of the data. A data architecture in which an schema object has an 1:1 relation to the data collection was designed. A suggested model was testified by creation of a virtual schema class and objects which inherit the schema class. It showed the possibility of implement systematically. A suggested model can be used to manage the data which are produced by government agencies because schema inheritance and integrated search model present way to overcome the weak points of the ‘Top-dow Hierarchy model’ which is being used to design the metadata schema.

15
김현희(명지대학교) ; 안태경(대외경제정책연구원) 2003, Vol.20, No.1, pp.417-455 https://doi.org/10.3743/KOSIM.2003.20.1.417
초록보기
초록

온톨로지는 웹자원을 지식화함으로써 정보의 효율적 검색, 통합, 재사용을 도모할 수 있는 새로운 기술인 시맨틱 웹의 구현을 위한 가장 핵심적인 요소 기술로 알려지고 있다. 온톨로지는 사람간에 그리고 서로 다른 응용 시스템간에 지식을 공유하고 재이용하는 방법을 제공하는 기술로서 특정 주제에 관한 지식 용어들의 집합으로서 이들 용어뿐만 아니라 용어간의 의미적 연결 관계와 간단한 추론 규칙을 포함한다. 본 연구에서는 인터넷 웹상에서 국제기구에 관한 정보를 체계적으로 관리하고 검색하기 위해서 국제기구 온톨로지를 설계하고 이 온톨로지에 기반 하여 검색 시스템을 구현해 보고, 이 시스템을 20개의 탐색 질문들을 이용하여 기존의 인터넷 검색엔진과 적합성과 탐색 시간이라는 두 가지 요인을 통해서 비교해 보았다. 실험 결과에 의하면 적합성 측정은 온톨로지 기반 시스템은 평균 4.53, 인터넷 검색엔진은 평균 2.51로 온톨로지 기반 시스템의 적합도가 1.80배 높은 것으로 나타났다. 또한 탐색시간은 온톨로지 기반 시스템은 평균 1.96분, 인터넷 검색엔진은 평균 4.74분으로 인터넷 검색엔진이 온톨로지 기반 시스템 보다 2.42배 정도 더 많은 탐색시간이 필요한 것으로 나타났다.

Abstract

Ontologies are formal theories that are suitable for implementing the semantic web, which is a new technology that attempts to achieve effective retrieval, integration, and reuse of web resources. Ontologies provide a way of sharing and reusing knowledge among people and heterogeneous applications systems. The role of ontologies is that of making explicit specified conceptualizations. In this context, domain and generic ontologies can be shared, reused, and integrated in the analysis and design stage of information and knowledge systems. This study aims to design an ontology for international organizations, and build an Internet web retrieval system based on the proposed ontology, and finally conduct an experiment to compare the system performance of the proposed system with that of Internet search engines focusing relevance and searching time. This study found that average relevance of ontology- based searching and Internet search engines are 4.53 and 2.51, and average searching time of ontology-based searching and Internet search engines are 1.96 minutes and 4.74 minutes.

초록보기
초록

현재 유니코드 CJK 한자코드는 부수 기준 배열방식을 따르고 있어 한자의 한글음가를 기준으로 하는 우리의 문자생활 방식과 차이가 있으며, 우리나라 고유한자나 동형이음어, 이두문자, 그리고 이체자 관계 등을 모두 수록하고 있지 않아 정보시스템에 그대로 적용하기에는 무리가 있다. 따라서 유니코드 기반 정보시스템의 정확한 한자표현 및 한자검색을 위해서는 한자를 포함하는 자료에 대한 정확한 이해를 바탕으로 여러 가지 지원방안을 마련해야 한다. 이러한 측면에서 역사분야 정보검색시스템에서는 한글음가 및 한국에서만 사용되는 동형이음어 처리를 위한 한자-한글음가 사전, 본래 한자의 음가와 다르게 읽히는 한자를 위한 특수용어사전, 이형자와 이체자를 위한 이체자사전, 그리고 유니코드 CJK 통합한자에 등록되어 있지 않은 한자를 위한 신출한자목록을 지원하고 있다.

Abstract

Unicode Han ideograph character set differed from the our principle of the phonetic value ordering in that it followed the principle of KangXi radical-stroke ordering of the characters. Therefore, information system should support ideograph search on precise analysis of materials which consist of korean character (hangul) and ideograph character (hanja). History Information system has been maintaining Hanja(Chinese Character) to Hangul Dictionary, Terminology Dictionary for composition, borrowing, non-ideographic principles, Variant Forms Dictionary, and Recently discovered Chinese Characters List.

초록보기
초록

이 연구는 통합 목록/메타데이터 시스템으로 전 세계에 광범위한 서비스가 제공되고 있는 OCLC의 Connexion 시스템에 관한 유저빌러티를 실험한 연구이다. 유저빌러티 실험은 상업적인 성공을 달성하기 위한 기업들의 노력의 하나로써 시작되었으며 문헌정보학에는 특정한 정보 검색 시스템이 자신의 이용자들에게 좀 더 나은 서비스를 제공하기 위해 시스템 인터페이스를 개선시키고자하는 노력의 일환으로 도입되어 사용되어 왔다. Connexion 서비스는 기본적으로 MARC 기준을 바탕으로 인코딩 되어 메타데이터 서비스를 통합하여 제공하는 대표적인 통합 목록/메타데이터 서비스로 알려져 있다. 실험 전반을 통해서 이용자의 실험과정이 녹화 분석 되었으며, 6개 영역 17 가지 사항의 유저빌러티 문제점들이 파악되었다. 또한 마지막으로 17 가지 사항들에 대한 각각의 개선책들이 조심스럽게 제안되었다.

Abstract

The goal of this study was to examine the relationships between usability and the searching experience, and to uncover where an integrated cataloging and metadata system lay the usability problems of its primary users, catalogers. This study showed that the most important aspect of usability in Connexion lay in the experience of information retrieval system. Also, it showed there are seventeen usability problems to be improved in Connexion. Needless to say, it is most important to note that usability is not an exclusive goal of such an integrated cataloging and metadata system. Other goals such as quality of catalogs, and the reliability of its cataloging and metadata system are equally its concern. This study also suggested more testing on diverse cataloging systems and specific user groups, especially catalogers.

초록보기
초록

도서관 LOD가 확산되지 못하는 현시점에서, 본 연구의 목적은 국내 도서관 LOD의 발행과 구축에 대한 현황을 살펴보고, 그 개선방안을 모색하기 위한 것이다. 사용한 연구방법은 문헌연구, 사례조사, 전문가 면담이다. 본 연구에서 제시된 개선방안은 첫째 도서관은 LOD 구축 대상의 중복을 피하고, 유일하고 특화된 자료를 구축할 필요가 있다. 둘째 도서관은 이용자 요구를 반영한 LOD 서비스를 개발하고, 편리한 LOD 인터페이스를 구현할 필요가 있다. 셋째 도서관은 데이터의 식별체계를 마련하고 전거파일을 구축할 필요가 있다. 넷째 도서관은 사서나 이용자에게 데이터 개방과 연계의 필요성을 인식시키고, 이를 위한 교육과 홍보의 기회를 제공할 필요가 있다. 다섯째 도서관은 통합 검색을 위해 LOD를 활용하고, 도서관 LOD를 검색할 수 있는 통합 플랫폼을 마련할 필요가 있다. 여섯째 도서관은 LOD 발행과 활용을 위한 협력을 강화하고, 실무협의체를 구성할 필요가 있다. 일곱째 정부는 LOD 추진에 대한 지속적인 의지로 강력한 정책을 추진해야 하며, 계속해서 예산 지원을 할 필요가 있다.

Abstract

The purpose of this study is to find the cause and solution of the situation where library LOD does not spread after the introduction of library LOD. Research methods include literature research, case studies, and expert interviews. The improvement plan presented in this study is that first, the library needs to avoid the redundancy of the LOD construction target and build the only and specialized data. Second, libraries need to develop LOD services that reflect user needs and implement convenient LOD interfaces. Third, libraries need to establish identification system of data and build a authority file. Fourth, libraries need to recognize the necessity of data opening and linking to librarians and users, and provide opportunities for education and publicity. Fifth, it is necessary to use LOD for integrated search and to establish an integrated platform for search of library LOD. Sixth, libraries need to strengthen cooperation for LOD issuance and utilization, and form a working-level consultative body. Seventh, the government should pursue strong policies with a continuous commitment to LOD promotion and need to continue to provide budget support.

초록보기
초록

웹, XML, EAD 등을 포함한 새로운 기술과 기술(description)도구의 출현으로 기존의 도서관자료와 기록물을 통합 관리할 수 있고, 정보교환을 위한 다양한 검색보조도구를 모두 수용할 수 있는 내용표준에 대한 필요성이 부각되고 있다. 이에 본 연구에서는 기록물업계의 국제적 동향을 반영하여 ISAD(G) 및 ISAAR(CPF)와 조화를 이루고, MARC과 EAD 등 다양한 검색보조도구의 데이터구조 표현을 수용할 수 있도록 제정된 DACS와 기존의 기술규칙인 APPM2를 비교분석하였다. 분석결과를 토대로 우리나라 기록물 기술규칙 제정시 고려해야 할 사항들을 제시하였다.

Abstract

The advent of new technologies and descriptive tools, including the Web, XML, and EAD, have highlighted the necessity of content standard which can integrate and manage to library materials and archives and accommodate various finding aids for information exchange. This research analyzes both APPM2 and DACS. The former is an old established description rule. On the other hand, the latter keeps step with ISAD(G) and ISAAR(CPF) as adopting the international trend of archives and is able to describe the data structure of a variety of finding aids including MARC, EAD, etc. As a result, it presents the points to take into consideration as making descriptive rules about our archives.

20
최윤수(한국과학기술정보연구원) ; 정창후(한국과학기술정보연구원) ; 조현양(경기대학교) 2011, Vol.28, No.1, pp.89-104 https://doi.org/10.3743/KOSIM.2011.28.1.089
초록보기
초록

대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

Abstract

Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In order to extract these entities automatically from scientific documents at once, we developed a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer and terminology extractor.

정보관리학회지