바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Information retrieval, 검색결과: 6
초록보기
초록

포털사이트는 검색엔진을 넘어 사이버스페이스 자체를 의미할 정도로 개념과 영역이 확대되었다. 일반인들뿐만 아니라, 필요로 하는 학술정보가 서비스되기 때문에 연구자도 포털사이트를 많이 이용한다. 그동안 포털의 검색은 얼마나 많은 정보를 검색하게 해 줄 것인가 하는 양적인 면에 관심을 두었다. 그러나 최근에는 검색의 질에 보다 관심이 많아지고 있다. 이 논문은 포털이 제공하는 학술정보검색의 문제점을 분석하고, 비교적 신뢰성을 인정받는 사전 서비스와 학술정보를 연계함으로써 학술정보검색의 질을 향상하기 위한 시범적인 시도이다. 즉, 검증되고 압축적으로 정리된 사전의 표제어와 해당 표제어를 키워드로 하는 권위 있는 연구 성과를 연계시킴으로써, 사전을 검색할 때 주제어 관련 연구 성과까지 검색할 수 있게 하는 방안을 제시하고자 한다.

Abstract

Internet portals have been revolutionized not only as simple search engines but also as a new space for the Internet users. They have developed to give satisfying search results for academic information users. academic fields. However, their attention was given to the quantity rather than the quality of the results. This tendency is now changing. This study addresses the problems in the search process using the current portal sites and presents an integrated scholarly information service where users can access more organized and trustworthy information linked with online technical keyword dictionary. When a user enter a keyword on a portal site, he/she can access to high quality scholarly information resources linked with keyword. This could assure the user to get an expanded knowledge with confirmation.

초록보기
초록

Abstract

The ability of the searcher to express their information problem to an information retrieval system is fundamental to the retrieval process. Query by visual example is the principal query paradigm for expressing queries in a content-based image retrieval environment yet there is little empirical evidence to support its efficacy in facilitating query formulation. The aim of this research was to investigate the usability of the query by colour method in supporting a range of information problems in order to contribute to the gap in knowledge regarding the relationship between searchers’ information problems and the query methods required to support efficient and effective visual query formulation. The results strongly suggest that the query method does not support visual query formulation and that there is a significant mismatch between the searchers information problems and the expressive power of the retrieval paradigm.

초록보기
초록

Abstract

This study constructed an ontology targeting journal articles and evaluated its performance. Also, the performance of a triple structure ontology was compared with the knowledge base of an inverted index file designed for a simple keyword search engine. The coverage was three years of articles published in the Journal of the Korean Society for Information Management from 2007 to 2009. Protégé was used to construct an ontology, whilst utilizing an inverted index file to compare performance. The concept ontology was manually established, and the bibliography ontology was automatically constructed to produce an OWL concept ontology and an OWL bibliography ontology, respectively. This study compared the performance of the knowledge base of the ontology, using the Jena search engine with the performance of an inverted index file using the Lucene search engine. As a result, The Lucene showed higher precision rate, but Jena showed higher recall rate.

초록보기
초록

현재 메타데이터와 폭소노미는 정보의 표현과 조직, 검색에 널리 사용되고 있다. 그러나 각각이 지닌 고유한 특성과 장점을 모두 활용하기 위해 이 두 가지 방식을 연결시키기 위한 연구가 많이 수행되고 있다. 본 연구에서는 폭소노미와 메타데이터가 지닌 공통점을 활용해 이 두 가지 방식을 마이크로컨텐츠를 이용해 연결시켜 정보자원의 활용을 극대화하는 방안을 제안하고 있다. 마이크로컨텐츠는 폭소노미의 동적인 특성과 메타데이터의 명확한 체계를 모두 반영한 구조로서, 실질적인 태그나 요소의 값을 갖지 않는 개념적인 구조이다. 이 마이크로컨텐츠를 이용한 접근방법은 폭소노미 태그와 메타데이터 구조에서 제공받은 접근점을 통해 이들 두 가지 방식의 단점을 상호보완하고 장점을 극대화하는데 활용될 수 있다.

Abstract

Metadata and folksonomy are two main approaches in representing, organizing, and retrieving resources in the current information environment. Many researches have conducted studies to combine of metadata and folksonomy in order to utilize the strengths of both approaches. This research proposed an approach to utilize both metadata and folksonomy in representing resources by using microcontents. Microcontents in this research is a conceptual structure that reflects dynamic characteristics of folksonomy and the structure of metadata. By connecting folksonomy with metadata through this microcontents structure, both approaches can maximize their strengths and minimize their weaknesses in representing, organizing, and retrieving resources.

5
최윤수(한국과학기술정보연구원) ; 정창후(한국과학기술정보연구원) ; 조현양(경기대학교) 2011, Vol.28, No.1, pp.89-104 https://doi.org/10.3743/KOSIM.2011.28.1.089
초록보기
초록

대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

Abstract

Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In order to extract these entities automatically from scientific documents at once, we developed a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer and terminology extractor.

초록보기
초록

서지레코드의 기술에 있어서 책임표시는 저작의 지적 책임 소재를 밝혀 주고 접근점을 구성하는 바탕이 된다. 그런데 목록규칙에서는 책임표시를 주된 역할과 부차적 역할로 나누고, 이에 따라 기술방법을 달리 하는데 치중하는 문제점이 있다. 역할의 중요도를 판단하여 순서를 매기기보다는 역할 자체를 구조화시키는 것이 우선이기 때문이다. 또한 목록에서 주저자를 선정한 것은 책임성에 따른 것보다는 저록의 작성이나 배열과 관련된 실무적 결정이었다. 이에 본 연구에서는 역할 자체를 구조화함으로써 책임표시 기술방식을 개선하고자 하였다. 즉, 역할어를 체계적으로 기술하여 서지레코드에서 분산되거나 접근점에서 제외된 책임표시를 집중시키는 것이다. 나아가 이를 통해 책임표시 정보의 품질을 제고하고, 역할어를 검색의 패싯이나 전거레코드의 추가적인 식별 정보로도 활용할 수 있음을 제안하였다.

Abstract

Statement of responsibility in bibliographical records plays a key role in clarifying intellectual responsibility of the work, and it also plays a role in making up access points. However, cataloging rules for the statement of responsibility mostly deal with the distinction between the principal role and minor roles. This becomes a problem because the responsibility type itself is more important than the order of the types. For this reason, in this paper I will explore improvements of the description methods of statement of responsibility by organizing the role indicators. Namely, using the role indicators more effectively than the current description methods do, we can collocate the dispersed statements of responsibilities. The role indicators can also be used for an author facet in information retrieval and can provide additional information for authority control.

정보관리학회지