바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 웹검색, 검색결과: 5
1
이지숙(NHN㈜) ; 정영미(연세대학교) 2007, Vol.24, No.3, pp.201-218 https://doi.org/10.3743/KOSIM.2007.24.3.201
초록보기
초록

이 연구에서는 TREC이 제시한 토픽 검색의 정의에 따라 질의에 적합한 웹 사이트를 검색하는 효과적인 토픽 검색 알고리즘을 제안하고 실험을 통해 그 성능을 평가하였다. 이 연구의 토픽 검색 알고리즘은 먼저 질의에 대한 웹 페이지 검색 결과로부터 적합한 웹 사이트를 선정한 다음, 선정된 사이트의 구조를 이용하여 질의에 대한 적합성 점수를 산출한다. TREC의 .GOV 실험 문헌 집단과 TREC-2004 실험의 질의 및 적합문헌 리스트를 이용한 검색 실험 결과 이 토픽 검색 알고리즘은 상위 10위 안에 최소 2개 이상의 적합 사이트를 검색하여 비교적 높은 수준의 성능을 보였다. 또한 TREC-2004의 적합문헌 리스트 분석을 통해 적합문헌 선정에 토픽 검색의 정의가 엄격하게 적용되지 않은 경우가 있음을 확인하고, 수정된 적합문헌 리스트를 이용하여 토픽 검색 성능을 재평가한 결과 이 연구에서 제안한 토픽 검색 알고리즘의 성능이 월등히 향상되었다.

Abstract

This study proposes a topic distillation algorithm that ranks the relevant sites selected from retrieved web pages, and evaluates the performance of the algorithm. The algorithm calculates the topic score of a site using its hierarchical structure. The TREC .GOV test collection and a set of TREC-2004 queries for topic distillation task are used for the experiment. The experimental results showed the algorithm returned at least 2 relevant sites in top ten retrieval results. We performed an in-depth analysis of the relevant sites list provided by TREC-2004 to find out that the definition of topic distillation was not strictly applied in selecting relevant sites. When we re-evaluated the retrieved sites/sub-sites using the revised list of relevant sites, the performance of the proposed algorithm was improved significantly.

2
김수경(한밭대학교) ; 안기홍(한밭대학교) 2007, Vol.24, No.3, pp.119-147 https://doi.org/10.3743/KOSIM.2007.24.3.119
초록보기
초록

시맨틱 웹 응용의 구현에 있어 가장 중요한 기술이 시맨틱 웹의 특징을 만족하는 웹 온톨로지의 구축임에도 불구하고, 대부분 웹 온톨로지의 구축에 적용된 기법들이 시맨틱 웹과 웹 온톨로지의 특징을 만족하지 못함에 따라 시맨틱 웹 응용의 발전과 보급이 미흡하다. 따라서 본 연구는 온톨로지와 웹 온톨로지 관련 연구들을 분석하여 시맨틱 웹을 위한 웹 온톨로지의 특징들을 파악하고, 기존 온톨로지 구축과 웹 온톨로지 구축을 위해 제안된 구축 기법들을 비교 분석하여 시맨틱 웹과 웹 온톨로지의 특징에 적합한 웹 온톨로지 구축 기법을 제안한다. 실험은 제안된 방법에 따라 서술 논리와 SWRL의 표현 방법을 이용한 공리 규칙을 기반으로 온톨로지를 모델링하여 추론 기반의 웹 온톨로지를 구축하였으며, 구축된 온톨로지의 검증을 위한 온톨로지 추론 실험을 통해 온톨로지 성능을 검증하였다. 구축된 웹 온톨로지를 기반으로 하는 시맨틱 웹 응용의 예로 지능형 이미지 검색 시스템을 실험 시스템으로 구현하였다. 실험 시스템의 성능 평가를 위해 비교 대상 시스템과의 검색 실험 결과, 실험 시스템이 재현율과 정확율에 있어 우수한 성능을 보여주었다.

Abstract

Actually a diffusion of a Semantic Web application and utilization are situations insufficient extremely. Technology most important in Semantic Web application is construction of the Ontology which contents itself with characteristics of Semantic Web. Proposed a suitable a Method of Building Web Ontology for characteristics of Semantic Web and Web Ontology as we compared the existing Ontology construction and Ontology construction techniques proposed for Web Ontology construction, and we analyzed. And modeling did Ontology to bases to Description Logic and the any axiom rule that used an expression way of SWRL, and established Inference-based Web Ontology according to proposed ways. Verified performance of Ontology established through Ontology inference experiment. Also, established an Web Ontology-based Intelligence Image Retrieval System, to experiment systems for performance evaluation of established Web Ontology, and present an example of implementation of a Semantic Web application and utilization. Demonstrated excellence of a Semantic Web application to be based on Ontology through inference experiment of an experiment system.

초록보기
초록

XML 웹 문서 포맷은 문헌 내에 내용뿐만 아니라 의미 있는 논리적인 구조 정보를 포함할 수 있어, 검색에서 문서의 내용 뿐만 아니라 구조로 접근하는 것을 제공한다. 그래서 본 연구의 목적은 XML 검색에 있어 내용 검색에 추가적인 요소로 사용된 구조적인 제한이 얼마나 유용한지를 실험하기 위해 내용만으로 검색한 결과와 내용과 구조적인 제한을 가지고 검색한 결과간의 성능을 비교하였다. 이 실험은 자체 개발된 단말노드 언어모델기반의 XML 검색시스템을 사용하였고 INEX 2005의 ad-hoc트랙에 참여하여 모든 실험방법과 INEX 2005의 실험 문헌 집단을 사용하였다.

Abstract

XML documents format on the Web provides a mechanism to impose their content and logical structure information. Therefore, an XML processor provides access to their content and strucure. The purpose of this study is to investigate the usefulness of structural hints in the leaf node language model-based XML document retrieval. In order to this purpose, this experiment tested the performances of the leaf node language model-based XML retrieval system to compare the queries for a topic containing only content-only constraints and both content constrains and structure constraints. A newly designed and implemented leaf node language model-based XML retrieval system was used. And we participated in the ad-hoc track of INEX 2005 and conducted an experiment using a large-scale XML test collection provided by INEX 2005.

4
이수영(미국 미시간대학교 정보대학원) 2007, Vol.24, No.2, pp.29-44 https://doi.org/10.3743/KOSIM.2007.24.2.029
초록보기
초록

본 연구는 왜 이용자들이 정보탐색에 많은 노력을 기울이지 않는가를 알아보기 위하여 교육심리학분야에서 개발된 정신적 노력에 관한 개념을 웹 검색엔진과 도서관시스템 정보탐색행위에 적용하여 보았다. 실험실 환경에서 학부학생 총 15명을 대상으로 탐색실험을 실시하여, 탐색전 설문조사, 탐색후 설문조사, 탐색후 인터뷰, 생각 소리내어 말하기 (think-aloud), 로그데이터를 통하여 데이터를 수집하였다. 연구결과, 이용자들은 웹 검색엔진을 도서관시스템에 비하여 휠씬 쉽다고 인지하며 스스로 탐색에 대한 높은 자신감을 가지고 있었다. 이러한 이용자성향은 이용자들이 웹 탐색에 도서관탐색때보다 더 적은 노력을 기울이는 것과 깊은 연관성을 가지고 있는 것으로 나타났다. 이용자들의 정신적 노력에 관한 개념은 결과적으로 이용자들의 정보탐색 행위와 경험을 설명하는데 매우 유용한 것으로 밝혀졌다.

Abstract

The purpose of this study was to explore whether the concept of amount of invested mental effort (AIME) developed in the field of educational psychology can help explain why people put so little effort into online searching. In this experimental study, two information retrieval systems a web search engine and a university library system were used to make a comparison. The data were collected from 15 undergraduate students through background questionnaires, think-aloud protocols, search logs, post-search questionnaires, and post-task interviews. The findings indicate that perception of the webs easy-ness and high levels of self confidence in searching capability led the subjects to put less effort into web searching than they do into library system searching. In addition, the perceived difficulty of search task influenced the extent of mental effort invested. The AIME proved a useful framework for understanding search behavior and user experience for both web search engines and library systems.

초록보기
초록

디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다.일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, HYPERLINK "http://www.bls.gov/" http://www.bls.gov/) 및 the Energy Information Administration (EIA, HYPERLINK "http://www.eia.doe.gov/" http://www.eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어,이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

Abstract

As increasingly diverse kinds of information materials are available on the Internet, it becomes a challenge to define an adequate level of metadata provision for each different type of material in the context of digital libraries. This study explores issues of metadata provision for a particular type of material, statistical tables. Statistical data always involves numbers and numeric values which should be interpreted with an understanding of underlying concepts and constructs. Because of the unique data characteristics, metadata in the statistical domain is essential not only for finding and discovering relevant data, but also for understanding and using the data found. However, in statistical metadata research, more emphasis has been put on the question of what metadata is necessary for processing the data and less on what metadata should be presented to users.In this study, a case study was conducted to gauge the status of metadata provision for statistical tables on the Internet. The websites of two federal statistical agencies in the United States were selected and a content analysis method was used for that purpose. The result showing insufficient and inconsistent provision of metadata demonstrate the need for more discussions on statistical metadata from the ordinary web users’ perspective.

정보관리학회지