바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: search engines, 검색결과: 21
초록보기
초록

본 논문은 정보검색 시스템의 사용자 질의어와 색인에 기반한 검색 과정에서 나타나는 중의성 해소를 위해 질의어 의미정보와 사용자 피드백을 사용하여 검색 성능을 향상시키는 방법을 소개한다. 의미 정보를 이용하여 질의어의 중의성을 해소하는 검색 과정은 검색 결과로서 의미적으로 무관한 많은 문서들을 배제할 수 있다. 이를 위해 검색의 색인이 되는 명사 중심의 의미범주를 기반으로 의미정보 지식베이스를 구축하고, 검색 문서들을 색인어와 해당 의미범주로 분류한다. 검색 과정에서는 사용자의 질의 의미 선택과 정답 문서에 대한 참조 행위를 웹 페이지의 순위 결정에 반영하여 검색 성능을 향상시킬 수 있다.

Abstract

This paper proposes a technique for improving performance using word senses and user feedback in web information retrieval, compared with the retrieval based on ambiguous user query and index. Disambiguation using query word senses can eliminating the irrelevant pages from the search result. According to semantic categories of nouns which are used as index for retrieval, we build the word sense knowledge-base and categorize the web pages. It can improve the precision of retrieval system with user feedback deciding the query sense and information seeking behavior to pages.

초록보기
초록

This study is to investigate the characteristics of the Invisible Web and many search services designed to serve as gateways to the Invisible Web and to evaluate searching the Invisible Web in the Services. The four services for searching the Invisible Web were selected to search the Invisible Web with 11 queries, that are Google as portals, ProFusion and Search.com as Invisible Web meta search engines, and IncyWincy as Invisible Web search engines. It was found that the effectiveness of Google's Invisible Web searching was better compared with the three Invisible Web search tools but the difference between the four systems was not significant(α=.055). The Invisible Web meta searching was better than the Web meta searching in the three search tools at the statistically significant level. The effectiveness measurement based on the ranks and relevance degree(quality) of relevant documents retrieved seemed appropriate to the ranked search results.攀***한남대학교 문헌정보학과 교수(jsr@mail.hannam.ac.kr) 논문접수일자 : 2004년 8월 16일 게재확정일자 : 2004년 9월 18일攀攀

Abstract

3
박상규(중앙대학교) ; 김성희(중앙대학교) ; 이찬규(중앙대학교) ; 이준호(숭실대학교) ; 윤경현(중앙대학교) 2007, Vol.24, No.4, pp.255-265 https://doi.org/10.3743/KOSIM.2007.24.4.255
초록보기
초록

본 연구에서는 12개의 표본 비디오 집단과 14명의 피조사자들을 이용하여 영상 초록 및 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정해 보았다. 측정 결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났으며 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다. 둘째, 영상 초록의 색인어 및 요약문 정확도가 전체 클립의 정확도 보다 떨어지지만 절반치에 근접한 것으로 나타나 영상 초록이 비디오 의미 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도(0.45)가 요약문 정확도(0.40) 보다 더 높게 나타나 영상 초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 실험 결과에 기초하여 영상 초록이 색인어 또는 요약문 추출 작업에 활용될 수 있을 뿐만 아니라, 디지털 도서관 환경에서 텍스트 초록과 같은 다른 메타데이터 요소들과 함께 사용된다면 이용자의 적합성 판정을 좀 더 용이하게 할 것이며, 더 나아가 영상 질의의 매칭 자료로도 이용될 수 있음을 제안하였다. 끝으로 영상 초록의 품질을 높이기 위한 키프레임 추출 알고리즘 및 키프레임 배열 모형 설계 등 후속 연구에 대해서 제언하였다.

Abstract

This study is designed to assess whether storyboard surrogates are useful enough to be utilized for indexing sources as well as for metadata elements using 12 sample videos and 14 participants. Study shows that first, the match rates of index terms and summaries are significantly different according to video types, which means storyboard surrogates are especially useful for the type of videos of conveying their meanings mainly through images. Second, participants could assign subject keywords and summaries to digital video, sacrificing a little loss of full video clips' match rates. Moreover, the match rate of index terms (0.45) is higher than that of summaries (0.40). This means storyboard surrogates could be more useful for indexing videos rather than summarizing them. The study suggests that 1)storyboard surrogates can be used as sources for indexing and abstracting digital videos; 2) using storyboard surrogates along with other metadata elements (e.g., text-based abstracts) can be more useful for users' relevance judgement; and 3)storyboard surrogates can be utilized as match sources of image-based queries. Finally, in order to improve storyboard surrogates quality, this study proposes future studies: constructing key frame extraction algorithms and designing key frame arrangement models.

초록보기
초록

웹 상의 의학 분야 자료들은 방대한 규모로 존재하며, 각 검색엔진에서는 이를 분류하여 제공하고 있으나 그 구성에 있어서 일관성과 체계성이 부족하다. 따라서 본 논문은 검색엔진에서 의학 분야 웹 자료 분류체계를 구성하기 위하여 의학 전문 문헌분류표인 NLMC를 준용하고, 항목의 배열이 주제간 관련성을 기반으로 이루어져야 한다는 것을 제안하였다. 또한 순환성을 고려한 1차 분류 및 2차 분류 항목에서의 중복 분류시, 그에 대한 명확한 기준이 설정되어야 하며, 분류 항목명을 의학 분야 표준 용어집인 MeSH와 의학용어집의 용어로 선택하여 기존의 도서관 정보검색시스템과의 상호호환성을 높여야 한다는 것을 제안하였다.

Abstract

There are lots of Web materials in the field of medicine and many search engines classify the medical materials on the Web through directories. But the organization of these directories are wanting in consistency and systematization. In order for manager of search engines to organize medical materials on the Web systematically, this paper suggests several guidelines. NLMC, a special classification system for medicine, need to be applied to develop directories of medicine in search engines. Also, items of the directories should be arranged based on the relevance of subjects among subfields of medical science. For classifying an item to several directories repeatedly, clear criteria should be established. In addition to, controlled vocabularies or glossaries for medicine such as MeSH and the English-Korean, Korean-English Medical Terminology Collection should be used for selection of the name of items in medical directories.

5
박소연(덕성여자대학교) ; 조기훈(NHN Entertainment) ; 최기린(NHN Entertainment) 2015, Vol.32, No.4, pp.289-305 https://doi.org/10.3743/KOSIM.2015.32.4.289
초록보기
초록

본 연구에서는 국내 쇼핑 검색 사이트인 팝슈즈 이용자들의 정보 검색 행태를 조사, 분석하였다. 이를 위하여 팝슈즈에서 2015년 1월부터 3월까지 3개월 동안 생성된 검색 로그를 수집, 분석하였다. 연구 결과, 팝슈즈 이용자들의 검색 행태는 매우 단순하고 수동적인 것으로 나타났다. 이용자들이 정보 접근 시, 질의를 직접 입력하여 검색하는 경우보다 사이트에 구축되어 있는 디렉토리를 브라우징하는 경우가 더 많은 것으로 나타났다. 반면, 제품 정보 클릭이나 제품 주문과 같은 주요 의사 결정에 있어서는 브라우징보다 질의의 역할이 더 큰 것으로 나타났다. 본 연구의 결과는 향후 쇼핑 검색 서비스의 개선에 활용될 수 있을 것으로 기대된다.

Abstract

This study aims to investigate information seeking behavior of Popshoes users. Transaction logs of Popshoes, a major Korean shopping search engine, were analyzed. These transaction logs were collected over 3 months period, from January 1 to March 31, 2015. The results of this study show that Popshoes users behave in a simple and passive way. In the total sessions, more users chose to browse a directory than typing and submitting a query. However, queries played a more crucial role in important decision makings such as search results clicks and product purchases than directory browsing. The results of this study can be implemented to the effective development of shopping search engines.

초록보기
초록

Abstract

This study constructed an ontology targeting journal articles and evaluated its performance. Also, the performance of a triple structure ontology was compared with the knowledge base of an inverted index file designed for a simple keyword search engine. The coverage was three years of articles published in the Journal of the Korean Society for Information Management from 2007 to 2009. Protégé was used to construct an ontology, whilst utilizing an inverted index file to compare performance. The concept ontology was manually established, and the bibliography ontology was automatically constructed to produce an OWL concept ontology and an OWL bibliography ontology, respectively. This study compared the performance of the knowledge base of the ontology, using the Jena search engine with the performance of an inverted index file using the Lucene search engine. As a result, The Lucene showed higher precision rate, but Jena showed higher recall rate.

7
김현희(명지대학교) ; 안태경(대외경제정책연구원) 2003, Vol.20, No.1, pp.417-455 https://doi.org/10.3743/KOSIM.2003.20.1.417
초록보기
초록

온톨로지는 웹자원을 지식화함으로써 정보의 효율적 검색, 통합, 재사용을 도모할 수 있는 새로운 기술인 시맨틱 웹의 구현을 위한 가장 핵심적인 요소 기술로 알려지고 있다. 온톨로지는 사람간에 그리고 서로 다른 응용 시스템간에 지식을 공유하고 재이용하는 방법을 제공하는 기술로서 특정 주제에 관한 지식 용어들의 집합으로서 이들 용어뿐만 아니라 용어간의 의미적 연결 관계와 간단한 추론 규칙을 포함한다. 본 연구에서는 인터넷 웹상에서 국제기구에 관한 정보를 체계적으로 관리하고 검색하기 위해서 국제기구 온톨로지를 설계하고 이 온톨로지에 기반 하여 검색 시스템을 구현해 보고, 이 시스템을 20개의 탐색 질문들을 이용하여 기존의 인터넷 검색엔진과 적합성과 탐색 시간이라는 두 가지 요인을 통해서 비교해 보았다. 실험 결과에 의하면 적합성 측정은 온톨로지 기반 시스템은 평균 4.53, 인터넷 검색엔진은 평균 2.51로 온톨로지 기반 시스템의 적합도가 1.80배 높은 것으로 나타났다. 또한 탐색시간은 온톨로지 기반 시스템은 평균 1.96분, 인터넷 검색엔진은 평균 4.74분으로 인터넷 검색엔진이 온톨로지 기반 시스템 보다 2.42배 정도 더 많은 탐색시간이 필요한 것으로 나타났다.

Abstract

Ontologies are formal theories that are suitable for implementing the semantic web, which is a new technology that attempts to achieve effective retrieval, integration, and reuse of web resources. Ontologies provide a way of sharing and reusing knowledge among people and heterogeneous applications systems. The role of ontologies is that of making explicit specified conceptualizations. In this context, domain and generic ontologies can be shared, reused, and integrated in the analysis and design stage of information and knowledge systems. This study aims to design an ontology for international organizations, and build an Internet web retrieval system based on the proposed ontology, and finally conduct an experiment to compare the system performance of the proposed system with that of Internet search engines focusing relevance and searching time. This study found that average relevance of ontology- based searching and Internet search engines are 4.53 and 2.51, and average searching time of ontology-based searching and Internet search engines are 1.96 minutes and 4.74 minutes.

8
이수영(미국 미시간대학교 정보대학원) 2007, Vol.24, No.2, pp.29-44 https://doi.org/10.3743/KOSIM.2007.24.2.029
초록보기
초록

본 연구는 왜 이용자들이 정보탐색에 많은 노력을 기울이지 않는가를 알아보기 위하여 교육심리학분야에서 개발된 정신적 노력에 관한 개념을 웹 검색엔진과 도서관시스템 정보탐색행위에 적용하여 보았다. 실험실 환경에서 학부학생 총 15명을 대상으로 탐색실험을 실시하여, 탐색전 설문조사, 탐색후 설문조사, 탐색후 인터뷰, 생각 소리내어 말하기 (think-aloud), 로그데이터를 통하여 데이터를 수집하였다. 연구결과, 이용자들은 웹 검색엔진을 도서관시스템에 비하여 휠씬 쉽다고 인지하며 스스로 탐색에 대한 높은 자신감을 가지고 있었다. 이러한 이용자성향은 이용자들이 웹 탐색에 도서관탐색때보다 더 적은 노력을 기울이는 것과 깊은 연관성을 가지고 있는 것으로 나타났다. 이용자들의 정신적 노력에 관한 개념은 결과적으로 이용자들의 정보탐색 행위와 경험을 설명하는데 매우 유용한 것으로 밝혀졌다.

Abstract

The purpose of this study was to explore whether the concept of amount of invested mental effort (AIME) developed in the field of educational psychology can help explain why people put so little effort into online searching. In this experimental study, two information retrieval systems a web search engine and a university library system were used to make a comparison. The data were collected from 15 undergraduate students through background questionnaires, think-aloud protocols, search logs, post-search questionnaires, and post-task interviews. The findings indicate that perception of the webs easy-ness and high levels of self confidence in searching capability led the subjects to put less effort into web searching than they do into library system searching. In addition, the perceived difficulty of search task influenced the extent of mental effort invested. The AIME proved a useful framework for understanding search behavior and user experience for both web search engines and library systems.

초록보기
초록

이 연구는 웹정보원의 지적 구조를 동시링크분석을 이용하여 시기별 변화와 검색엔진별 차이를 중심으로 분석하였다. 지적 구조의 시기별 변화를 분석한 결과, 이차원 지도상에 나타난 웹정보원의 군집과 위치는 6년간의 시간흐름에 따른 지적 구조의 변화를 나타냈다. AltaVista와 MSN Search 검색엔진을 대상으로 지적구조의 차이를 분석한 결과, 웹정보원 지도에 나타난 전체적인 지적 구조는 유사한 양상을 나타냈지만, 몇몇 웹정보원의 경우 소속 군집이 달라지는 경우가 발생했다. 인쇄 정보원에 적용되던 동시인용기법이 웹정보원에 대한 통시적 분석에도 응용될 수 있음을 확인하였다.

Abstract

This research analyzed changes of the intellectual structure of web information by examining time changes and search engines using the co-links analysis. According to the results, the co-links web information clusters on the two maps appeared to contain changes in the intellectual structure over the two time periods.The intellectual structure that appeared in the information map for AltaVista and MSN Search engines was relatively similar. However, there were also cases where the clusters of some web information was different. The results of the research revealed that the cocitation analysis could be applied simultaneously to diachronous analysis in the web information.

10
정은경(이화여자대학교) ; 윤정원(University of South Florida) 2010, Vol.27, No.2, pp.37-60 https://doi.org/10.3743/KOSIM.2010.27.2.037
초록보기
초록

Abstract

The purpose of this study is to investigate image search query reformulation patterns in relation to image attribute categories. A total of 592 sessions and 2,445 queries from the Excite Web search engine log data were analyzed by utilizing Batley’s visual information types and two facets and seven sub-facets of query reformulation patterns. The results of this study are organized with two folds: query reformulation and categorical transition. As the most dominant categories of queries are specific and general/nameable, this tendency stays over various search stages. From the perspective of reformulation patterns, while the Parallel movement is the most dominant, there are slight differences depending on initial or preceding query categories. In examining categorical transitions, it was found that 60-80% of search queries were reformulated within the same categories of image attributes. These findings may be applied to practice and implementation of image retrieval systems in terms of assisting users’ query term selection and effective thesauri development.

정보관리학회지