바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Information retrieval, 검색결과: 8
1
정영미(연세대학교) ; 장지은(연세대학교) 2003, Vol.20, No.3, pp.111-127 https://doi.org/10.3743/KOSIM.2003.20.3.111
초록보기
초록

이 연구의 목적은 사건을 연구대상으로 하는 사건트래킹 기법이 과연 최신 사건 정보를 검색함에 있어 기존의 정보필터링 기법보다 성능이 우수한가를 살펴보는 데 있다. 따라서 이 연구에서는 특정 사건에 관한 최신 기사를 보다 효과적으로 검색하여 제공하는 기법을 찾아내기 위하여 kNN(k-Nearest Neighbors) 분류기를 응용한 사건트래킹 기법과 질의기반 정보필터링 기법을 사용하여 사건검색 실험을 수행한 후 두 기법의 검색 성능을 비교하였다. 사건트래킹 실험은 초기의 고정 학습문서 집합을 사용한 사건트래킹과 트래킹 과정에서 변화하는 동적 학습문서 집합을 사용한 사건트래킹의 두 가지 방법으로 수행되었다. 정보필터링 실험도 초기질의를 사용한 정보필터링과 필터링 과정에서 계속 수정되는 질의를 사용한 정보필터링의 두 가지 방법으로 수행되었다. 실험 결과 사건트래킹 기법에서는 고정 학습문서 집합을 사용한 경우가 동적 학습문서 집합을 사용한 경우보다 더 우수한 성능을 보였으며, 정보필터링 기법에서는 초기질의를 사용한 경우가 수정질의를 사용한 경우보다 더 좋은 성능을 보였다. 또한 고정 학습문서 집합을 사용한 사건트래킹과 초기질의를 사용한 정보필터링을 비교한 결과 정보필터링 기법이 사건트래킹 기법에 비해 더 좋은 사건검색 성능을 보이는 것으로 나타났다.

Abstract

The purpose of this study is to ascertain whether event tracking is more effective in event retrieval than information filtering. This study examined the two techniques for event retrieval to suggest the more effective one. The event-retrieval performances of the event tracking technique based on a kNN classifier and the query-based information filtering technique were compared. Two event tracking experiments, one with the static training set and the other with the dynamic training set, were carried out. Two information filtering experiments, one with initial queries and the other with refined queries, were also carried out to evaluate the event-retrieval effectiveness. We found that the event tracking technique with the static training set performed better than one with the dynamic training set. It was also found that the information filtering technique using intial queries performed better than one using the refined queries. In conclusion, the comparison of the best cases of event tracking and information filtering revealed that the information filtering technique outperformed the event tracking technique in event retrieval.

초록보기
초록

역문헌빈도 가중치 기법은 문헌 집단에서 출현빈도가 낮을수록 색인어의 중요도가 높다는 가정에 근거하고 있다. 그런데 이는 중간빈도어를 중요하게 여기는 여타 이론과는 일치하지 않는 것이다. 이 연구에서는 저빈도어보다 중간빈도어가 더 중요하다는 가정에 근거하여 역문헌빈도 가중치 공식을 수정한 피벗 역문헌빈도 가중치 기법을 제안하였다. 제안된 기법을 검증하기 위해서 세 실험집단을 대상으로 검색실험을 수행한 결과. 피벗 역문헌빈도 가중치기법이 역문헌빈도 가중치 기법에 비해서 특히 검색결과 상위에서의 성능을 향상시키는 것으로 나타났다.

Abstract

The Inverse Document Frequency (IDF) weighting method is based on the hypothesis that in the document collection the lower the frequency of a term is, the more important the term is as a subject word. This well-known hypothesis is, however, somewhat questionable because some low frequency terms turn out to be insufficient subject words. This study suggests the pivoted IDF weighting method for better retrieval effectiveness, on the assumption that medium frequency terms are more important than low frequency terms. We thoroughly evaluated this method on three test collections and it showed performance improvements especially at high ranks.

3
이두영(중앙대학교) ; 윤대진(부천만화정보센터) 2003, Vol.20, No.3, pp.177-197 https://doi.org/10.3743/KOSIM.2003.20.3.177
초록보기
초록

Abstract

The purpose of this study is to suggest the subject and standards of evaluation on integrated IR interface. For this study, we studied the preceding research about major IR interface models. We took the survey for interface elements which were verified by experts. These interface elements are divided twe viewpoints. One is the cognitive viewpoints which are the page design, content design, site design, output form, usability and aesthelic facet. The other is the objective viewpoints which are page design, dontent design, site design, output for and usability. We found that these evaluation elements have a crediblilty. [ 더 많은 내용 보기 ]

초록보기
초록

본 연구에서는 웹기반 정보검색시스템을 사용함에 있어 이용자 편의성을 최적화할 수 있는 검색 인터페이스 표준 용어를 제안하였다. 이를 위해 국립중앙도서관을 비롯하여 주요 전문 정보를 제공하고 있는 기관의 웹페이지를 조사. 분석하였다. 분석한 결과에 근거하여 웹기반 정보검색시스템에서 사용자 오류와 혼란을 최소화하고 검색 편의성을 극대화할 수 있는 표준 용어를 제안하였다. 제안의 기준은 해당 용어의 사용빈도와 의미를 활용하였다. 분석은 검색관련 기본 모듈을 비롯하여 검색범위설정 모듈, 이용자 지원 모듈에서 사용된 용어 가운대 최소 50%이상의 기관에서 제공하는 기능에 존재하는 용어만을 대상으로 하였다. 본 연구의 결과는 웹 기반 검색화면 설계 및 구축 전문가에게 검색 관련 용어선정을 위한 표준 자료로 활용될 것이다.

Abstract

This research suggesrs the method of standardizing terms for raising the dffectiveness of information retrival. Especiallly for web search, I propose the proper terms which they will use in retriveal by surveying and analysing the related terms abour information retrieval interface. The proper terms will solve the eqyivocaiton for user and increase the retrieval effectiveness. And I think the proposed terms will be used to standard data for designers who are construct the user interface systems.

초록보기
초록

이 연구의 목적은 대량의 최신정보를 제공하는 정보필터링 시스템에서 이용자 피드백에 의해 수정질의를 자동생성하여 재검색을 수행함으로써 검색 성능을 최적화할 수 있는 방안을 찾는 데 있다. 이용자가 입력한 초기질의를 사용하여 정보필터링 시스템이 검색한 문헌에 대해 이용자가 적합성 여부를 온라인으로 입력하도록 하고, 이 피드백 결과를 토대로 '중복제거법'과 '저빈도제거법' 두 가지 방법에 의해각각 17개의 수정질의를 생성하여 재검색한 결과를 초기 검색결과와 비교 분석하였다. 수정질의는 각각의 방법마다 17개 패턴의 불논리 질의형태를 미리 만든 다음 초기질의에 디스크립터와 분류기호를 결합하여 생성하였으며, 재검색 결과에 대한 적합성 평가를 통해 최적의 수정질의식을 도출하였다.

Abstract

In this study an information filtering system was implemented and a series of relevance feedback experiments were conducted using the system. For the relevance feedback, the original queries were searched against the database and the results were reviewed by the researchers. Based on users' online relevance judgements a pair of 17 refined queries were generated using two methods called "co-occurrence exclusion method" and "lower frequencies exclusion method." In order to generate them, the original queries. the descriptors and category codes appeared in either relevant or irrelevant document sets were applied as elements. Users' relevance judgments on the search results of the refined queries were compared and analyzed against those of the original queries. [ 더 많은 내용 보기 ]

6
이준호(숭실대학교) ; 권혁성(숭실대학교) ; 박소연() 2003, Vol.20, No.2, pp.27-41 https://doi.org/10.3743/KOSIM.2003.20.2.027
초록보기
초록

이용자와 검색 서비스 시스템의 모든 검색 과정을 기록한 질의 로그는 이용자의 실제 검색 행위를 사실적으로 반영한다. 따라서, 웹 검색 이용자들의 검색 행태를 이해하기위하여 웹 검색 서비스 시스템이 생성한 질의 로그를 분석하는 방법이 널리 사용되고 있다. 본 연구는 네이버 이용자의 웹 검색 행태를 파악하기 위하여 기존의 질의 로그 분석 방법론을 보완하여 제시한다. 또한, 본 연구는 통합 검색, 디텍토리 검색, 웹 문서 검색과 같은 다양한 검색 유형에 대하여 일주일 동안 생성된 질의 로그를 분석함으로써 네이버 웹 검색 이용자들의 전반적인 검색 행태를 파악하였다. 본 연구의 결과는 보다 효과적인 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

Abstract

Query logs are online records that capture user interactions with information retrieval systems and all the search processes. Query log analysis offers an advantage of providing reasonable and unobtrusive means of collecting search information from a large number of users. In this paper, query logs of NAVER, a major Korean Internet search service, were analyzed to investigate the information seeking behavior of NAVER users. The query logs were collected over one week from various collections such as comprehensive search, directory search and web document search. It is expected that this study could contribute to the development and implementation of more effective web search systems and services.

7
이창수(경북대학교) ; 김신영(숭의여자대학) 2003, Vol.20, No.1, pp.231-250 https://doi.org/10.3743/KOSIM.2003.20.1.231
초록보기
초록

정보기술의 급격한 발전은 이용 가능한 정보량의 급증 뿐 만 아니라 정보의 형태에 있어서도 다양화를 가져왔다. 정보이용능력은 정보를 검색하고, 분석하고 이용하는데 필요한 기술이다. 이는 대학교육의 핵심 목표이자 도서관 교육의 새로운 경향으로 인식되고 있다. 그러나 급증하는 정보이용능력에 관한 관심에도 불구하고, 교육 프로그램이나 교수-사서간의 협력에 관한 논의는 부족한 실정이다. 도서관 교육이 교과과정의 일부가 되기 위해서는 대학구성원간의 긴밀한 협력이 반드시 필요하다. 본 연구는 외국 대학도서관에서 채택하고 있는 정보이용능력 교육 프로그램을 개관하고, 대학구성원간 협력에 있어 성공사례를 분석해보았다. 또한 이를 바탕으로 우리나라 대학에서 정보이용능력 교육의 시행에 필요한 절차의 개요를 제시해보았다

Abstract

The rapid advances in information technologies have resulted in not only the proliferation of the amount of information available but also the variety of information formats. Information literacy is the set of skills needed to find, retrieve, analyze, and use information. Therefore, information literacy which should be the core goal of the university education has been a new trend of the library instruction. Nevertheless, despite the increasing Interest in the information literacy. there has been little discussion about educational Programs. and there has been little coordination between faculty and librarians on the programs. Under such circumstances, campus-wide teamwork is needed so that the library instruction can become part of the entire learning Processes of university education. This Paper presents an overview of the models adopted by foreign university libraries and also analyses the successful cases of the campus-wide partnership of each model of information literacy programs. Based on these. the outline of the needed procedure for the enforcement of the information literacy in the university of our country is suggested.

8
김현희(명지대학교) ; 안태경(대외경제정책연구원) 2003, Vol.20, No.1, pp.417-455 https://doi.org/10.3743/KOSIM.2003.20.1.417
초록보기
초록

온톨로지는 웹자원을 지식화함으로써 정보의 효율적 검색, 통합, 재사용을 도모할 수 있는 새로운 기술인 시맨틱 웹의 구현을 위한 가장 핵심적인 요소 기술로 알려지고 있다. 온톨로지는 사람간에 그리고 서로 다른 응용 시스템간에 지식을 공유하고 재이용하는 방법을 제공하는 기술로서 특정 주제에 관한 지식 용어들의 집합으로서 이들 용어뿐만 아니라 용어간의 의미적 연결 관계와 간단한 추론 규칙을 포함한다. 본 연구에서는 인터넷 웹상에서 국제기구에 관한 정보를 체계적으로 관리하고 검색하기 위해서 국제기구 온톨로지를 설계하고 이 온톨로지에 기반 하여 검색 시스템을 구현해 보고, 이 시스템을 20개의 탐색 질문들을 이용하여 기존의 인터넷 검색엔진과 적합성과 탐색 시간이라는 두 가지 요인을 통해서 비교해 보았다. 실험 결과에 의하면 적합성 측정은 온톨로지 기반 시스템은 평균 4.53, 인터넷 검색엔진은 평균 2.51로 온톨로지 기반 시스템의 적합도가 1.80배 높은 것으로 나타났다. 또한 탐색시간은 온톨로지 기반 시스템은 평균 1.96분, 인터넷 검색엔진은 평균 4.74분으로 인터넷 검색엔진이 온톨로지 기반 시스템 보다 2.42배 정도 더 많은 탐색시간이 필요한 것으로 나타났다.

Abstract

Ontologies are formal theories that are suitable for implementing the semantic web, which is a new technology that attempts to achieve effective retrieval, integration, and reuse of web resources. Ontologies provide a way of sharing and reusing knowledge among people and heterogeneous applications systems. The role of ontologies is that of making explicit specified conceptualizations. In this context, domain and generic ontologies can be shared, reused, and integrated in the analysis and design stage of information and knowledge systems. This study aims to design an ontology for international organizations, and build an Internet web retrieval system based on the proposed ontology, and finally conduct an experiment to compare the system performance of the proposed system with that of Internet search engines focusing relevance and searching time. This study found that average relevance of ontology- based searching and Internet search engines are 4.53 and 2.51, and average searching time of ontology-based searching and Internet search engines are 1.96 minutes and 4.74 minutes.

정보관리학회지