바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: test collections, 검색결과: 4
초록보기
초록

본 연구의 목적은 객체-관계형 데이터베이스 접근에 의한 XML 문헌의 검색 성능을 평가하는 것이다. 본 논문에서는 INEX(Initiative for the Evaluation of XML retrieval)에서의 XML 문헌의 색인 및 검색 방법에 대하여, 그리고 실험 방법론들에 대하여 기술하고 있다. 대부분의 전통적인 정보검색 성능평가 실험에서와 같이 본 연구에서 사용된 테스트 콜렉션(test collection)은 문헌(즉, XML 문헌), 토픽, ad hoc 검색, 적합성 판단, 평가로 이루어졌다. 그리고 ORDBMS 기술들을 기반으로 개발된 전용 XML 데이터베이스의 일종인 EXIMATM Supply을 사용하여 INEX에서 제공한 대규모 XML 문헌들을 저장하고 검색하였다. 본 논문에서는 실험에서 사용한 시스템에 대한 개략적인 기능들과 색인 및 검색 과정 그리고 INEX 2002에서의 성능평가 결과에 대하여, 앞으로 개선되어야 할 기능에 대하여 논하고 있다.

Abstract

The purpose of this study is to evaluate the performance of XML retrieval based on ORDBMSs(Object-Relational Database Management Systems) approach. This paper describes indexing and retrieval methods for XML documents and the methodologies of experiments at INEX(Initiative for the Evaluation of XML retrieval). Like any other traditional information retrieval experiment, the test collection was consists of documents, topics/queries, task, relevance assessments and evaluation. EXIMATM Supply, a kind of native XML DB based on ORDBMS technologies, is used for this experiment. Although this approach has many benefits, for example, no delay in storing and searching XML documents, but it showed relatively disappointed retrieval performance at INEX 2002. This result may caused since the given topics had to be decomposed and modified to be processed by the XPath processor, and during this modification the original meaning of topics can be changed inevitably and some important information may pass over.

초록보기
초록

본 연구는 OPAC에서 계층 클러스터링을 응용하여 소장자료를 계층구조로 분류하여 열람하는데 사용될 수 있는 최적의 계층 클러스터링 모형을 찾기 위한 목적으로 수행되었다. 문헌정보학 분야 단행본과 학위논문으로 실험집단을 구축하여 다양한 색인기법(서명단어 자동색인과 통제어 통합색인)과 용어가중치 기법(절대빈도와 이진빈도), 유사도 계수(다이스, 자카드, 피어슨, 코싸인, 제곱 유클리드), 클러스터링 기법(집단간 평균연결, 집단내 평균연결, 완전연결)을 변수로 실험하였다. 연구결과 집단간 평균연결법과 제곱 유클리드 유사도를 제외하고 나머지 유사도 계수와 클러스터링 기법은 비교적 우수한 클러스터를 생성하였으나, 통제어 통합색인을 이진빈도로 가중치를 부여하여 완전연결법과 집단간 평균연결법으로 클러스터링 하였을 때 가장 좋은 클러스터가 생성되었다. 그러나 자카드 유사도 계수를 사용한 집단간 평균연결법이 십진구조와 더 유사하였다.

Abstract

This study is to develop a hiararchic clustering model for document classification and browsing in OPAC systems. Two automatic indexing techniques (with and without controlled terms), two term weighting methods (based on term frequency and binary weight), five similarity coefficients (Dice, Jaccard, Pearson, Cosine, and Squared Euclidean), and three hierarchic clustering algorithms (Between Average Linkage, Within Average Linkage, and Complete Linkage method) were tested on the document collection of 175 books and theses on library and information science. The best document clusters resulted from the Between Average Linkage or Complete Linkage method with Jaccard or Dice coefficient on the automatic indexing with controlled terms in binary vector. The clusters from Between Average Linkage with Jaccard has more likely decimal classification structure.

3
김신영(숭의여자대학) ; 이창수(경북대학교) 2004, Vol.21, No.2, pp.45-67 https://doi.org/10.3743/KOSIM.2004.21.2.045
초록보기
초록

본 연구는 인쇄잡지 중심의 소장 패러다임 대 전자잡지 위주의 접근 패러다임이 대립하는 상황에서 대학도서관의 하이브리드형 학술지 수집정책의 이론적 토대가 되는 평가요소를 분석하여 한국적 실정을 고려한 외국 학술지의 평가모형 개발에 필요한 기초자료를 마련하는데 그 목적이 있다. 구체적으로 질문지법을 통하여 학술지 수집규모 상위 40개 대학도서관의 외국학술지 선정과정에서 예비평가지표(인쇄형 27개, 전자형 37개)의 적용도를 조사하고, 그 데이터를 다양한 통계적기법으로 분석하였다. 인쇄학술지 평가지표의 요인별 상대적 중요성은 응답 평균값으로 산출하였는데 그 결과는 학과당 구독종수, 이용도, 선정권한, 전자학술지 구독조건, ISI 영향지수, 국제성과 지명도, 구독가격, ILL/DDS, 수장공간 순으로 나타났다. 한편, 전자학술지는 구독가격, 접근성, 전자학술지 구독조건, 컨소시엄, 선정권한, 접근확장성, 학과당 구독종수, 대학의 학문적 특성, ISI 영향지수, ILL/DDS, 국제성과 지명도 순으로 나타났다.

Abstract

The purposes of this study are to compare and analyze the evaluation indicators for selection of journal suggested by scholars and organizations and to prepare theoretical background for the ideal model to meet opposing paradigms of collection management in academic libraries. A web survey method was employed to investigate applications of various selection criteria (27 for printed and 37 for electronic academic Journal) from the top 40 academic libraries in Korea. In addition, data were analysed statistically using factor analysis, t-test, Analysis of Variance(ANOVA), and Spearman's Rank Oder Correlation. The mean ranking for 9 evaluation indicators for printed were as follows: subscribing volumes per departments, degree of use, selection authority, electronic/print bundle, ISI impact factor, Internationality and reputation, costs for subscription, ILL & DDS, space considerations for printed materials. But, 11 evaluation indicators for electronic were as follows: costs for subscription, accessibility, electronic/print bundle, consortia, selection authority, access expandability, subscribing volumes per departments, scholarly features of the university, ISI impact factor, ILL & DDS, internationality and reputations.

4
유소영(연세대학교) ; 문성빈(연세대학교) 2004, Vol.21, No.4, pp.187-208 https://doi.org/10.3743/KOSIM.2004.21.4.187
초록보기
초록

이 연구에서는 심미적 인상을 이미지 검색의 고수준 자질로 이용하였다. ‘심미적’이라는 용어는 심리학, 예술, 문학 등에서 연구되어 왔다. 이 용어는 시각적 지각과 감정의 무의식적이고 즉각적인 측면을 의미한다. 심미적 인상과 관련된 문헌 연구를 통해 4 가지 종류의 심미적 인상을 조작적으로 정의하였다: 강한 인상, 부드러운 인상, 중후한 인상, 세련된 인상. 66개의 회화 이미지 파일을 1,000개의 회화 이미지 중에서 무작위로 추출하였으며 시지각 색상 모형을 이용하여 이 이미지 파일들로부터 저수준 색상 자질을 추출하였다. 이미지의 고수준 자질인 4가지 종류의 심미적 인상은 4명의 평가자가 리커트 7점 척도로 평가한 것을 평균내었다. 검색 실험에서 2명의 피험자는 심미적 인상이나 주제어에 대한 예제 이미지 질의를 이용해서 이미지 검색을 수행하였다. 피험자들은 심미적 인상 기반 이미지 검색 시스템에 대해서 보통 정도의 수준으로 만족했다. 그리고 색상 자질과 심미적 인상 자질을 모두 이용한 이미지 검색의 R-정확률이 색상 자질만을 이용한 이미지 검색의 R-정확률보다 높았다. 그러나 이 연구결과의 일반화를 위해서는 큰 실험 집단을 대상으로 보다 많은 검색 질의를 통한 추후 연구들이 필요할 것으로 생각된다.

Abstract

In this study, aesthetic impressions were used for a high-level feature of image retrieval. The term, “aesthetic" has been studied in psychology, art, and literature. It means unconscious, instantaneous parts of visual perception and emotion. The literatures related to aesthetic impressions were reviewed and four kinds of aesthetic impressions were defined operationally: strong impression, soft impression, courteous impression, and refined impression. 66 image files of paintings were sampled randomly from 1100 paintings and low-level color features were extracted from them by a using perceptual color model(Lai, & Tait, 1998). The high-level features of an image, that is, four kinds of aesthetic impressions of each painting were measured by 4 subjects and averaged. In CBIR, 2 subjects performed image retrievals using example queries. They were asked to retrieve images by using the aesthetic impressions or the keywords. In evaluations, subjects showed that they were satisfied with the aesthetic impression-based image retrieval system on the average. And R-precision of the image retrieval with both color features and aesthetic impressions was higher than that of the image retrieval with color features only. But further studies with larger test collections and query sets should be followed for generalization of the result of this study.

정보관리학회지