바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 내용기반 검색, 검색결과: 19
11
김용(전북대학교) ; 소민호(KAIST 학술정보처) 2009, Vol.26, No.4, pp.113-128 https://doi.org/10.3743/KOSIM.2009.26.4.113
초록보기
초록

일반적으로 동영상콘텐츠에 대한 탐색과정에서 이용자는 해당 기관 또는 사이트에서 제공하는 간단하게 요약한 요약 동영상과 텍스트 정보를 이용하여 원하는 동영상을 선택한다. 이러한 이용자의 동영상콘텐츠의 탐색과정에서의 정확하고 신속한 동영상콘텐츠의 검색을 위하여 본 연구에서는 동영상을 구성하는 자막과 이미지 정보를 이용하여 동영상을 내용에 따라 여러 개의 클립으로 구분하고, 이용자의 필요에 따라 원하는 클립을 빠르게 검색하여 제공하는 시스템을 제안한다. 동영상콘텐츠 및 관련 메타데이터의 관리 및 제어를 위해서 본 연구에서는 XML 계층구조를 생성하여 저장한다. 한편, 이용자의 검색 요청시 XML을 기반으로 동영상콘텐츠의 계층구조를 반영하는 Xpath를 생성하여 질의처리를 수행함으로써 이용자가 원하는 동영상콘텐츠에 대한 검색결과를 제공한다. 제안된 방법을 기반으로 본 연구에서는 XML 계층구조를 이용한 동영상 검색 시스템을 설계하고 구현하였다.

Abstract

Generally, a user uses briefly summarized video data and text information to search video contents. To provide fast and accurate search tool for video contents in the process of searching video contents, this study proposes a method to search video clips which was partitioned from video contents. To manage and control video contents and metadata, the proposed method creates structural information based on XML on a video and metadata, and saves the information into XML database. With the saved information, when a user try to search video contents, the results of user's query to retrieve video contents would be provided through creating Xpath which has class structure information. Based on the proposed method, an information retrieval system for video clips was designed and implemented.

12
정영미(연세대학교) ; 이용구(계명대학교) 2005, Vol.22, No.2, pp.125-145 https://doi.org/10.3743/KOSIM.2005.22.2.125
초록보기
초록

이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음, 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 92%의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 67% 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 39.6%의 정확률을 보였고, EM 알고리즘 통합 검색이 약 36%의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 37%와 비교하면 나이브 베이즈 통합 검색은 약 7.4%의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 3%의 성능 저하율을 보였다.

Abstract

This paper presents a semantic vector space retrieval model incorporating a word sense disambiguation algorithm in an attempt to improve retrieval effectiveness. Nine Korean homonyms are selected for the sense disambiguation and retrieval experiments. The total of approximately 120,000 news articles comprise the raw test collection and 18 queries including homonyms as query words are used for the retrieval experiments. A Naive Bayes classifier and EM algorithm representing supervised and unsupervised learning algorithms respectively are used for the disambiguation process. The Naive Bayes classifier achieved 92% disambiguation accuracy, while the clustering performance of the EM algorithm is 67% on the average. The retrieval effectiveness of the semantic vector space model incorporating the Naive Bayes classifier showed 39.6% precision achieving about 7.4% improvement. However, the retrieval effectiveness of the EM algorithm-based semantic retrieval is 3% lower than the baseline retrieval without disambiguation. It is worth noting that the performances of disambiguation and retrieval depend on the distribution patterns of homonyms to be disambiguated as well as the characteristics of queries.

초록보기
초록

정보기술의 발전과 더불어 국가경쟁력 및 대국민 서비스 강화를 위한 공공정보시스템의 구축이 확산되고 있다. 또한 막대한 공공재원이 투자되는 공공정보시스템은 효율성에 대한 정기적인 평가를 통한 존재가치의 입증 및 문제점 진단을 통한 성능개선의 요구도 증대되고 있다. 따라서 본 연구는 국내의 대표적인 웹 기반 공공고용정보시스템 워크넷(Work-Net)의 데이터 및 서비스 품질을 102명의 이용자를 대상으로 평가하였다. 측정도구는 학계에서 많이 사용해온 정보내용, 정확성, 적시성, 출력형태, 사용의 용이성, 지원성으로 구성하였으며 t-test와 일원변량분석(one-way ANOVA)을 실시하여 이용자의 특성 및 검색정보에 따른 차이를 살펴보았다. 또한 최근 구직자들의 고용정보시스템에 대한 요구사항들을 분석하였다. 본 연구결과는 공공 및 민간운영 고용정보시스템 운영체제 효율화에 기여할 수 있는 유용한 기초자료를 제공할 것으로 본다.

Abstract

초록보기
초록

디지털 정보환경 속에서 동일한 내용이지만 형태와 표현 방식이 다른 저작들이 빈번하게 생성되어지자, IFLA는 다양한 매체, 응용 및 기능을 수용하고 이용자의 정보탐색 욕구를 충족시킬 수 있는 새로운 서지정보 기술 권고안인 FRBR(Functional Requirements for Bibliographic Records) 모형을 제안하였다. 이에 따라 여러 기관에서 이용자들이 보다 용이하게 원하는 정보를 탐색, 식별, 선정, 획득하고 또 항해할 수 있게 하는 FRBR 모형 기반의 서지정보시스템을 실험적으로 구현하고 있다. 본 연구는 앞으로 이러한 시스템이 본격적으로 개발될 때 도움이 될 수 있는 서지정보 인터페이스 개발방안을 제안하였다. 이를 위하여 먼저 새로운 검색 및 디스플레이 인터페이스를 선보이고 있는 FRBR 모형 기반 서지정보시스템의 전체적 특징을 살펴본 후, 각 시스템이 제공하는 탐색 인터페이스와 디스플레이 인터페이스를 각각 비교ㆍ분석하였다.

Abstract

New concept of bibliographic data and its scheme are needed to accommodate a change resulting from the emergence of new forms of electronic publishing, and the advent of networked access to information resources. FRBR model was developed for defining functions performed by the bibliographic data with respect to various media, various applications, and various user needs. Several institutions including OCLC and RLG or vendors have tried to implement the FRBR on OPAC systems. The purpose of this study is to propose the strategies for developing bibliographic interface based the FRBR model. This study is to review the representative FRBRized systems and compare the systems regarding on search interface and display interface.

15
최형욱(이화여자대학교 일반대학원 문헌정보학과) ; 정은경(이화여자대학교) 2017, Vol.34, No.3, pp.109-124 https://doi.org/10.3743/KOSIM.2017.34.3.109
초록보기
초록

여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문 인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 ‘Sociology’로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 ‘Sociology’로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

Abstract

Through a wide variety of disciplines, practices on data access and re-use have been increased recently. In fact, there has been an emerging phenomenon that researchers tend to use the data sets produced by other researchers and give scholarly credit as citation. With respect to this practice, in 2012, Thomson Reuters launched Data Citation Index (DCI). With the DCI, citation to research data published by researchers are collected and analyzed in a similar way for citation to journal articles. The purpose of this study is to identify the characteristics and intellectual structure of sociology field based on research data, which is one of actively data-citing fields. To accomplish this purpose, two data sets were collected and analyzed. First, from DCI, a total of 8,365 data were collected in the field of sociology. Second, a total of 12,132 data were collected from Web of Science with a topic search with ‘Sociology’. As a result of the co-word analysis of author provided-keywords for both data sets, the intellectual structure of research data-based sociology was composed of two areas and 15 clusters and that of article-based sociology was composed with three areas and 17 clusters. More importantly, medical science area was found to be actively studied in research data-based sociology and public health and psychology are identified to be central areas from data citation.

초록보기
초록

본 연구는 소설 검색 환경을 개선하기 위해, 도서태그로부터 소설 이용자가 소설 탐색 상황에서 요구하는 다양한 패싯 요소를 식별하고 체계화하는 것을 목적으로 한다. 소설의 기본 패싯 체계를 랑가나단의 PMEST 기본 패싯에 기반하여, 1) 소설 자료를 형성하는 주체, 2) 소설을 구성하는 내용적, 외형적 성질, 3) 독자가 책과 상호작용하는 행위, 4) 소설 및 독서활동과 관련된 공간 정보, 5) 소설 및 독서활동과 관련된 시간 정보로 정의하고, 소설 7,174건에 부여된 약 31만 건의 태그 중 핵심 태그 3,730건을 선별하여 내용분석하였다. 그 결과, 소설 패싯의 상위범주 25개를 중심으로 다양한 속성을 체계화하였다. 본 연구의 결과는 향후 도서관 OPAC이나 소설 DB에 패싯 내비게이션 형태로 적용될 수 있을 것으로 기대된다.

Abstract

The purpose of this study is to identify and systematize various facet elements required by users in fiction search situations from book tags to improve the fiction search environment. Based on the Ranganathan’s PMEST formula, the basic facet system of the fiction was defined as 1) the personality that forms the fiction material, 2) the content and external characteristics that compose the fiction, 3) the reader interaction with books, 4) spatial information related to fiction and reading activities, and 5) time information related to fiction and reading activities. Out of approximately 310,000 tags assigned to 7,174 fiction, 3,730 core tags were selected and content-analyzed. As a result, various attributes were systematized around the top 25 categories of the fiction facets. The results of this study can be applied to facet navigation of OPAC and fiction DB in the future.

17
김성진(Syarcuse University, USA) ; 정동열(이화여자대학교) 2006, Vol.23, No.2, pp.21-37 https://doi.org/10.3743/KOSIM.2006.23.2.021
초록보기
초록

학문의 지식체계를 형성하는데 있어서 하나의 일련과정으로 밀접하게 상호연관된 이론개발 및 이론활용 연구가 뒷받침되어야 한다는 전제 하에, 본 연구는 문헌정보학 연구논문의 이론개발 및 이론활용 사례의 양적/질적 측면을 조사함으로써 문헌정보학의 이론적 기반을 분석하고자 하였다. 특히, 본 연구는 세부주제영역에 따른 이론개발 및 이론활용 연구의 특성에 주목함으로써 문헌정보학의 이론적 기반 형성에 기여한 세부주제영역을 보다 구체적으로 파악하고자 하였다. 이를 위해 1984년부터 2003년에 출판된 1,661편의 연구논문을 대상으로 내용분석을 실시하였다. 분석결과, 22개의 세부주제영역 중에서 정보이용탐색, 정보검색, 도서관경영, 학술커뮤니케이션 영역이 이론개발과 이론활용의 모든 측면에 가장 큰 기여를 한것으로 나타났다. 또한 주제영역별로 생산된 논문 수에 따른 이론적 연구의 비율을 살펴보았을 때, 계량정보학과 전문직 영역에 대한 연구가 매우 이론적인 특성을 보였다. 이 외에 각 세부주제영역별로 사용된 이론을 분석하였을 때, 일부 세부주제영역 간에 유사한 이론적 기반을 공유하고 있는 것으로 나타났다.

Abstract

Based upon the assumption that both theory building and theory use are intertwined to construct a cohesive body of knowledge in the filed, this study attempts to identify the state of theoretical framework by examining the number and the quality of theoretical articles by subfield. Theoretical article is characterized as an incident in which in which the author contributes to the development or the use of theory in his/her own paper. Theoretical incidents were identified by a content analysis of 1,661 articles in four LIS journals from 1984 to 2003. The findings suggest that the four subfields, such as information seeking/use, information retrieval, library management, and scholar communication had great contributions to both theory building and theory use. Also, two research areas such as bibliometrics and professionals are very likely to be theoretical. Further, the analysis of the name of theories used by subfields could give an insight into the understanding of how the theoretical frameworks of each subfield are related.

초록보기
초록

정보기술의 발전과 더불어 국가경쟁력 및 대국민 서비스 강화를 위한 공공정보시스템의 구축이 확산되고 있다. 또한 막대한 공공재원이 투자되는 공공정보시스템은 효율성에 대한 정기적인 평가를 통한 존재가치의 입증 및 문제점 진단을 통한 성능개선의 요구도 증대되고 있다. 따라서 본 연구는 국내의 대표적인 웹 기반 공공고용정보시스템 워크넷(Work-Net)의 데이터 및 서비스 품질을 102명의 이용자를 대상으로 평가하였다. 측정도구는 학계에서 많이 사용해온 정보내용, 정확성, 적시성, 출력형태, 사용의 용이성, 지원성으로 구성하였으며 t-test와 일원변량분석(one-way ANOVA)을 실시하여 이용자의 특성 및 검색정보에 따른 차이를 살펴보았다. 또한 최근 구직자들의 고용정보시스템에 대한 요구사항들을 분석하였다. 본 연구결과는 공공 및 민간운영 고용정보시스템 운영체제 효율화에 기여할 수 있는 유용한 기초자료를 제공할 것으로 본다.

Abstract

A public information system is being expanded, along with the advance of information technology, to strengthen national competitiveness and provide people with better services. And there also is a growing need for the better performance of that system, as a tremendous amount of public finacial resources is invested in that. To address that need, it's required to make an evaluation of its efficiency on a regular basis to identify its problems and make it work better. The purpose of this study was, accordingly, to examine the quality of data and services provided by the Work-Net, a Web-based public employment information system. The subjects in this study were 102 users of it, and the system was evaluated in terms of content, accuracy, timelines, display format, ease of use and customer support. For data analysis, t-test and one-way ANOVA were implemented to find out the general characteristics of the users, and to see whether or not their view was different according to the type of information they searched for. The findings of this study are expected to lay some foundation for intensifying the efficiency of the public and private employment information systems.

19
이미화(이화여자대학교) 2011, Vol.28, No.3, pp.103-121 https://doi.org/10.3743/KOSIM.2011.28.3.103
초록보기
초록

본 연구는 RDA 자원유형을 KCR4에 적용하기 위한 방안을 모색하기 위한 것이다. KCR4의 GMD는 내용과 용기의 용어가 혼합되어 적합한 용어를 선정하기 어렵고, FRBR 개념모형 구현도 용이하지 않다. SMD도 이용자의 요구에 맞는 최신의 용어가 포함되지 않아 변경이 필요한 실정이다. 기 개발된 RDA 자원유형은 AACR2 GMD의 한계를 극복하기 위해 다양한 용어의 측면을 고려하였고, 앞으로 목록분야에 많은 영향을 줄 수 있다. 따라서 국내 목록환경에 RDA 자원유형의 적용가능성이 모색되어야 할 것이다. 이를 위해 사례조사, 설문조사를 실시하였으며, 사례조사는 국내 대학도서관 한 개 기관을 대상으로 GMD 기술의 전수조사를 실시하여 용어의 변경 및 사서 및 이용자가 원하는 용어의 방향을 파악하였다. 설문조사에서는 국내 대학도서관 사서를 대상으로 자원유형 기술의 현황과 문제점 및 RDA 자원유형 이해정도를 파악하였다. 조사결과 자원유형 용어는 검색과 기술을 위해 구체적이고 이용자가 이해하기 쉬운 용어로 변경이 필요하였다. RDA 적용 테스트에서는 자원유형에 따라 정답률에 차이가 있었다. 조사를 바탕으로 RDA 내용유형에 컴퓨터게임을, 용기유형에 DVD, CD-ROM, Blu-Ray, 컴퓨터파일을 추가하여 KCR4의 자원유형을 제안하였다. 기술방식과 화면출력에서도 RDA의 방식을 제안하였다. 본 연구는 RDA 자원유형의 국내 적용가능성을 모색하여, KCR4 자원유형 개정의 기반을 마련하였다.

Abstract

This study is to seek to apply resource types of RDA to KCR4. It is difficult to choose appropriate term and to embody FRBR model because GMD of KCR4 is the mixture of content-based vocabularies and carrier-based vocabularies. SMD is to need to reflect the current technological terms. Resource type of RDA was already developed to overcome limitation of AACR2's GMD, and would affect the world cataloging environment, therefore it is need to apply resource type of RDA to Korean cataloging rule. For this study, case study and survey were used. In case study, it was to scan all GMD term for one university library to build by programming and to grape librarian and users’ potential need. In the survey by cataloging librarian, it was to figure out the current description of resource type in university library and to test RDA resource type. As a result, it was needed to revise the vocabulary to the obvious and user-understandable list. Also it was different in correction rate in RDA testing by resource type. Based on the case study and the survey, RDA resource type was applied to KCR4 resource list by adding term such as computer game in content type, and by inserting terms such as DVD, CD-ROM, Blu-Ray, computer file in carrier type. It also applied RDA description method and display means to KCR4. This study would apply RDA resource type to KCR4 and contribute to revise KCR4 resource type.

정보관리학회지