바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Retrieval, 검색결과: 9
초록보기
초록

본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.

Abstract

This study compared and analyzed 15 CBMR (Content-based Music Retrieval) systems accessible on the web in terms of DB size and type, query type, access point, input and output type, and search functions, with reviewing features of music information and techniques used for transforming or transcribing of music sources, extracting and segmenting melodies, extracting and indexing features of music, and matching algorithms for CBMR systems. Application of text information retrieval techniques such as inverted indexing, N-gram indexing, Boolean search, truncation, keyword and phrase search, normalization, filtering, browsing, exact matching, similarity measure using edit distance, sorting, etc. to enhancing the CBMR; effort for increasing DB size and usability; and problems in extracting melodies, deleting stop notes in queries, and using solfege as pitch information were found as the results of analysis.

초록보기
초록

본 연구에서는 주요 검색 포털들의 검색어 추천 서비스를 분석, 평가하였다. 이 연구에서는 네이버와 구글 코리아를 대상으로 추천되는 연관 검색어의 적합도 및 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 또한 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하고, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교하였다. 연구 결과, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 또한 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 본 연구의 결과는 향후 포털들의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다.

Abstract

This study aims to analyze and evaluate term suggestion services of major search portals, Naver and Google Korea. In particular, this study evaluated relevance and currency of related search terms provided, and analyzed characteristics such as number and distribution of terms, and queries that did not produce terms. This study also analyzed types of terms in terms of the relationship between queries and terms, and investigated types and characteristics of harmful terms and terms with grammatical errors. Finally, Korean queries and English queries, and popular queries and academic queries were compared in terms of the amount and relevance of search terms provided. The results of this study show that the relevance and currency of Naver's related search terms are somewhat higher than those of Google. Both Naver and Google tend to add terms to or delete terms from original queries, and provide identical search terms or synonym terms rather than providing entirely new search terms. The results of this study can be implemented to the portal's effective development of term suggestion services.

초록보기
초록

본 연구는 무형문화유산 기록물의 효과적인 관리, 검색, 활용을 위하여 FRBR 모형을 기반으로 한 메타데이터 요소들을 개발하였다. 무형문화유산은 추상적인 개념에서부터 이를 구현한 물리적 자료에 이르기까지 논리적 계층을 가지고 있고, 특정한 무형유산이 영상, 음향 등 여러 매체로 표현되기 때문에 다양한 연관 관계들을 충분히 표현하는 작업이 반드시 필요하다. 따라서 본 연구에서는 FRBR 모형에서 제시하는 제1집단 4계층 구조를 바탕으로 무형문화유산 및 관련 기록물을 저작, 표현형, 구현형, 개별자료의 4개 수준으로 나누어 각 수준에서 필요로 하는 메타데이터 요소를 제안하였다.

Abstract

This study develops metadata elements based on the FRBR model for effectively managing and retrieving intangible cultural heritage records. Since intangible cultural heritage has a logical layer from its abstract concept to a physical record that realizes the concept and it can be expressed in diverse formats such as video and audio, it is necessary to represent such rich relationships. Therefore, this study suggests a set of metadata elements at each of the four levels (work, expression, manifestation, and item) the FRBR Group 1 presents.

초록보기
초록

본 연구는 다양한 유형의 시각예술자원을 소장 기관이나 관리 주체에 관계없이 통합적으로 접근하고 이용할 수 있도록 하기 위한 통합검색의 필요성을 파악하고, 그 실현을 위한 기반 논의와 방안을 제시하기 위한 목적을 가지고 있다. 이를 위하여 국내 시각예술자원 관리 기관의 자원 관리 및 검색 서비스 현황을 파악하고, 국외의 관련 사례 분석을 통해 시각예술자원의 통합 검색 유형과 특성을 파악하였다. 이러한 분석을 바탕으로 향후 국내 시각예술자원의 통합검색의 적용을 위해 필요한 환경적 측면과 메타데이터와 시스템적인 측면의 기반조성 및 적용 방향성을 제시하였다.

Abstract

The aim of this study is to reveal a necessity of and a strategy for the integrated use and the single search across the visual arts resources. For this purpose, at first, analysis was made on the current situation of Korean visual art resource management and retrieval systems. Secondly, the single search methods and its related technological foundation in foreign art resource institutions were categorized and analysed. As a result, this study suggested foundation for creating a sustainable environment for collaboration and single search that enhance access to and use of art resources.

5
서은경(한성대학교) ; 유소영(한남대학교) 2013, Vol.30, No.4, pp.215-239 https://doi.org/10.3743/KOSIM.2013.30.4.215
초록보기
초록

Abstract

Even though the overall scholarly community has recognized a dramatic growth and changes in the Information Science research in Korea over the last few decades, there are still only few studies that have identified the changes in terms of long-term and dynamic point of view. We have analyzed 1,007 IS-research articles from leading Korean journals in KCI (Korea Citation Index), published between 2000 and 2011. To discern the trendline of changes in research interests over time, we conducted a time-series analysis by developing grounded subject scheme from the article set and checking the growth rate of the number of published articles and title keywords. A comparative analysis was also conducted by constructing and comparing co-word maps over time to discover visible changes in research topics over this 12-year period of the IS-research in Korea. As a result, we identified some developments and transformations in major subject areas and knowledge structure of the IS-research in Korea over time. The major trend we discovered is that IS-studies over the 12-year period evolved from system-oriented research to library-application research. The changes are especially observed in knowledge management, Web-based system evaluation, and information retrieval areas. When compared to the results of other studies, the result of our study may serve as an evidence of the localization of Korean IS-studies in the first decade of the 21st century.

6
진설아(연세대학교) ; 허고은(연세대학교) ; 정유경(연세대학교) ; 송민(연세대학교) 2013, Vol.30, No.1, pp.285-302 https://doi.org/10.3743/KOSIM.2013.30.1.285
초록보기
초록

본 연구는 높은 접근성과 간결성으로 인해 방대한 양의 텍스트를 생산하는 트위터 데이터를 분석하여 토픽의 변화 시점 및 패턴을 파악하였다. 먼저 특정 상품명에 관한 키워드를 추출한 후, 동시출현단어분석(Co-word Analysis)을 이용하여 노드와 에지를 통해 토픽과 관련 키워드를 직관적으로 파악 가능한 네트워크로 표현하였다. 이후 네트워크 분석 결과를 검증하기 위해 출현빈도 기반의 시계열 분석과 LDA 토픽 모델링을 실시하였다. 또한 트위터 상의 토픽 변화와 언론 기사 검색결과를 비교한 결과, 트위터는 언론 뉴스에 즉각적으로 반응하며 부정적 이슈를 빠르게 확산시키는 것을 확인하였다. 이를 통해 기업은 대중의 부정적 의견을 신속하게 파악하고 이에 대한 즉각적인 의사결정 및 대응을 위한 도구로 본 연구방법을 활용할 수 있을 것으로 기대된다.

Abstract

This study identified topic shifts and patterns over time by analyzing an enormous amount of Twitter data whose characteristics are high accessibility and briefness. First, we extracted keywords for a certain product and used them for representing the topic network allows for intuitive understanding of keywords associated with topics by nodes and edges by co-word analysis. We conducted temporal analysis of term co-occurrence as well as topic modeling to examine the results of network analysis. In addition, the results of comparing topic shifts on Twitter with the corresponding retrieval results from newspapers confirm that Twitter makes immediate responses to news media and spreads the negative issues out quickly. Our findings may suggest that companies utilize the proposed technique to identify public’s negative opinions as quickly as possible and to apply for the timely decision making and effective responses to their customers.

초록보기
초록

패싯 내비게이션의 구성 요소인 패싯의 명칭과 하위 구성 용어, 패싯의 순서, 지나치게 많은 검색 결과의 수 등이 이용자 중심적인지를 분석하였다. 연구 방법은 국내의 15개 대학도서관 목록에서 3개의 검색어로 검색한 결과를 분석하였으며, 이용자가 이들 용어에 대해서 느끼는 친숙도 조사도 함께 수행하였다. 국내 대학도서관들에서 제공하고 있는 발행년도와 총서명 등의 패싯 명칭과 멀티미디어와 비도서, 미디어 자료 등의 하위 용어들은 이용자들이 직관적으로 이해할 수 없었으며, 목록규칙에서 사용된 용어들과 사서들이 사용하는 용어들이 많았다. 그리고 패싯을 적용해도 검색 결과의 수가 많아지는 단점을 해결하기 위해서 적합성 순위화와 같은 기법을 적용할 필요가 있다. 그리고 지나치게 많은 하위 수준이 발생할 수 있는 가능성도 발견할 수 있었으며, 이것도 도서관 목록에 대한 이용자 경험에 악영향을 미칠 것으로 보인다.

Abstract

This research analyzed how the main requisites of faceted navigation as names of facets, subterms of facets, order of facets, too many results were user-centric. On the research method, this research analyzed the results of the three keywords retrieved in the 15 university libraries’ catalogs and how was user’s familiarity to the terms. Although domestic universities have serviced facet navigation, the names of the facet of publication date and series title in format and the terms under the facets as multimedia and nonbook material, media material are too difficult intuitively to understand and there were lots of formal terms used in cataloging rules and the terms librarians have usually used. Because of the terms, there is high possibility to deteriorate users’ satisfaction and usability to library catalog in future. Even though they serviced facet navigation, there was also weakness as too many results and the university libraries need to use relevance ranking method to solve the weakness. This research has found the possibility of being used too many of levels of the facets and this may also badly affect the users’ experience to library catalog.

초록보기
초록

이 연구에서는 특정 주제 분야의 핵심적이고 전역적인 연구 동향을 제공하는 연구지원 정보서비스 개발을 위해 SPLC(Search Path Link Count) 분석을 적용할 때, 데이터의 범위와 인용빈도 설정에 대하여 탐험적으로 살펴보고자 하였다. 이를 위하여 Web of Science에서 검색된 RGB LED 분야의 2,318개 논문과 20,109개 상위 인용논문으로 5개의 데이터셋을 구성하였다. 각 데이터셋에서 히스토리오그래프와 SPLC 네트워크를 인용빈도 임계치를 변화시키면서 28개 주요 연구 동향 네트워크를 추출하여, 인용문헌의 포함여부와 인용빈도 임계치 설정이 SPLC 네트워크에 미치는 영향을 살펴보았다. 그리고 특정 기관 소속 연구자들에게 SPLC 네트워크에 포함된 198개 주요 논문 리스트를 제공하고 피드백을 받음으로써, 전역적 연구 동향이 개인 연구자의 정보 요구에 부합하는지 살펴보았다. 분석 결과, 분석 대상에 상위 인용문헌 포함 여부와 인용빈도임계치에 따라 추출되는 SPLC 네트워크가 변화되었으나, 일정 인용빈도임계치값에서는 수렴하였다. 그리고 개인 연구자의 정보 요구는 SPLC를 통해 제공된 전역적 연구 동향과 출판년도의 차이는 있지만 대체적으로 일치하는 것으로 나타나, 인용문헌을 포함하여 인용빈도임계치를 변화시키는 SPLC 분석을 통해 개인 이용자가 원하는 전역적 연구 정보를 제공해 줄 수 있는 것으로 해석된다. 이를 일반화하기 위해서는 이 탐색적 연구에서 제안된 방법을 다양한 분야에 적용하는 후속 연구가 필요할 것이다.

Abstract

The purpose of this study is to examine the data coverage and citation threshold for analyzing SPLC(Search Path Link Count) as a main path of a historiograph of a certain topic in order to provide ‘core’ papers of global research trends to a researcher affiliated with a local R&D institution. 5 datasets were constructed by retrieving and collecting 2,318 articles on RGB LED on Web of Science published from 1990-2013 and 20,109 articles which cited these original 2,318. The SPLC analysis was performed on each dataset by increasing the threshold of citation counts, and the changes and resilience of the 28 extraced networks were compared. The results of user feedback on 198 unique core papers from 28 SPLC networks received from LED researchers affiliated with a Korean government-sponsored research institution were also analyzed. As a result, it is found that the nodes in each SPLC network in each dataset were differentiated by the citation counts, while the changes in the structure of SPLC networks were slight after the networks’ citation counts were set at 40. Additionally, the user feedback showed that personalized research interest generally matched to the global research trends identified by the SPLC analysis.

9
박자현(연세대학교) ; 송민(연세대학교) 2013, Vol.30, No.1, pp.7-32 https://doi.org/10.3743/KOSIM.2013.30.1.007
초록보기
초록

본 연구는 국내 문헌정보학 분야의 연구동향을 규명하기 위하여 문헌정보학 주요 학술지인, 정보관리학회지, 한국문헌정보학회지, 한국도서관․정보학회지, 한국비블리아학회지의 1970년도부터 2012년도까지 발표 논문 초록을 수집하여 LDA(Latent Dirichlet Allocation)기반의 토픽 모델링 실험을 수행하였다. 그 결과를 종합하면 다음과 같다. 첫째, 토픽모델링 실험에서 도출된 연구주제를 문헌정보학 주제분류표와 비교․분석한 결과, ‘정보학’영역의 디지털도서관, 이용연구, 인터넷, 전문가시스템, 계량정보학, 자동화, 정보검색, 정보시스템, ‘도서관 서비스’영역의 정보서비스, 도서관 유형별 서비스, 이용자 교육/정보리터러시, 서비스 평가, ‘문헌정보학 기초’영역의 도서관과 사회, 전문성, ‘자료조직’영역의 분류, 편목, 메타데이터, ‘도서관 경영’영역의 도서관 평가, 장서개발/관리, ‘서지학’영역의 고서지, ‘도서관 체제’영역의 도서관 및 정보정책, ‘출판’영역의 도서/출판, ‘기록관리학’영역의 하위주제 등과 연결할 수 있었다. 또한 가장 많은 연구주제가 발견된 학문영역은 정보학과 도서관서비스로 나타났다. 둘째, 문헌정보학의 주요 연구주제에서 도서관 유형별 서비스 및 평가, 인터넷, 메타데이터의 연구주제는 상승세를 보였으나, 도서, 분류, 편목, 고서지에 관한 연구주제는 하강세를 보였다. 셋째, 학술지를 구분하여 비교․분석한 결과, 정보관리학회지는 도서관에 관한 연구주제보다 정보학에 관한 연구주제가 많이 출현하였고, 한국문헌정보학회지와 한국도서관․정보학회지, 한국비블리아학회지는 도서관에 관한 연구주제가 정보학에 관한 주제보다 많이 나타났다.

Abstract

The goal of the present study is to identify the topic trend in the field of library and information science in Korea. To this end, we collected titles and abstracts of the papers published in four major journals such as Journal of the Korean Society for information Management, Journal of the Korean Society for Library and Information Science, Journal of Korean Library and Information Science Society, and Journal of the Korean BIBLIA Society for library and Information Science during 1970 and 2012. After that, we applied the well-received topic modeling technique, Latent Dirichlet Allocation(LDA), to the collected data sets. The research findings of the study are as follows: 1) Comparison of the extracted topics by LDA with the subject headings of library and information science shows that there are several distinct sub-research domains strongly tied with the field. Those include library and society in the domain of “introduction to library and information science,” professionalism, library and information policy in the domain of “library system,” library evaluation in the domain of “library management,” collection development and management, information service in the domain of “library service,” services by library type, user training/information literacy, service evaluation, classification/cataloging/meta-data in the domain of “document organization,” bibliometrics/digital libraries/user study/internet/expert system/information retrieval/information system in the domain of “information science,” antique documents in the domain of “bibliography,” books/publications in the domain of “publication,” and archival study. The results indicate that among these sub-domains, information science and library services are two most focused domains. Second, we observe that there is the growing trend in the research topics such as service and evaluation by library type, internet, and meta-data, but the research topics such as book, classification, and cataloging reveal the declining trend. Third, analysis by journal show that in Journal of the Korean Society for information Management, information science related topics appear more frequently than library science related topics whereas library science related topics are more popular in the other three journals studied in this paper.

정보관리학회지