바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: : Information Retrieval, 검색결과: 99
초록보기
초록

인터넷의 보급 및 이용 활성화에 따라 인터넷을 통한 정보의 검색 및 획득이 정보검색의 일차적인 행태가 되고 있다. 인터넷을 통한 정보검색의 보편화는 인터넷 정보검색 포털이 제공하는 검색서비스의 중요성을 증대시키고 있다. 포털에서 제공하는 정보검색 서비스의 효율화는 인터넷 정보검색 환경의 효율화로 직결될 수 있다. 이에 본 고에서는 인터넷 정보검색 포털에서 제공하고 있는 서비스 가운데 인터넷 정보자료를 선별하고 조직화하여 제공하고 있는 디렉토리 서비스의 분류체계에 대해 고찰하였다. 구체적인 연구주제로 전통적인 문헌분류법에서 여러 주제분야에 공통적으로 적용될 수 있는 형식, 접근법을 모아 구성한 표준구분(standard subdivision) 항목들을 디렉토리 분류체계에서 어떻게 전개하고 있는 지 현황을 분석해 보았다. 이러한 분석을 기반으로 전통적인 문헌분류법의 표준구분에 포함된 항목들을 디렉토리 서비스에서 전개하는 방안을 제시하였다.

Abstract

With the rapid distribution and active usage of the Internet, information search and retrieval through Internet has become a primary form of information access. This ubiquity of information access through Internet means the increased significance of search performance offered by Internet portals, since the optimization of search performance by portal has strong implication for the effective access of information through Internet in general. In this context, this paper investigates the classification scheme used in the directory service of internet portals, which provides selected and organized access to Internet information. First, the author analyzes the deployment of directory classification of standard subdivision topics used in traditional library classification system, with emphasis on the table composed of the form and approach, which are applicable to diverse subject areas. Then, based on this analysis, he proposed a method of applying certain subdivisions of the standard subdivision to directory service of Internet portals.

72
한희정(전북대학교) ; 김태영(전북대학교) ; 두효철(전북대학교) ; 오효정(전북대학교) 2017, Vol.34, No.4, pp.81-99 https://doi.org/10.3743/KOSIM.2017.34.4.081
초록보기
초록

기술문서는 지식정보사회에서 생성되는 중요 연구 성과물로, 이를 제대로 활용하기 위해서는 정보 요약 및 정보추출과 같은 개선된 정보 처리 방법을 토대로 기술문서 활용의 편의성을 높여줄 필요가 있다. 이에 본 연구는 기술문서의 핵심 정보를 추출하기 위한 방안으로, 기술문서의 구조와 정의문 패턴을 기반으로 전문용어 및 정의문을 자동 추출하고, 이를 기반으로 전문용어사전을 구축할 수 있는 시스템을 제안하였다. 나아가 전문용어사전을 지식메모리로서 보다 다양하게 활용할 수 있도록 전문용어사전에 기반한 개인화서비스 제공방안을 제안하였다. 이처럼 전문용어 및 정의문 자동추출을 기반으로 전문용어사전을 구축하게 되면 새롭게 등장하는 전문용어를 빠르게 수용할 수 있어 이용자들이 최신정보를 보다 손쉽게 찾을 수 있다. 더불어 개인화된 전문용어사전을 이용자에게 제공한다면 전문용어사전의 가치와 활용성, 검색의 효율성을 극대화할 수 있다.

Abstract

Technical documents are important research outputs generated by knowledge and information society. In order to properly use the technical documents properly, it is necessary to utilize advanced information processing techniques, such as summarization and information extraction. In this paper, to extract core information, we automatically extracted the terminologies and their definition based on definitional sentences patterns and the structure of technical documents. Based on this, we proposed the system to build a specialized terminology dictionary. And further we suggested the personalized services so that users can utilize the terminology dictionary in various ways as an knowledge memory. The results of this study will allow users to find up-to-date information faster and easier. In addition, providing a personalized terminology dictionary to users can maximize the value, usability, and retrieval efficiency of the dictionary.

73
정힘찬(전북대학교) ; 김태영(전북대학교) ; 김용(전북대학교) ; 오효정(전북대학교) 2017, Vol.34, No.2, pp.137-158 https://doi.org/10.3743/KOSIM.2017.34.2.137
초록보기
초록

재난은 국민의 생명․신체․재산에 직접적인 영향을 미치는 사건으로, 재난 발생 시 신속하고 효과적인 대응을 위해서는 관련 정보들을 효율적으로 공유, 활용하는 협조 과정이 무엇보다도 중요하다. 현재 재난안전 유관기관별로 다양한 재난안전정보가 생산 및 관리되고 있지만, 각 기관별로 개별적인 용어와 의미를 정의하여 활용하고 있다. 이는 재난안전정보를 검색하고 접근하려는 실무자 입장에서 큰 걸림돌이며, 기관별 정보 활용도를 저해시키는 요인 중에 하나이다. 이러한 문제점을 해결하기 위해 재난안전정보의 통합적 관리를 위한 어휘자원의 표준화 작업의 선행 연구로, 본 연구에서는 재난안전 유관기관에서 관리하고 있는 어휘자원의 현황분석을 수행하였다. 또한 수집된 어휘자원을 대상으로 정보제공자 및 이용자 관점에서의 활용도 분석을 통해 어휘 그룹별 특성을 파악하고 이에 기반해 재난안전정보 관리를 위한 활용방안을 제안하였다.

Abstract

Disaster has a direct influence on the lives of the people, the body, and the property. For effective and rapid disaster responses, coordination process based on sharing and utilizing disaster information is the essential requirement Disaster and safety control agencies produce and manage heterogeneous information. They also develop and use word dictionaries individually. This is a major obstacle to retrieve and access disaster and safety information in terms of practitioners. To solve this problem, standardization of lexical resources related disaster and safety is essentially required. In this paper, we conducted current status analysis about lexical resources in disaster and safety domain. Consequently, we identified the characteristics according to lexical groups. And then we proposed the utilization plan of lexical resources for disaster and safety information management.

초록보기
초록

이 연구는 정보관리학회지의 초록의 현황에 대한 조사와 분석을 통해 초록의 특징을 진단하고자 한다. 이를 위해 학회지의 저자초록을 중심으로 초록의 구성요소, 초록의 유형 등을 분석하였다. 대상초록은 1984년부터 2015년까지 간행된 학회지 논문이다. 그 결과 수록논문은 1,168편, 지시적 초록은 96.6%, 통보적 초록은 3.4%, 국어와 영어 병기 초록은 99.5%였다. 연구방법에서 문헌사례 52.8%, 설문조사 21.1%, 실험이 26.1%였다. 문단과 문장에서 1문단이 92.1%, 2문단 이상이 7.9%, 5문장 이하가 79%, 6문장 이상이 21%, 1인칭 사용이 90.5%로 나타났다. 주제영역은 도서관/정보센터경영 19.4%, 정보서비스 17.3%, 정보공학 16.4%, 정보검색 15.1%, 계량정보 9.6% 등의 순으로 나타났다.

Abstract

This study aims to identify the characteristics of abstracts by analyzing the status of abstracts published in ‘Journal of the Korean Society for Information Management.’ To this end, the study analyzed the components of and the types of abstracts. Target abstracts were those published in the journal from 1984 to 2015. The journal published 1,168 articles with indicative abstracts accounting for 96.6%, informative abstracts 3.4%, and abstracts written in both English and Korean 99.5%. As for research methods, case study through literature review was 52.8%, surveys 21.1%, and experimentation 26.1%. The percentage of abstracts consisting of one paragraph was 92.1%, more than two paragraphs were 7.9%, fewer than 5 sentences were 79%, and 6 sentences or more were 21%. The use of the first person was 90.5%. In terms of topic areas, library and information center management was 19.4%, information services 17.3%, information technology 16.2%, information retrieval 15.1%, and informetrics 9.6%, etc.

75
이창열(동의대학교) ; 정의석(고려대학교) 2006, Vol.23, No.4, pp.165-177 https://doi.org/10.3743/KOSIM.2006.23.4.165
초록보기
초록

한국정보문화진흥원이 관리하는 국가 지식정보자원은 여러 기관에 분산되어 있으며, 메타데이터 규격은 통합이 아니라 검색을 위한 개념적 수준의 권고 표준이었다. 그래서 데이터를 연계하거나 통합하는데 많은 문제가 발생하고 있다. 본 논문에서는 여러 기관에 분산된 지식정보자원에 대한 통합을 위하여 기존에 여러 기관에 분산된 메타데이터를 분석하여 문제점을 도출하고 이를 보완하며, 지속적으로 연계 및 통합할 수 있는 표준 모델을 제시하고자 한다.

Abstract

National Knowledge and Information Resources of KADO(Korea Agency for Digital Opportunity and Promotion) were distributed to the several data centers. The metadata for the resources was the conceptual level recommended standard. It was not for the integration, but the retrieval. So it is not easy to integrate to the central metadata DB or connect metadata among the data centers. In this paper, we analysed the metadata of the several data centers and provided the integrated standard model for the central metadata DB.

초록보기
초록

본 연구는 문헌정보학 측면에서 국외 독서 및 독서교육 연구의 동향을 분석하고 향후의 연구과제를 제시하였다. 이를 위해 첫째, 문헌정보학 분야 국외 데이터베이스(LISTA)의 통제 키워드와 DDC 23판을 검토하여 독서 및 독서교육 관련 주요 연구 영역을 설정하였다. 둘째, 문헌정보학 분야 국외 데이터베이스(LISTA)에서 검색한 지난 100년(1914년~2014년) 동안의 독서 및 독서교육 관련 학술논문(2,115편)을 대상으로 지적구조 분석을 적용하여 연구동향을 분석하였다. 셋째, 이러한 연구동향 분석의 결과에 기초하여 독서 및 독서교육 분야의 향후 연구과제를 제시하였다.

Abstract

This study aims to analyse the research areas and trends of reading (reading instruction) abroad in the respect of LIS, and suggest future research tasks. First, I reviewed the controlled keywords in SU field of LISTA database and the entries of DDC 23, and identified the research areas of reading and reading instruction in overseas. Second, I analysed the research trends of this field by applying a intellectual structure analysis on 2,115 research articles (1914~2014) retrieved from a representative database in the areas of Library and Information Science (LISTA). Third, Based on the results of these analysis, I suggested the future research tasks of this field in the domain of library and information science.

77
최윤수(한국과학기술정보연구원) ; 정창후(한국과학기술정보연구원) ; 조현양(경기대학교) 2011, Vol.28, No.1, pp.89-104 https://doi.org/10.3743/KOSIM.2011.28.1.089
초록보기
초록

대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

Abstract

Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In order to extract these entities automatically from scientific documents at once, we developed a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer and terminology extractor.

초록보기
초록

본 연구는 우리나라 대표적인 정보학분야 학회지인 『정보관리학회지』에 25년 동안에 발표된 학술논문을 대상으로 동향분석을 시도하여 각 시기별 우리나라 정보학분야의 학문적 구조와 그 변화를 파악하였다. 이를 위하여 먼저 25년을 1984-1994, 1995-2002, 2003-2009로 나눈 다음, 각 기간별 『정보관리학회지』에 실린 학술논문의 주제를 분석한 후 각 논문의 주제분포, 주제영역별 논문의 증감, 주제영역별 연도 분포를 살펴보았다. 또한 논문의 표제어를 이용하여 기간별 정보학의 지적 구조를 생성하였고 세 개의 지적 구조를 비교하여 정보학 연구의 변화를 분석하였다. 그 결과 『정보관리학회지』 연구의 주요 대주제 영역은 ‘정보서비스’, ‘정보조직’ 그리고 ‘정보시스템’이며 소주제 영역은 도서관서비스, 이용자연구, 자동문헌처리, 도서관통합시스템, 시소러스/온톨로지, 디지털도서관인 것으로 나타났다. 또한 표제어의 지적 구조를 분석한 결과, 정보학의 핵심영역은 여전히 정보검색이지만 각종 도서관이나 시스템에 활용된 정보기술 기법이나 서비스 평가에 대한 연구가 점점 늘어나고 이에 대한 주제영역이 확장되고 있음을 알 수 있었다.

Abstract

The aims of this study were to provide a global overview of research trends in information science and to trace its changes in the main research topics over time using trends analysis. The study examined the topics of research articles published in Journal of Korean Society for Information Management between 1984 and 2009. Rather than taking a single snapshot of a given point in time, this study attempted to present a series of such pictures in order to identify trends over time. The fairly arbitrary decision was taken to divide the period under consideration into three ‘publication windows’: 1984-1994, 1995-2002, 2003-2009. The study revealed that the most productive areas were ‘Information Service’, followed by ‘Information Organization’, and ‘Information System’. The most productive sub-areas were ‘Library Service’, ‘User Study’, ‘Automatic Document Analysis’, ‘ILS’, ‘Thesaurus/Ontology’, and ‘Digital Library’. From the comparisons of intellectual structures of title keywords, the key research area in the field of Information Science was ‘Information Retrieval’. The studies of IT applications and service system evaluation have been expanded.

79
정은경(이화여자대학교) ; 윤정원(University of South Florida) 2010, Vol.27, No.2, pp.37-60 https://doi.org/10.3743/KOSIM.2010.27.2.037
초록보기
초록

Abstract

The purpose of this study is to investigate image search query reformulation patterns in relation to image attribute categories. A total of 592 sessions and 2,445 queries from the Excite Web search engine log data were analyzed by utilizing Batley’s visual information types and two facets and seven sub-facets of query reformulation patterns. The results of this study are organized with two folds: query reformulation and categorical transition. As the most dominant categories of queries are specific and general/nameable, this tendency stays over various search stages. From the perspective of reformulation patterns, while the Parallel movement is the most dominant, there are slight differences depending on initial or preceding query categories. In examining categorical transitions, it was found that 60-80% of search queries were reformulated within the same categories of image attributes. These findings may be applied to practice and implementation of image retrieval systems in terms of assisting users’ query term selection and effective thesauri development.

80
김현희(명지대학교) ; 안태경(대외경제정책연구원) 2003, Vol.20, No.1, pp.417-455 https://doi.org/10.3743/KOSIM.2003.20.1.417
초록보기
초록

온톨로지는 웹자원을 지식화함으로써 정보의 효율적 검색, 통합, 재사용을 도모할 수 있는 새로운 기술인 시맨틱 웹의 구현을 위한 가장 핵심적인 요소 기술로 알려지고 있다. 온톨로지는 사람간에 그리고 서로 다른 응용 시스템간에 지식을 공유하고 재이용하는 방법을 제공하는 기술로서 특정 주제에 관한 지식 용어들의 집합으로서 이들 용어뿐만 아니라 용어간의 의미적 연결 관계와 간단한 추론 규칙을 포함한다. 본 연구에서는 인터넷 웹상에서 국제기구에 관한 정보를 체계적으로 관리하고 검색하기 위해서 국제기구 온톨로지를 설계하고 이 온톨로지에 기반 하여 검색 시스템을 구현해 보고, 이 시스템을 20개의 탐색 질문들을 이용하여 기존의 인터넷 검색엔진과 적합성과 탐색 시간이라는 두 가지 요인을 통해서 비교해 보았다. 실험 결과에 의하면 적합성 측정은 온톨로지 기반 시스템은 평균 4.53, 인터넷 검색엔진은 평균 2.51로 온톨로지 기반 시스템의 적합도가 1.80배 높은 것으로 나타났다. 또한 탐색시간은 온톨로지 기반 시스템은 평균 1.96분, 인터넷 검색엔진은 평균 4.74분으로 인터넷 검색엔진이 온톨로지 기반 시스템 보다 2.42배 정도 더 많은 탐색시간이 필요한 것으로 나타났다.

Abstract

Ontologies are formal theories that are suitable for implementing the semantic web, which is a new technology that attempts to achieve effective retrieval, integration, and reuse of web resources. Ontologies provide a way of sharing and reusing knowledge among people and heterogeneous applications systems. The role of ontologies is that of making explicit specified conceptualizations. In this context, domain and generic ontologies can be shared, reused, and integrated in the analysis and design stage of information and knowledge systems. This study aims to design an ontology for international organizations, and build an Internet web retrieval system based on the proposed ontology, and finally conduct an experiment to compare the system performance of the proposed system with that of Internet search engines focusing relevance and searching time. This study found that average relevance of ontology- based searching and Internet search engines are 4.53 and 2.51, and average searching time of ontology-based searching and Internet search engines are 1.96 minutes and 4.74 minutes.

정보관리학회지