바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 정보 검색, 검색결과: 8
1
정영미(연세대학교) ; 이용구(계명대학교) 2005, Vol.22, No.2, pp.125-145 https://doi.org/10.3743/KOSIM.2005.22.2.125
초록보기
초록

이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음, 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 92%의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 67% 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 39.6%의 정확률을 보였고, EM 알고리즘 통합 검색이 약 36%의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 37%와 비교하면 나이브 베이즈 통합 검색은 약 7.4%의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 3%의 성능 저하율을 보였다.

Abstract

This paper presents a semantic vector space retrieval model incorporating a word sense disambiguation algorithm in an attempt to improve retrieval effectiveness. Nine Korean homonyms are selected for the sense disambiguation and retrieval experiments. The total of approximately 120,000 news articles comprise the raw test collection and 18 queries including homonyms as query words are used for the retrieval experiments. A Naive Bayes classifier and EM algorithm representing supervised and unsupervised learning algorithms respectively are used for the disambiguation process. The Naive Bayes classifier achieved 92% disambiguation accuracy, while the clustering performance of the EM algorithm is 67% on the average. The retrieval effectiveness of the semantic vector space model incorporating the Naive Bayes classifier showed 39.6% precision achieving about 7.4% improvement. However, the retrieval effectiveness of the EM algorithm-based semantic retrieval is 3% lower than the baseline retrieval without disambiguation. It is worth noting that the performances of disambiguation and retrieval depend on the distribution patterns of homonyms to be disambiguated as well as the characteristics of queries.

초록보기
초록

기계가 정보의 의미를 이해하고 처리할 수 있도록 기존의 웹을 확장하는 것을 목적으로 하는 시멘틱 웹은 온톨로지를 이용하여 지식을 공유하게 된다. 본 논문에서는 정교한 질의의 처리를 위하여 온톨로지 내에 존재하는 의미 관계들을 질의의 확장을 위한 연관피드백 정보로 이용하는 방안을 제안한다. 실험은 도메인 온톨로지인 Medicine 온톨로지를 대상으로 하였으며, 출현 용어들의 빈도정보만을 이용한 키워드기반 문서검색과 제안한 온톨로지기반 문서검색의 성능을 비교하였다. 이 때, 두 시스템의 정확률과 재현율을 성능 평가의 기준으로 삼았다. 그 결과, 검색 엔진은 온톨로지에 정의된 개념들과 규칙들을 활용하면서 검색의 정확률을 향상시키는데 도움이 되었고 검색 성능을 향상시키기 위한 추론의 기반으로도 사용될 수 있었다.

Abstract

For the purpose of extending the Web that is able to understand and process information by machine, Semantic Web shared knowledge in the ontology form. For exquisite query processing, this paper proposes a method to use semantic relations in the ontology as relevance feedback information to query expansion. We made experiment on pharmacy domain. And in order to verify the effectiveness of the semantic relation in the ontology, we compared a keyword based document retrieval system that gives weights by using the frequency information compared with an ontology based document retrieval system that uses relevant information existed in the ontology to a relevant feedback. From the evaluation of the retrieval performance, we knew that search engine used the concepts and relations in ontology for improving precision effectively. Also it used them for the basis of the inference for improvement the retrieval performance.

초록보기
초록

이 연구는 웹정보원의 지적 구조를 동시링크분석을 이용하여 시기별 변화와 검색엔진별 차이를 중심으로 분석하였다. 지적 구조의 시기별 변화를 분석한 결과, 이차원 지도상에 나타난 웹정보원의 군집과 위치는 6년간의 시간흐름에 따른 지적 구조의 변화를 나타냈다. AltaVista와 MSN Search 검색엔진을 대상으로 지적구조의 차이를 분석한 결과, 웹정보원 지도에 나타난 전체적인 지적 구조는 유사한 양상을 나타냈지만, 몇몇 웹정보원의 경우 소속 군집이 달라지는 경우가 발생했다. 인쇄 정보원에 적용되던 동시인용기법이 웹정보원에 대한 통시적 분석에도 응용될 수 있음을 확인하였다.

Abstract

This research analyzed changes of the intellectual structure of web information by examining time changes and search engines using the co-links analysis. According to the results, the co-links web information clusters on the two maps appeared to contain changes in the intellectual structure over the two time periods.The intellectual structure that appeared in the information map for AltaVista and MSN Search engines was relatively similar. However, there were also cases where the clusters of some web information was different. The results of the research revealed that the cocitation analysis could be applied simultaneously to diachronous analysis in the web information.

4
이정연(나사렛대학교) ; 정동열(이화여자대학교) 2005, Vol.22, No.4, pp.39-59 https://doi.org/10.3743/KOSIM.2005.22.4.039
초록보기
초록

본 연구는 정보활용능력의 기준과 범위를 설정하여 평가영역 및 평가문항을 설계함과 동시에 대학생들의 현재 정보활용능력의 수준을 진단하고 분석하여 정보활용능력 개발을 위한 평가모형을 제시하는데 목적이 있다. 실증적인 연구를 위해 정보활용능력 웹 평가사이트를 설계하여 학부학생을 대상으로 정보활용능력을 측정하였다. 정보활용능력 구성영역을 통계적 요인분석을 통해 정보자원 영역, 정보요구 영역, 정보검색 영역, 정보분석 영역, 정보기술 및 표현 영역, 정보윤리 영역임을 밝혀내었고, 기초환경 요인, 자가진단 요인, 영역별 요인, 정보활용능력 총점 요인 및 문항분석을 통해 평가설계 요소와 평가절차, 영역별, 수준별 교육 및 평가지침을 제시하였으며, 이를 근거로 정보활용능력의 통합적 평가모형을 개발하였다.

Abstract

This study is aimed to evaluate the undergraduate students’ information literacy, examine the current level of their capability of using information, and make a evaluation model to develop information literacy. Information literacy consists of six fields: information resources, information needs, information search, information analysis, information technology and presentation, and information ethics. Based on the result of statistic factor analysis, the integrated evaluation model of information literacy, evaluation factor, and evaluation procedure can be suggested based on the instruction guidance.

초록보기
초록

웹, XML, EAD 등을 포함한 새로운 기술과 기술(description)도구의 출현으로 기존의 도서관자료와 기록물을 통합 관리할 수 있고, 정보교환을 위한 다양한 검색보조도구를 모두 수용할 수 있는 내용표준에 대한 필요성이 부각되고 있다. 이에 본 연구에서는 기록물업계의 국제적 동향을 반영하여 ISAD(G) 및 ISAAR(CPF)와 조화를 이루고, MARC과 EAD 등 다양한 검색보조도구의 데이터구조 표현을 수용할 수 있도록 제정된 DACS와 기존의 기술규칙인 APPM2를 비교분석하였다. 분석결과를 토대로 우리나라 기록물 기술규칙 제정시 고려해야 할 사항들을 제시하였다.

Abstract

The advent of new technologies and descriptive tools, including the Web, XML, and EAD, have highlighted the necessity of content standard which can integrate and manage to library materials and archives and accommodate various finding aids for information exchange. This research analyzes both APPM2 and DACS. The former is an old established description rule. On the other hand, the latter keeps step with ISAD(G) and ISAAR(CPF) as adopting the international trend of archives and is able to describe the data structure of a variety of finding aids including MARC, EAD, etc. As a result, it presents the points to take into consideration as making descriptive rules about our archives.

초록보기
초록

본 연구는 2년제 전문대학 학생들을 대상으로 웹기반 온라인목록의 이용특성을 조사 연구한 것이다. 연구방법으로 이용자들의 특성을 분석하기 위하여 질문지법과 면접조사법을 통해 데이터를 수집하였으며, 수집된 데이터의 처리는 통계처리 프로그램인 SPSSWIN 10.1을 사용하여 분석하였다. 연구결과 이용행태, 검색결과 만족도, 웹 온라인목록의 선호도, 검색어 선정, 문헌정보학 전공자와 비전공자 간의 탐색성과 차이, 웹 온라인목록의 이용자교육의 필요성 등에 관한 결과를 얻었다. 이러한 분석결과를 근거로 하여 웹 온라인목록 이용 중에 발생하는 문제점과 어려움을 느끼는 기능들에 대해 개선방안을 제시하여 이용자들로 하여금 웹 온라인목록 이용의 효율성을 돕고자 하였다.

Abstract

The aims of this study is to analyse the user's behavior, satisfaction, difficulties and selection of retrieval keywords for the use of Web-based OPAC in the College students. The methods of the questionnaire and the interview was applied to get the data and processed by using SPSSWIN 10.1. Several research results was proved the hypothesis such as differences between major subject of students in their fields. Furthermore, based on the result of this analysis, another purpose is to come up with the improvements of functions prompting difficulties and answers to problems found in the Web OPAC, helping them to use the Web OPAC efficiently.

초록보기
초록

디지털자원의 영구보존을 효율적으로 수행하기 위해서는 디지털자원의 고유의 속성과 변화를 설명해주는 지적 정보 즉 보존 메타데이터가 구조적으로 그리고 체계적으로 표기되어야 한다. 보존 메타데이터는 외부적/내부적 변화와 상관없이 사용자가 보다 쉽게 원하는 진본 데이터에 접근하여 검색할 수 있도록 하며 관리자는 보다 효율적으로 정보자원을 관리하고 보존할 수 있도록 한다. 따라서 202년 OAIS 참조모형(ISO 14721 )이 보존 메타데이터 표준을 권고한 이후 외국의 여러 국가 디지털도서관에서는 각 나라의 실정에 맞게 보존 메타데이것이다. 본 연구는 먼저 OAIS가 권고한 정보모델과 디지털자원의 장기적 보존을 위해서 외국 도서관에서 개발된 보존 메타데이터 요소세트에 대해서 비교 분석하였고, 우리나라 대학도서관에서는 어떻게 보존 메타데이터를 구축하고 활용하고 있으며, 어떠한 보존 메타데이터 요소들이 대학도서관에 적합한지를 조사하였다. 이를 기반으디지털자원의 보존 메타데이터 요소세트를 제안하였다.

Abstract

The preservation metadata which is defined the property and his tory of changes must be describes logically and structurally for implementing long-term digital preservation. The thentic digital resources and the managers of digital archives to manage and preserve more ef fectively the digital resources. his paper is review of recent developments relating to digital preservation metadata including f OAIS and outlines some library-based projects. Next, the paper investigates how to dev elop and use the preservation metadata in university libraries and what is the core preservat ion metadata elements. Finally, reservation metadata elements with broad aplicability to digital preservation in university libraries.

초록보기
초록

본 연구는 기존의 도서관정보시스템에서 기록물을 검색, 이용할 수 있도록 기록물용 KORMARC 데이터필드 개발을 위한 메타데이터 요소를 설정하였다. 본 연구의 결과를 요약하면 다음과 같다.첫째, 본 연구에서는 ISAD(G)2에서 제시하고 있는 7개 영역 외에 보존영역(conservation area) 과 물리적 기술영역(physical description area)을 추가하였다. 그리고 ISAD(G)2는 26가지 요소만을 제시하 고 있어 상세수준의 기술요소를 필요로 하는 기관에서는 불충분하다는 선행연구에서 제시된 문제점을 보완하기 위해 분석결과를 토대로 영역별 하위요소를 종합하여 선정하였다.둘째, 우리나라 기록물의 특수성을 기술요소에 반영하기 위해 사무관리규정시행규칙과 전자정부 구현을 위한 행정업무 등의 전자화 촉진에 관한 법률에서 제시하고 있는 종이 공문서 및 전자문서 서식의 분석을 통해 선정한 기록물 기술요소를 추가하였다. 또한 공공기관의 기록물 관리에 관한 법률 시행령에서 규정하고 있는 공개여부 및 등급, 공개 일자, 공개범위, 보존기간, 보존등급, 보존가치, 기록물의 상태기술 요소를 추가하였다.셋째, 기록물 관리를 위해 512 생산일자 관련주기(creation dates note)와 5 검색보조도구주 기(finding aids note), 583 작업현황 주기(action note), 584 245 표제저자사항(title statement), 30 물리적 기술(physical description), 306 재생/연 주시간(playing time), 506 접근제한주기(restriction on acces note), 534 원본주기(original version note), 535 원본/사본의 소장처주기(location of originals/duplicates note), 540 이용과 복제제한에 관한 주기(terms governing use and reproduction notes), 541 직접적 graphical or historical note), 581 출판주기(publication note), 850 소장처(holding institution) 데이터필드의 식별기호를 재구성, 추가하였다.

Abstract

The study intended to develop KORMARC for archives in order to integrate archives with library materials. The results of the study can be sumarized as folows; (1) 2 areas for conservation and physical description are aded study has also proved that the existing 26 elements of ISAD(G)2 are not fuly enough to satisfy the information demands of institutions and its users as wel. (2) For the use of domestic archives in particular, the study h as added the description elements of archives that apeared in the Government Regulations of Ofice Managemen t and those forms of documents that are specified by law for the sake of computerization. The study has aded the possible release and grade, release dates, release range, conservation periods, conservation grade, conservation value, the status description of archives elements that are specified in Public Record Management Law.(3) The study has developed the following data fields to be add ed into KORMARC. and 584 accumulation note. Also it reorganizes and adds the indicators of the 245 title statement, 300 physica l description, 306 playing time, 506 restriction on access note, 534 original version note, 535 location of orig inals/duplicates note, 540 terms governing use and reproduction notes, 541 imediate source of acquisition not publication note, 850 holding institution data fields.

정보관리학회지