바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: process improvement, 검색결과: 5
1
정영미(연세대학교) ; 이용구(계명대학교) 2005, Vol.22, No.2, pp.125-145 https://doi.org/10.3743/KOSIM.2005.22.2.125
초록보기
초록

이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음, 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 92%의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 67% 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 39.6%의 정확률을 보였고, EM 알고리즘 통합 검색이 약 36%의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 37%와 비교하면 나이브 베이즈 통합 검색은 약 7.4%의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 3%의 성능 저하율을 보였다.

Abstract

This paper presents a semantic vector space retrieval model incorporating a word sense disambiguation algorithm in an attempt to improve retrieval effectiveness. Nine Korean homonyms are selected for the sense disambiguation and retrieval experiments. The total of approximately 120,000 news articles comprise the raw test collection and 18 queries including homonyms as query words are used for the retrieval experiments. A Naive Bayes classifier and EM algorithm representing supervised and unsupervised learning algorithms respectively are used for the disambiguation process. The Naive Bayes classifier achieved 92% disambiguation accuracy, while the clustering performance of the EM algorithm is 67% on the average. The retrieval effectiveness of the semantic vector space model incorporating the Naive Bayes classifier showed 39.6% precision achieving about 7.4% improvement. However, the retrieval effectiveness of the EM algorithm-based semantic retrieval is 3% lower than the baseline retrieval without disambiguation. It is worth noting that the performances of disambiguation and retrieval depend on the distribution patterns of homonyms to be disambiguated as well as the characteristics of queries.

초록보기
초록

기계가 정보의 의미를 이해하고 처리할 수 있도록 기존의 웹을 확장하는 것을 목적으로 하는 시멘틱 웹은 온톨로지를 이용하여 지식을 공유하게 된다. 본 논문에서는 정교한 질의의 처리를 위하여 온톨로지 내에 존재하는 의미 관계들을 질의의 확장을 위한 연관피드백 정보로 이용하는 방안을 제안한다. 실험은 도메인 온톨로지인 Medicine 온톨로지를 대상으로 하였으며, 출현 용어들의 빈도정보만을 이용한 키워드기반 문서검색과 제안한 온톨로지기반 문서검색의 성능을 비교하였다. 이 때, 두 시스템의 정확률과 재현율을 성능 평가의 기준으로 삼았다. 그 결과, 검색 엔진은 온톨로지에 정의된 개념들과 규칙들을 활용하면서 검색의 정확률을 향상시키는데 도움이 되었고 검색 성능을 향상시키기 위한 추론의 기반으로도 사용될 수 있었다.

Abstract

For the purpose of extending the Web that is able to understand and process information by machine, Semantic Web shared knowledge in the ontology form. For exquisite query processing, this paper proposes a method to use semantic relations in the ontology as relevance feedback information to query expansion. We made experiment on pharmacy domain. And in order to verify the effectiveness of the semantic relation in the ontology, we compared a keyword based document retrieval system that gives weights by using the frequency information compared with an ontology based document retrieval system that uses relevant information existed in the ontology to a relevant feedback. From the evaluation of the retrieval performance, we knew that search engine used the concepts and relations in ontology for improving precision effectively. Also it used them for the basis of the inference for improvement the retrieval performance.

3
서연주(국회도서관) ; 양승민(숭실대학교) 2005, Vol.22, No.3, pp.201-211 https://doi.org/10.3743/KOSIM.2005.22.3.201
초록보기
초록

국회 기록관리는 입법정보화담당관실의 기록업무 이용제공과 국회기록보존소의 기록보존업무가 분산 추진되장기적으로 국회통합전산센터의 운영방안이 도출되어 국회 정보화의 정책이 크게 수정되고 있다.국회는 국회 정보화와 관련하여 국회 전산센터 운영 및 향후 발전방향을 한국전자정부연구원에 연구용역을 의뢰하였고 연구결과 네 가지 전산센터 운영방안을 제시받았다. 한국전자정부연구원이 제시한 네 가지 전산센터 운영방안을 토대로 국회 기록관리 체제방안에 대해 바람직한 방향을 모색하였다. 국회기록관리체제정비 방안은 국회기록보존소 위상과 관련하여 고려하였다.

Abstract

The archive management system for the National Assembly is divided into two ways and propelled by each of them; one is providing the service for the recording purpose by the legislation data processing office and the ot her is the archiving service b y the National Assembly Archives. nization and operation of the archive management system. Also, with the legislation research bureau scheduled to be organized newly, the data processing policy for the National Assembly is being l argely modified as the operation plan for the joint computerizati on center of the National Assem bly came out. In relation to the data processing of the National Assembly, th e Assembly has requested the research outsourcing to the Korean Research Institute of El ectronic Government and had the four possible operation plan as a result. On the basis of four alternatives proposed by the Korean Research Institute of Electronic Government, the Assembly has sought out the desirable way for the archive syste m of the Asembly. The status of the National Assembly ation in finding out the solution for improving the data managemen t system of the National Assemb ly.

초록보기
초록

본 연구는 2년제 전문대학 학생들을 대상으로 웹기반 온라인목록의 이용특성을 조사 연구한 것이다. 연구방법으로 이용자들의 특성을 분석하기 위하여 질문지법과 면접조사법을 통해 데이터를 수집하였으며, 수집된 데이터의 처리는 통계처리 프로그램인 SPSSWIN 10.1을 사용하여 분석하였다. 연구결과 이용행태, 검색결과 만족도, 웹 온라인목록의 선호도, 검색어 선정, 문헌정보학 전공자와 비전공자 간의 탐색성과 차이, 웹 온라인목록의 이용자교육의 필요성 등에 관한 결과를 얻었다. 이러한 분석결과를 근거로 하여 웹 온라인목록 이용 중에 발생하는 문제점과 어려움을 느끼는 기능들에 대해 개선방안을 제시하여 이용자들로 하여금 웹 온라인목록 이용의 효율성을 돕고자 하였다.

Abstract

The aims of this study is to analyse the user's behavior, satisfaction, difficulties and selection of retrieval keywords for the use of Web-based OPAC in the College students. The methods of the questionnaire and the interview was applied to get the data and processed by using SPSSWIN 10.1. Several research results was proved the hypothesis such as differences between major subject of students in their fields. Furthermore, based on the result of this analysis, another purpose is to come up with the improvements of functions prompting difficulties and answers to problems found in the Web OPAC, helping them to use the Web OPAC efficiently.

5
김판준(신라대학교) ; 정영미(연세대학교) 2005, Vol.22, No.1, pp.191-208 https://doi.org/10.3743/KOSIM.2005.22.1.191
초록보기
초록

새로운 주제의 탐지를 위한 여러 접근법들을 지식 구조 표현 방법 중 하나인 디스크립터의 부여 및 갱신 과정에 적용하였다. 새로운 주제 탐지는, 특히 특정 학문 분야에서 새로운 주제의 출현 및 성장으로 인하여 지식 구조상의 변화가 발생하는 경우에, 기존의 색인어로는 이를 표현할 수 없거나 표현상의 제한이 따르는 문제를 해결하는 데 응용할 수 있다. 실험 결과, 정보학 내에서 긍정적 측면의 변화가 발생한 것으로 식별된 신흥 주제들은 상당수가 서로 밀접하게 연관되어 있으면서 동시에 성장발전의 단계에 있는 주제임을 확인하였다. 또한, 새로운 주제 탐지를 통한 후보 디스크립터 리스트의 사용이 색인자의 색인작업을 지원하는 효율적인 도구가 될 수 있다는 가능성을 보여 주었다. 특히, 적절한 디스크립터의 선정과 부여를 위한 후보 디스크립터 리스트의 제공은 색인작업의 효율성과 정확성을 향상시키는 데 기여할 수 있을 것이다.

Abstract

This study utilizes various approaches for new topic detection in the process of assigning and updating descriptors, which is a representation method of the knowledge structure. Particularly in the case of occurring changes on the knowledge structure due to the appearance and development of new topics in specific study areas, new topic detection can be applied to solving the impossibility or limitation of the existing index terms in representing subject concepts. This study confirms that the majority of newly developing topics in information science are closely associated with each other and are simultaneously in the phase of growth and development. Also, this study shows the possibility that the use of candidate descriptor lists generated by new topic detection methods can be an effective tool in assisting indexers. In particular, the provision of candidate descriptor lists to help assignment of appropriate descriptors will contribute to the improvement of the effectiveness and accuracy of indexing.

정보관리학회지