바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 추출, 검색결과: 5
1
윤성희(상명대학교) ; 백선욱(상명대학교) 2004, Vol.21, No.4, pp.251-263 https://doi.org/10.3743/KOSIM.2004.21.4.251
초록보기
초록

질의응답 시스템에서의 질의 분석 과정은 이용자의 자연어 질의 문장에서 질의 의도를 파악하여 그 유형을 분류하고 정답 추출을 위한 정보를 구하는 것이다. 본 연구에서는 복잡한 분류 규칙 집합이나 대용량의 언어 지식 자원 대신 이용자 질의 문장에서 질의 초점 어휘를 추출하고 구문 구조적으로 관련된 단어들의 의미 정보에 기반하여 효율적으로 질의 유형을 분류하는 방법을 제안한다. 질의 초점 어휘가 생략된 경우의 처리와 동의어와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법도 제안한다.

Abstract

For question-answering system, question analysis module finds the question points from user’s natural language questions, classifies the question types, and extracts some useful information for answer. This paper proposes a question type classifying technique based on focus words extracted from questions and word semantic information, instead of complicated rules or huge knowledge resources. It also shows how to find the question type without focus words, and how useful the synonym or postfix information to enhance the performance of classifying module.

초록보기
초록

본 연구는 공공기관에서 생산되는 기록물로서 가장 일반적이고 대표적인 공문서를 효율적으로 관리하고 활용할 수 있도록 생산단계에서 메타데이터 정보를 획득, 관리하는데 그 목적이 있다. 공문서는 행정정보의 근원이면서 생산기관의 의사결정을 표현하고 실현하는 핵심주체로서, 생산된 공문서는 체계적으로 관리함과 동시에 효율적으로 활용할 수 있는 시스템이 구축되어야 한다. 이를 위해 공문서 관련 주요 양식의 구조 분석을 통해 항목별로 관련 데이터 요소를 추출하였으며, 추출된 요소는 국제표준기록물 기술의 데이터 요소와 상호 비교, 분석하여 공문서의 생산배경 및 의도, 특징 등이 충분히 반영된 공문서 메타데이터 요소를 영역별로 구분하여 선정하였다. 이는 향후 우리나라 환경에 적합한 표준화된 기록물 메타데이터를 구축하는데 유용한 기초자료로 활용할 수 있을 것이다.

Abstract

This study aims to collect and manage in the step of creation metadata information to effectively manage and use official document which is a typical and normal records. To do it, data elements are extracted through analyzing structure of official document format. And we also select metadata elements reflecting creation background, publisher's intention, characteristic of official documents through evaluating and comparing extracted elements with data elements defined in ISAD rules. It would be draft data in constructing standardized metadata structure for records in Korea.

3
유소영(연세대학교) ; 문성빈(연세대학교) 2004, Vol.21, No.4, pp.187-208 https://doi.org/10.3743/KOSIM.2004.21.4.187
초록보기
초록

이 연구에서는 심미적 인상을 이미지 검색의 고수준 자질로 이용하였다. ‘심미적’이라는 용어는 심리학, 예술, 문학 등에서 연구되어 왔다. 이 용어는 시각적 지각과 감정의 무의식적이고 즉각적인 측면을 의미한다. 심미적 인상과 관련된 문헌 연구를 통해 4 가지 종류의 심미적 인상을 조작적으로 정의하였다: 강한 인상, 부드러운 인상, 중후한 인상, 세련된 인상. 66개의 회화 이미지 파일을 1,000개의 회화 이미지 중에서 무작위로 추출하였으며 시지각 색상 모형을 이용하여 이 이미지 파일들로부터 저수준 색상 자질을 추출하였다. 이미지의 고수준 자질인 4가지 종류의 심미적 인상은 4명의 평가자가 리커트 7점 척도로 평가한 것을 평균내었다. 검색 실험에서 2명의 피험자는 심미적 인상이나 주제어에 대한 예제 이미지 질의를 이용해서 이미지 검색을 수행하였다. 피험자들은 심미적 인상 기반 이미지 검색 시스템에 대해서 보통 정도의 수준으로 만족했다. 그리고 색상 자질과 심미적 인상 자질을 모두 이용한 이미지 검색의 R-정확률이 색상 자질만을 이용한 이미지 검색의 R-정확률보다 높았다. 그러나 이 연구결과의 일반화를 위해서는 큰 실험 집단을 대상으로 보다 많은 검색 질의를 통한 추후 연구들이 필요할 것으로 생각된다.

Abstract

In this study, aesthetic impressions were used for a high-level feature of image retrieval. The term, “aesthetic" has been studied in psychology, art, and literature. It means unconscious, instantaneous parts of visual perception and emotion. The literatures related to aesthetic impressions were reviewed and four kinds of aesthetic impressions were defined operationally: strong impression, soft impression, courteous impression, and refined impression. 66 image files of paintings were sampled randomly from 1100 paintings and low-level color features were extracted from them by a using perceptual color model(Lai, & Tait, 1998). The high-level features of an image, that is, four kinds of aesthetic impressions of each painting were measured by 4 subjects and averaged. In CBIR, 2 subjects performed image retrievals using example queries. They were asked to retrieve images by using the aesthetic impressions or the keywords. In evaluations, subjects showed that they were satisfied with the aesthetic impression-based image retrieval system on the average. And R-precision of the image retrieval with both color features and aesthetic impressions was higher than that of the image retrieval with color features only. But further studies with larger test collections and query sets should be followed for generalization of the result of this study.

4
이신원(중원대학교) ; 안동언(전북대학교) ; 정성종(전북대학교) 2004, Vol.21, No.4, pp.173-185 https://doi.org/10.3743/KOSIM.2004.21.4.173
초록보기
초록

정보통신의 기술이 발달하면서 정보의 양이 많아지고 사용자의 질의에 대한 검색 결과 리스트도 많이 추출되므로 빠르고 고품질의 문서 클러스터링 알고리즘이 중요한 역할을 하고 있다. 많은 논문들이 계층적 클러스터링 방법을 이용하여 좋은 성능을 보이지만 시간이 많이 소요된다. 반면 K-means 알고리즘은 시간 복잡도를 줄일 수 있는 방법이다. 본 논문에서는 계층적 클러스터링 시스템인 콘도르(Condor) 시스템에서 간단하고 고품질이며 효율적으로 정보 검색 할 수 있도록 구현하였다. 이 시스템은 K-Means Algorithm을 이용하였으며 클러스터 계층 깊이와 초기값을 조절하여 88%의 정확율을 보였다.

Abstract

Fast and high-quality document clustering algorithms play an important role in providing data exploration by organizing large amounts of information into a small number of meaningful clusters. Many papers have shown that the hierarchical clustering method takes good-performance, but is limited because of its quadratic time complexity. In contrast, with a large number of variables, K-means has a time complexity that is linear in the number of documents, but is thought to produce inferior clusters. In this paper, Condor system using K-Means algorithm Compares with regular method that the initial centroids have been established in advance, our method performance has been improved a lot.

5
이소연(한국여성개발원) ; 김자경(한국영상자료원) 2004, Vol.21, No.3, pp.227-250 https://doi.org/10.3743/KOSIM.2004.21.3.227
초록보기
초록

전자기록관리시스템을 개발하기 위해서는 전통적으로 그 효용을 검증받아온 기록관리원칙과 디지털정보가 공유하는 속성을 모두 감안하여야 한다. 디지털 환경에 맞추어 전통적인 기록관리원칙을 재확인한 기록관리 국제표준 ISO 15489는 전자기록관리시스템을 구축하는 데 가장 유용한 지침이라고 할 수 있다. 이 연구에서는 ISO 15489의 기능영역별 원칙을 추출하고, 이를 대표적인 전자기록관리시스템 설계표준(미 국방성표준, 영국 국립기록보존소 표준, 유럽연합의 요건모형)과 비교하여 분석함으로써 공통적인 시스템요건을 규명하였다. 그리고 이 핵심요건을 우리나라의 자료관시스템규격의 해당항목과 비교분석하였다. 현재 각급 행정기관 내에 설치 중인 자료관의 업무전산화 시스템으로 개발된 이 표준을 본격적인 전자기록관리시스템으로 발전시킬 수 있는 방안을 제안하였다.

Abstract

In order to design effective electronic records management systems, it is viable to consider both traditional principles of records management, proven to be effective, and the characteristics of digital information. ISO 15489, an international standard for records management, is acknowledged as the most useful guidelines for this goal. The present study extracted basic principles of electronic records management from its provisions of 7 functional steps. It then compared the principles to system requirements of three system design criterion, developed by Department of Defense(U.S.A.), Public Records Office(Britain), and European Union respectively. Common requirements, included in all three criterion, were then searched in the Korean standard of developing automated systems for records centers. Finally, suggestions were made to develop a Korean standard for electronic records management system, elaborating from the core requirements of the system found by the present study.

정보관리학회지