바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 구조문서, 검색결과: 22
1
강남규(한국과학기술정보연구원) ; 이석형(한국기업평가(주)) ; 이응봉(충남대학교) 2002, Vol.19, No.3, pp.91-110 https://doi.org/10.3743/KOSIM.2002.19.3.091
초록보기
초록

최근, 키워드 기반의 정보검색의 한계를 극복하기 위한 구조문서 기반의 연구가 활발하게 진행되고 있지만, 실제 적용에는 많은 어려움이 존재한다. 본 고에서는 구조문서에 대한 본문검색시스템을 제안한다. 본문검색시스템에 적용된 문서는 XML로 구축된 국가연구개발 보고서를 대상으로 하였으며, XML 연구보고서의 DTD, 본문 간의 이동을 위한 네비게이션 정보추출, 본문검색을 위한 검색엔진의 적용 방안에 관하여 살펴본다. 본 시스템은 XML 문서에 대해 문서의 구조정보를 저장하고 이를 검색하여 다양한 형태로 열람할 수 있는 검색 엔진의 부재 상황을 본문검색이라는 방법으로 극복하기 위한 것이다.

Abstract

Recently, to overcome the limit of keyword based retrieval system, the study based structured document has been studied. But it is hard for structured retrieval system to adapt a real service, in this paper, we propose a method of retrieval mechanism for the ful-text of XML documents. We explain DTD of XML based report, extracting navigation information and planing to adapt the retrieval system for article retrieval. Using the fulltext retrieval scheme, suggested system can be an alternative plan of professional structured based retrieval system.

2
최상희(대구가톨릭대학교) ; 서은경(한성대학교) 2006, Vol.23, No.2, pp.229-243 https://doi.org/10.3743/KOSIM.2006.23.2.229
초록보기
초록

질의응답문서는 이용자가 입력한 질의, 질의설명, 답을 아는 다른 이용자가 제시한 응답으로 구성된 구조화된 문서로서, 최근 웹 문서처럼 검색이 일반적으로 일어나고 있는 정보원이다. 이 연구에서는 질의응답문서의 구조적 특성을 기반으로 질의를 재생성하여 질의응답문서의 검색효율을 향상시키고자 하였다. 질의재생성 실험에서 성능이 비교된 문서구조는 질의와 응답내용이다. 질의를 기반으로 질의를 재생성하는 방식에서는 질의응답검색 시스템에 입력되어 있는 유사질의를 활용하여 클러스터링하는 기법이 적용되었다. 응답정보를 기반으로 질의를 재생성하는 방식에서는 가장 유사한 기존 질의에 대해 응답된 내용에서 단락검색으로 적합한 문장들을 선정하여 활용하는 기법이 적용되었다. 실험 결과 응답정보를 활용하여 질의를 재생성하는 방식이 정확률은 유지하면서 더 다양한 검색결과를 제공하는 것으로 나타났다.

Abstract

This study aims to suggest an effective way to enhance question-answer(QA) document retrieval performance by reconstructing queries based on the structural features in the QA documents. QA documents are a structured document which consists of three components: question from a questioner, short description on the question, answers chosen by the questioner. The study proposes the methods to reconstruct a new query using by two major structural parts, question and answer, and examines which component of a QA document could contribute to improve query performance. The major finding in this study is that to use answer document set is the most effective for reconstructing a new query. That is, queries reconstructed based on terms appeared on the answer document set provide the most relevant search results with reducing redundancy of retrieved documents.

3
최상희(대구가톨릭대학교) ; 이재윤(경기대학교) 2012, Vol.29, No.1, pp.331-349 https://doi.org/10.3743/KOSIM.2012.29.1.331
초록보기
초록

구조적 초록은 학술 논문의 주제를 표현하는 역할을 하여 학술 논문을 처리하는데 중요한 요소로 인식되어왔다. 이 연구에서는 구조적 초록을 구성하는 세부 필드의 속성을 4개로 분석하고 초록의 구조를 활용하여 문서 클러스터링에 적용할 수 있는 가능성을 고찰고자 하였다. 구조적 초록의 필드 속성을 문서 클러스터링에 적용한 결과 클러스터링 기법간의 편차가 있었으나 연구 목적이 제공하는 정보량에 비해 주제성이 커서 클러스터링 성능에 가장 큰 영향을 미치고 있는 것으로 나타났다. 또한 분석 결과 특정 필드에 특화되어 출현하는 필드 종속적인 단어가 발생하는 것으로 나타나 필드 종속적인 단어를 배제하고 집단내 평균연결 기법을 적용하였을 때는 클러스터링의 성능이 개선되는 것으로 분석되었다.

Abstract

Structured abstracts have been regarded as an essential information factor to represent topics of journal articles. This study aims to provide an unconventional view to utilize structured abstracts with the analysis on sub fields of a structured abstract in depth. In this study, a structured abstract was segmented into four fields, namely, purpose, design, findings, and values/implications. Each field was compared in the performance analysis of document clustering. In result, the purpose statement of an abstract affected on the performance of journal article clustering more than any other fields. Furthermore, certain types of keywords were identified to be excluded in the document clustering to improve clustering performance, especially by Within group average clustering method. These keywords had stronger relationship to a specific abstract field such as research design than the topic of an article.

4
한승희(일본 Keio University) ; 정영미(연세대학교) 2004, Vol.21, No.3, pp.251-267 https://doi.org/10.3743/KOSIM.2004.21.3.251
초록보기
초록

The purpose of this study is to generate the local level knowledge structure of a single document, similar to end-of-the-book indexes and table of contents of printed material, through the use of term clustering and cluster representative term selection. Furthermore, it aims to analyze the functionalities of the knowledge structure, and to confirm the applicability of these methods in user-friendly information services. The results of the term clustering experiment showed that the performance of the Ward's method was superior to that of the fuzzy K-means clustering method. In the cluster representative term selection experiment, using the highest passage frequency term as the representative yielded the best performance. Finally, the result of user task-based functionality tests illustrate that the automatically generated knowledge structure in this study functions similarly to the local level knowledge structure presented in printed material.攀*** 본 연구는 연세대학교 대학원 박사학위논문의 일부를 요약한 것임.*** 日本 慶應義塾大學(Keio University) 圖書館情報學科 訪問硏究員(libinfo@yonsei.ac.kr)****연세대학교 문헌정보학과 교수(ymchung@yonsei.ac.kr) 논문접수일자 : 2004년 8월 17일 게재확정일자 : 2004년 9월 10일攀攀

Abstract

5
윤화묵(한국과학기술정보연구원) ; 정회경(배재대학교) ; 김창수(연세대학교) ; 유범종(한국과학기술정보연구원) 2002, Vol.19, No.4, pp.96-111 https://doi.org/10.3743/KOSIM.2002.19.4.096
초록보기
초록

현재 기관이나 조직 내에 수많은 양의 데이터가 축적되어 존재하고 있으나 대부분의 데이터는 각 기관이나 조직에 따라 정형화된 형태로 남아있는 실정이다. 정형화된 정보는 정보의 교환 및 공유에 어려움이 있다. 이러한 단점을 극복하고자 지식정보자원관리라는 새로운 개념이 도입되었으며, 축적된 데이터들을 공유 및 관리하기 위한 지식정보자원의 디지털화가 실행되고 있다. 특히 과학기술 또는 교육학술 분야에서는 지식정보자원의 교환 및 공유에 필요한 데이터를 구조적으로 처리하고자 XML을 도입하려는 움직임이 일고 있으며, 이들 분야의 전자문서 안에 사용되어지는 수많은 수학식의 표현이 이미지나 텍스트 등의 비구조적인 데이터로 처리됨에 따라 검색과 인덱싱 또는 재사용성 등의 제한사항이 발생하게 된다. 이를 극복하고자 MathML을 이용한 수학식의 처리에 관심이 집중되고, MathML을 구조적인 문서상에 쉽고 효율적으로 처리할 수 있는 솔루션이 요구되고 있는 실정이다. 이에 본 논문에서는 지식정보자원을 목적으로 하는 전자문서의 구조적인 처리를 용이하게 하고, MathML에 대한 전문적인 지식이 없어도 구조적인 문서상에 쉽게 MathML을 생성 및 표현할 수 있는 XML 문서 편집 시스템을 구현하였다.

Abstract

A lot of accumulated data of many quantity exist within a institution or an organization, but most data is remained in form of standardization as each institution or organization. There are difficulty in exchange and share of information. New concept of knowledge information resource management to overcome this disadvantage was introduced, and the digitization of knowledge information resources to share and manage accumulated data is been doing. Specially, in science technic or education scholarship it, the tendency that importing XML to process necessary data to exchange and share of knowledge information resources structurally, and limitation of back for search and indexing or reusability is happened according as expression of great many mathematics used inside electron document of these sphere is processed to nonstructural data of image or text and so on. There is interest converged in processing of mathematics that use MathML to overcome this, and we require the solution to be able to process MathML easily and efficiently on structural document. In this paper, designed and implemented of XML document editing system which easy structural process of electronic document for knowledge information resources, and create and express MathML easily on structural document without expert knowledge about MathML.

초록보기
초록

XML 웹 문서 포맷은 문헌 내에 내용뿐만 아니라 의미 있는 논리적인 구조 정보를 포함할 수 있어, 검색에서 문서의 내용 뿐만 아니라 구조로 접근하는 것을 제공한다. 그래서 본 연구의 목적은 XML 검색에 있어 내용 검색에 추가적인 요소로 사용된 구조적인 제한이 얼마나 유용한지를 실험하기 위해 내용만으로 검색한 결과와 내용과 구조적인 제한을 가지고 검색한 결과간의 성능을 비교하였다. 이 실험은 자체 개발된 단말노드 언어모델기반의 XML 검색시스템을 사용하였고 INEX 2005의 ad-hoc트랙에 참여하여 모든 실험방법과 INEX 2005의 실험 문헌 집단을 사용하였다.

Abstract

XML documents format on the Web provides a mechanism to impose their content and logical structure information. Therefore, an XML processor provides access to their content and strucure. The purpose of this study is to investigate the usefulness of structural hints in the leaf node language model-based XML document retrieval. In order to this purpose, this experiment tested the performances of the leaf node language model-based XML retrieval system to compare the queries for a topic containing only content-only constraints and both content constrains and structure constraints. A newly designed and implemented leaf node language model-based XML retrieval system was used. And we participated in the ad-hoc track of INEX 2005 and conducted an experiment using a large-scale XML test collection provided by INEX 2005.

7
문주영(숭의여자대학) ; 김태수(연세대학교) 2011, Vol.28, No.1, pp.43-68 https://doi.org/10.3743/KOSIM.2011.28.1.043
초록보기
초록

본 연구에서는 OAIS 참조 모형을 구체적으로 발전시킨, 사실상의 보존 메타데이터 표준인 PREMIS 데이터모델과 데이터사전을 사무문서에 적용하기 위한 사무문서 컨텐츠모형을 개발하였다. 대상 문서는 ‘A사 B국 해외 석유사업 및 유전개발 문서’로 국가 차원 이상의 영구 보존 가치를 지니는 문서 컬렉션이다. PREMIS 데이터모델을 사무문서에 구체적으로 적용하기 위하여 PREMIS 모델 내의 지적개체에 대한 문서 차원의 개념 정립과 이해를 시도하였다. 즉, 문서 컨텐츠의 계층을 구분하는 원칙과 구조를 설계하였고 그에 맞추어 사무문서 컨텐츠를 대상으로 한 계층 모형을 만들어 사무문서 컨텐츠모형을 도출하였다. 이 과정에서 기록물 기술 규칙을 준수하였다.

Abstract

This study presents a contents model designed for business records that require long-term preservation. The contents model is based on the PREMIS(Preservation Metadata: Implementation Strategies) data model and the ISAD(G)(General International Standard Archival Description). The study selected the record collection of “the records of the overseas petroleum business and oil field development of A company located in B country.” This collection requires permanent preservations by the nation and even beyond. It was attempted to establish the concepts of intellectual objects in the PREMIS data model to apply the PREMIS data model to the business records specifically. In other words, the study established the principles for differentiation of the classes in the record contents and the hierarchy structure, and the hierarchy model was developed for business records contents to derive the business records model based on those principles.

초록보기
초록

전자문서는 사람이 판독할 수 있는 문서 측면과 시스템이 이해하고 자동 처리할 수 있는 전자적 측면을 모두 갖추고 있어서 가용성이 뛰어나다. 전자문서를 이용하는 목적이 가용성이라면 이 특성이 잘 발휘되어 효과적이고 효율적인 전자문서유통이 되도록 강구하여야 할 것이다. 정부의 전자문서유통 상황은 종래의 종이문서 중심 사고방식과 각 부처별 업무중심 관점에서 아직 벗어나지 못하여 이러한 장점을 충분히 살리지 못하고 있다. 본 논문에서는 전자문서유통의 발전 방향을 제시하여 향후 방대하게 생산될 전자문서의 효용을 높이는 데에 도움을 주는 것을 목적으로 하였다. 우선 전자문서의 개념을 정의하고 XML을 이용하여 문서의 구조정보를 표현하는 이유와 한계, 정부 전자문서유통의 문제점을 설명하였다. 그리고 향후 정보 표현 방안, 문서 구성 방안과 표준 관리 방안을 제시하였다.

Abstract

The electronic documents have the documental aspect that can legible by human and the electronic aspect that can be interpreted and processed automatically by machinery. This usability of electronic documents must be the reason that people use them in almost all the business areas rapidly in these days. That is because we have to utilize the characteristics to interchange electronic documents(EDI) effectively and efficiently. The electronic document interchange of Korean government cannot make the best of this benefit due to the traditional way of thinking based on paper document and the viewpoint of individual business, organization, and project. This paper proposed a direction of EDI for Korean government. At first, the concept of electronic docuemnts is defined. The reason and limitations of structuring the documents with XML and the hidden problems of present EDI in Korean public sector are also explained. And the way to preserve information, to design the structure of electronic document, and to maintain relevant standards is proposed.

초록보기
초록

본 연구는 공공기관에서 생산되는 기록물로서 가장 일반적이고 대표적인 공문서를 효율적으로 관리하고 활용할 수 있도록 생산단계에서 메타데이터 정보를 획득, 관리하는데 그 목적이 있다. 공문서는 행정정보의 근원이면서 생산기관의 의사결정을 표현하고 실현하는 핵심주체로서, 생산된 공문서는 체계적으로 관리함과 동시에 효율적으로 활용할 수 있는 시스템이 구축되어야 한다. 이를 위해 공문서 관련 주요 양식의 구조 분석을 통해 항목별로 관련 데이터 요소를 추출하였으며, 추출된 요소는 국제표준기록물 기술의 데이터 요소와 상호 비교, 분석하여 공문서의 생산배경 및 의도, 특징 등이 충분히 반영된 공문서 메타데이터 요소를 영역별로 구분하여 선정하였다. 이는 향후 우리나라 환경에 적합한 표준화된 기록물 메타데이터를 구축하는데 유용한 기초자료로 활용할 수 있을 것이다.

Abstract

This study aims to collect and manage in the step of creation metadata information to effectively manage and use official document which is a typical and normal records. To do it, data elements are extracted through analyzing structure of official document format. And we also select metadata elements reflecting creation background, publisher's intention, characteristic of official documents through evaluating and comparing extracted elements with data elements defined in ISAD rules. It would be draft data in constructing standardized metadata structure for records in Korea.

10
고영만(성균관대학교) ; 송인석(한국과학기술정보연구원) 2011, Vol.28, No.1, pp.145-170 https://doi.org/10.3743/KOSIM.2011.28.1.145
초록보기
초록

본 연구는 연구문헌의 지식구조를 반영하는 의미기반 지식조직체계의 실험적 모형을 제시하는 것을 목적으로 한다. 이를 위해 한국연구재단의 기초학문자료센터에 대한 사례분석을 하였다. 기초학문자료센터 연구성과물 DB와 학술용어 DR의 개념클래스 및 인스턴스를 대상으로 연구문헌의 지식구조를 파악하였으며, 기초학문자료센터 시스템의 학술적 이해형성 기능을 분석하였다. 또한 연구문헌의 지식구조와 색인어의 관계를 분석하였다. 이러한 분석을 통해 지식구조와 색인어의 관계구조, 26개의 연구문헌 지식구조 공리 및 11개의 의미관계 추론규칙으로 구성되는 온톨로지 모형, 즉 연구문헌의 지식구조와 그 의미관계에 의한 실험적 지식조직체계 모형을 제시하였다.

Abstract

The purpose of this paper is to suggest a pilot model of knowledge organizing system which reflects the knowledge structure of research papers, using a case analysis on the “Korean Research Memory” of the National Research Foundation of Korea. In this paper, knowledge structure of the research papers in humanities and social science is described and the function of the “Korean Research Memory” for scholarly sense-making is analysed. In order to suggest the pilot model of the knowledge organizing system, the study also analysed the relation between indexed keyword and knowledge structure of research papers in the Korean Research Memory. As a result, this paper suggests 24 axioms and 11 inference rules for an ontology based on semantic relation of the knowledge structure.

정보관리학회지