바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 요약, 검색결과: 5
1
최상희(대구가톨릭대학교) ; 정영미(연세대학교) 2004, Vol.21, No.3, pp.289-303 https://doi.org/10.3743/KOSIM.2004.21.3.289
초록보기
초록

This experimental study proposes a multi-document summarization method that produces optimal summaries in which users can find answers to their queries. In order to identify the most effective method for this purpose, the performance of the three summarization methods were compared. The investigated methods are sentence clustering, passage extraction through spreading activation, and clustering-passage extraction hybrid methods. The effectiveness of each summarizing method was evaluated by two criteria used to measure the accuracy and the redundancy of a summary. The passage extraction method using the sequential bnb search algorithm proved to be most effective in summarizing multiple documents with regard to summarization precision. This study proposes the passage extraction method as the optimal multi-document summarization method. 攀*** 본 연구는 연세대학교 대학원 박사학위논문의 일부를 요약한 것임.*** 연세대학교 문헌정보학과 시간강사(shchoi@lis.yonsei.ac.kr)****연세대학교 문헌정보학과 교수(ymchung@yonsei.ac.kr) 논문접수일자 : 2004년 8월 27일 게재확정일자 : 2004년 9월 13일攀攀

Abstract

2
김용광(연세대학교) ; 정영미(연세대학교) 2006, Vol.23, No.1, pp.83-98 https://doi.org/10.3743/KOSIM.2006.23.1.083
초록보기
초록

이 연구에서는 복수의 신문기사를 자동으로 요약하기 위해 문장의 의미범주를 활용한 템플리트 기반 요약 기법을 제시하였다. 먼저 학습과정에서 사건/사고 관련 신문기사의 요약문에 포함할 핵심 정보의 의미범주를 식별한 다음 템플리트를 구성하는 각 슬롯의 단서어를 선정한다. 자동요약 과정에서는 입력되는 복수의 뉴스기사들을 사건/사고 별로 범주화한 후 각 기사로부터 주요 문장을 추출하여 템플리트의 각 슬롯을 채운다. 마지막으로 문장을 단문으로 분리하여 템플리트의 내용을 수정한 후 이로부터 요약문을 작성한다. 자동 생성된 요약문을 평가한 결과 요약 정확률과 요약 재현율은 각각 0.541과 0.581로 나타났고, 요약문장 중복률은 0.116으로 나타났다.

Abstract

This study proposes a template-based method of automatic summarization of multiple news articles using the semantic categories of sentences. First, the semantic categories for core information to be included in a summary are identified from training set of documents and their summaries. Then, cue words for each slot of the template are selected for later classification of news sentences into relevant slots. When a news article is input, its event/accident category is identified, and key sentences are extracted from the news article and filled in the relevant slots. The template filled with simple sentences rather than original long sentences is used to generate a summary for an event/accident. In the user evaluation of the generated summaries, the results showed the 54.1% recall ratio and the 58.1% precision ratio in essential information extraction and 11.6% redundancy ratio.

3
정영미(연세대학교) ; 김용광(연세대학교) 2008, Vol.25, No.4, pp.227-243 https://doi.org/10.3743/KOSIM.2008.25.4.227
초록보기
초록

이 연구에서는 사건중심 뉴스기사 요약문을 자동생성하기 위해 뉴스기사들을 SVM 분류기를 이용하여 사건 주제범주로 먼저 분류한 후, 각 주제범주 내에서 싱글패스 클러스터링 알고리즘을 통해 특정한 사건 관련 기사들을 탐지하는 기법을 제안하였다. 사건탐지 성능을 높이기 위해 고유명사에 가중치를 부여하고, 뉴스의 발생시간을 고려한 시간벌점함수를 제안하였다. 또한 일정 규모 이상의 클러스터를 분할하여 적절한 크기의 사건 클러스터를 생성하도록 수정된 싱글패스 알고리즘을 사용하였다. 이 연구에서 제안한 사건탐지 기법의 성능은 단순 싱글패스 클러스터링 기법에 비해 정확률, 재현율, F-척도에서 각각 37.1%, 0.1%, 35.4%의 성능 향상률을 보였고, 오보율과 탐지비용에서는 각각 74.7%, 11.3%의 향상률을 나타냈다.

Abstract

This study investigates an event detection method with the aim of generating an event-focused news summary from a set of news articles on a certain event using a multi-document summarization technique. The event detection method first classifies news articles into the event related topic categories by employing a SVM classifier and then creates event clusters containing news articles on an event by a modified single pass clustering algorithm. The clustering algorithm applies a time penalty function as well as cluster partitioning to enhance the clustering performance. It was found that the event detection method proposed in this study showed a satisfactory performance in terms of both the F-measure and the detection cost.

4
한승희(일본 Keio University) ; 정영미(연세대학교) 2004, Vol.21, No.3, pp.251-267 https://doi.org/10.3743/KOSIM.2004.21.3.251
초록보기
초록

The purpose of this study is to generate the local level knowledge structure of a single document, similar to end-of-the-book indexes and table of contents of printed material, through the use of term clustering and cluster representative term selection. Furthermore, it aims to analyze the functionalities of the knowledge structure, and to confirm the applicability of these methods in user-friendly information services. The results of the term clustering experiment showed that the performance of the Ward's method was superior to that of the fuzzy K-means clustering method. In the cluster representative term selection experiment, using the highest passage frequency term as the representative yielded the best performance. Finally, the result of user task-based functionality tests illustrate that the automatically generated knowledge structure in this study functions similarly to the local level knowledge structure presented in printed material.攀*** 본 연구는 연세대학교 대학원 박사학위논문의 일부를 요약한 것임.*** 日本 慶應義塾大學(Keio University) 圖書館情報學科 訪問硏究員(libinfo@yonsei.ac.kr)****연세대학교 문헌정보학과 교수(ymchung@yonsei.ac.kr) 논문접수일자 : 2004년 8월 17일 게재확정일자 : 2004년 9월 10일攀攀

Abstract

5
노영희(건국대학교 문헌정보학과 교수) ; 손애경(글로벌사이버대학교 미디어콘텐츠창작학과 교수) ; 이경선(서강대학교 공공정책대학원 행정법무학과 교수) ; 장인호(대진대학교 문헌정보학과 부교수) ; 정영미(동의대학교 문헌정보학과 교수) ; 차현주(성균관대학교 문헌정보학과 초빙교수) 2024, Vol.41, No.1, pp.133-162 https://doi.org/10.3743/KOSIM.2024.41.1.133
초록보기
초록

디지털화가 급속히 진행됨에 따라, 온라인 자료의 식별 및 관리의 중요성이 대두되고 있다. 특히, 디지털 콘텐츠의 효율적인 유통 및 보존을 위한 체계적인 식별체계의 필요성이 증가하고 있다. 본 연구는 이러한 시대적 요구에 부응하여, 온라인 자료의 식별 및 관리를 위한 현행 식별체계의 실태를 조사하고, 이를 납본과 연계하여 보다 체계적인 관리 및 활용 방안을 모색하는 것을 목적으로 한다. 이를 위해 온라인 자료 식별체계와 발급실태를 조사하고 온라인 자료에 관련된 선행연구를 분석하였다. 분석결과를 기반으로 한 납본 연계방안은 다음과 같이 세 가지로 요약할 수 있다. 첫째, 납본의 우선순위 및 활용성을 위해 납본과 이용의 상호보완 강화, 납본의 우선순위 부여, 납본자료의 활용성 증대 전략이 요구된다. 둘째, 국제표준번호를 기반으로 한 납본 연계 방안으로서, ISBN과 UCI의 연계 납본, 국제표준자료번호와 납본 연계, 국제표준번호와 UCI의 메타데이터연계, UCI와 ICN의 연계 통합, 납본시스템 고도화를 위한 자동화 기술 도입 전략이 요구된다. 셋째, 위에서 제안한 전략들이 그 효과적으로 작용하기 위해서는 정책적인 지원도 같이 이루어져야 할 것이다. 한국서지표준센터의 납본 역할 강화를 포함하여 출판사와의 협력강화, 납본자료에 대한 보상, 납본제도에 대한 인식 제고 및 제도적 보상 등의 측면에서 고려되어야 할 부분이 있다.

Abstract

The rapid digitalization has highlighted the importance of identifying and managing online resources. Especially, the need for a systematic identification system for the efficient distribution and preservation of digital content is growing. This study aims to respond to these contemporary demands by investigating the current state of identification systems for online resources and exploring more systematic management and utilization methods through linking these systems with legal deposit. To achieve this, the study surveyed the identification systems and their issuance status for online resources and analyzed prior research related to these online resources. Based on the analysis, the proposed strategies for linking with legal deposit can be summarized into three categories: First, to prioritize and enhance the utilization of legal deposit, strategies are required to strengthen the mutual complementarity of deposit and use, to assign priorities to certain deposits, and to increase the usability of deposited materials. Second, as strategies based on international standard numbers for linking with legal deposit, it is necessary to integrate ISBN and UCI in the deposit process, to link international standard resource numbers with deposit, to interconnect metadata between international standard numbers and UCI, to integrate UCI and ICN, and to introduce automation technology for upgrading the deposit system. Third, to effectively implement the aforementioned strategies, policy support is essential. This includes enhancing the role of the Korean Bibliographic Standards Center, strengthening cooperation with publishers, compensating for deposited materials, and increasing awareness and institutional compensation for the legal deposit system.

정보관리학회지