바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 추출, 검색결과: 5
초록보기
초록

본 연구는 이메일에 나타난 감성정보 메타데이터 추출에 있어 자연언어처리에 기반한 방식을 적용하였다. 투자분석가와 고객 사이에 주고받은 이메일을 통하여 개인화 정보를 추출하였다. 개인화란 이용자에게 개인적으로 의미 있는 방식으로 컨텐츠를 제공함으로써 온라인 상에서 관계를 생성하고, 성장시키고, 지속시키는 것을 의미한다. 전자상거래나 온라인 상의 비즈니스 경우, 본 연구는 대량의 정보에서 개인에게 의미 있는 정보를 선별하여 개인화 서비스에 활용할 수 있도록, 이메일이나 토론게시판 게시물, 채팅기록 등의 텍스트를 자연언어처리 기법에 의하여 자동적으로 메타데이터를 추출할 수 있는 시스템을 구현하였다. 구현된 시스템은 온라인 비즈니스와 같이 커뮤니케이션이 중요하고, 상호 교환되는 메시지의 의도나 상대방의 감정을 파악하는 것이 중요한 경우에 그러한 감성정보 관련 메타데이터를 자동으로 추출하는 시도를 했다는 점에서 연구의 가치를 찾을 수 있다.

Abstract

This paper describes a metadata extraction technique based on natural language processing (NLP) which extracts personalized information from email communications between financial analysts and their clients. Personalized means connecting users with content in a personally meaningful way to create, grow, and retain online relationships. Personalization often results in the creation of user profiles that store individuals preferences regarding goods or services offered by various e-commerce merchants. We developed an automatic metadata extraction system designed to process textual data such as emails, discussion group postings, or chat group transcriptions. The focus of this paper is the recognition of emotional contents such as mood and urgency, which are embedded in the business communications, as metadata.

초록보기
초록

본 연구의 목적은 인용문헌에 나타난 웹 자원의 접근성과 그 변화추이를 분석하여 인용문헌에 수록된 웹 정보원의 가치와 유용성을 평가하는데 그 목적이 있다. 이를 위하여 정보관리학회지에 수록된 웹 자원 1,377건을 추출하여 국내, 국외별 웹 자원의 접근성과 도메인과 파일유형의 웹 자원 접근성 및 접근성 변화추이를 분석하였다. 그 결과 국내 웹 자원은 접근성비율이 40%, 국외 웹 자원은 50%, 도메인 유형은 58%, 파일 유형은 44%로 각각 조사되었다. 또한 인용시간 경과에 따른 웹 자원의 접근성은 감소하는 경향을 보였으며, 인용된지 1년 정도가 되면 웹 자원의 23%정도가 접근할 수 없는 것으로 밝혀져 웹 자원의 유용성은 매우 낮은 것으로 평가되었다.

Abstract

The purpose of this study is to analyze the accessibility of web resources contained in the references section of journal articles. I was identified a total of 1,377 web citations for a major journal in information science over a ten year period. The results show that the accessible ratio of domestic web resources was at 40% and the ratio of foreign web resources about 50%. The accessible ratio of domain type web resources was shown 58% while the same ratio for file type web resources was 45%. This low accessibility of we resources in references poses threat to the overall value of journal articles.

초록보기
초록

웹의 보도기사에 관한 자동요약시스템을 구축하기 위하여 담화구조와 지식기반 기법을 적용한 글구조 프레임과 제 규칙들을 작성하였다. 프레임에는 문단과 문장 및 절의 역할, 문단과 문장의 성질, 역할을 구분하는 판별규칙, 주요문장 발췌규칙, 그리고 요약문작성규칙 슬롯이 포함되었다. 문맥정의, 고유명사 등을 안내하는 ‘if-needed'와 변화된 슬롯 값을 알려주는 if-changed 패싯도 구비되었다. 슬롯이나 패싯의 실제 값들을 추출 표현하는 과정에서 문구의 수사적 역할과 단어 최상위 범주 및 줄거리 단위를 참조하였다. 의미흐름의 연결성을 유지하면서 요약 문장들을 통합, 분리, 합성하는 재구성은 유사도공식, 구문정보, 담화구조와 지식기반 방법에서 도출한 제 규칙 및 문맥정의를 이용하였고 비평과 같은 새로운 문장을 생성하였다.

Abstract

The writings frame and various rules based on discourse structure and knowledge-based methods were applied to construct the automatic Ext/Sums (extracts & summaries) system from the straight news in web. The frame contains the slot and facet represented by the role of paragraphs, sentences, and clauses in news and the rules determining the type of slot. Rearrangement like Unification, separation, and synthesis of the candidate sentences to summary, maintaining the coherence of meanings, were also used the rules derived from similar degree measurement, syntactic information, discourse structure, and knowledge-based methods and the context plots defined with the syntactic/semantic signature of noun and verb and category of verb suffix. The critic sentence were tried to insert into summary

4
김용광(연세대학교) ; 정영미(연세대학교) 2006, Vol.23, No.1, pp.83-98 https://doi.org/10.3743/KOSIM.2006.23.1.083
초록보기
초록

이 연구에서는 복수의 신문기사를 자동으로 요약하기 위해 문장의 의미범주를 활용한 템플리트 기반 요약 기법을 제시하였다. 먼저 학습과정에서 사건/사고 관련 신문기사의 요약문에 포함할 핵심 정보의 의미범주를 식별한 다음 템플리트를 구성하는 각 슬롯의 단서어를 선정한다. 자동요약 과정에서는 입력되는 복수의 뉴스기사들을 사건/사고 별로 범주화한 후 각 기사로부터 주요 문장을 추출하여 템플리트의 각 슬롯을 채운다. 마지막으로 문장을 단문으로 분리하여 템플리트의 내용을 수정한 후 이로부터 요약문을 작성한다. 자동 생성된 요약문을 평가한 결과 요약 정확률과 요약 재현율은 각각 0.541과 0.581로 나타났고, 요약문장 중복률은 0.116으로 나타났다.

Abstract

This study proposes a template-based method of automatic summarization of multiple news articles using the semantic categories of sentences. First, the semantic categories for core information to be included in a summary are identified from training set of documents and their summaries. Then, cue words for each slot of the template are selected for later classification of news sentences into relevant slots. When a news article is input, its event/accident category is identified, and key sentences are extracted from the news article and filled in the relevant slots. The template filled with simple sentences rather than original long sentences is used to generate a summary for an event/accident. In the user evaluation of the generated summaries, the results showed the 54.1% recall ratio and the 58.1% precision ratio in essential information extraction and 11.6% redundancy ratio.

5
구중억(한국기초과학지원연구원) ; 이응봉(충남대학교) 2006, Vol.23, No.3, pp.49-68 https://doi.org/10.3743/KOSIM.2006.23.3.049
초록보기
초록

도서관 이용자에게 장애가 없는 정보서비스를 제공하기 위해서는 OPAC의 접근성, 사용성 및 검색성을 향상시키고, 도서의 검색, 식별 및 브라우징의 도구로써 ISBN의 활용가치를 높이는 것이 필요하다. 북마크릿은 웹브라우저의 ‘즐겨찾기에 추가’ 또는 ‘툴바’에 드래그하여 저장할 수 있는 작은 크기의 자바스크립트이다. 그리고 오픈소스인 북마크릿은 웹페이지에서 ISBN을 추출한 다음, 해당 ISBN으로 도서관의 OPAC에서 도서를 검색할 수 있는 간단하지만 강력한 검색도구이다. 해외의 도서관 시스템 벤더, 도서관, OCLC 등은 이용자가 온라인서점의 웹페이지를 살펴보면서 동시에 도서관의 소장 및 대출 정보를 실시간으로 검색할 수 있는 북마크릿을 제공하고 있다. 따라서 본 연구에서는 해외에서 개발되어 활용되고 있는 네 가지 유형의 북마크릿에 대한 적용사례 분석을 통해 북마크릿의 특징과 장단점을 정리하였다. 이를 통해서 북마크릿의 기본요건과 적용모델을 도출하고, 국내 도서관의 OPAC과 온라인서점에서 북마크릿을 활용한 Library Lookup 서비스 제공방안을 제안하였다.

Abstract

It is required to enhance the value of ISBN as a tool for book search, identification, and browsing, and improve the accessability and search capability of library OPAC. Bookmarklet is a small size javascript which can be saved as URL in a web browser bookmark or web page hyperlink. Open source bookmarklet can extract ISBN from web pages and search a book from library OPAC using the ISBN, so it is recognized as a simple but powerful search tool. In foreign countries, commercial library system vendors, libraries, OCLC, etc. are providing bookmarklets which allow a user to search for library holdings and loan information in a real time while he/she is travelling in an online bookshop web page. Therefore, this paper compared and analyzed international bookmarklets application examples and proposed LibraryLookup service in which library OPAC and online bookshop can make use of the bookmarklets.

정보관리학회지