바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073

기술문서 정의문 패턴을 이용한 전문용어사전 자동추출 및 활용방안

Automatic Extraction and Usage of Terminology Dictionary Based on Definitional Sentences Patterns in Technical Documents

정보관리학회지, (P)1013-0799; (E)2586-2073
2017, v.34 no.4, pp.81-99
https://doi.org/10.3743/KOSIM.2017.34.4.081
한희정 (전북대학교)
김태영 (전북대학교)
두효철 (전북대학교)
오효정 (전북대학교)

  • 다운로드 수
  • 조회수

초록

기술문서는 지식정보사회에서 생성되는 중요 연구 성과물로, 이를 제대로 활용하기 위해서는 정보 요약 및 정보추출과 같은 개선된 정보 처리 방법을 토대로 기술문서 활용의 편의성을 높여줄 필요가 있다. 이에 본 연구는 기술문서의 핵심 정보를 추출하기 위한 방안으로, 기술문서의 구조와 정의문 패턴을 기반으로 전문용어 및 정의문을 자동 추출하고, 이를 기반으로 전문용어사전을 구축할 수 있는 시스템을 제안하였다. 나아가 전문용어사전을 지식메모리로서 보다 다양하게 활용할 수 있도록 전문용어사전에 기반한 개인화서비스 제공방안을 제안하였다. 이처럼 전문용어 및 정의문 자동추출을 기반으로 전문용어사전을 구축하게 되면 새롭게 등장하는 전문용어를 빠르게 수용할 수 있어 이용자들이 최신정보를 보다 손쉽게 찾을 수 있다. 더불어 개인화된 전문용어사전을 이용자에게 제공한다면 전문용어사전의 가치와 활용성, 검색의 효율성을 극대화할 수 있다.

Abstract

Technical documents are important research outputs generated by knowledge and information society. In order to properly use the technical documents properly, it is necessary to utilize advanced information processing techniques, such as summarization and information extraction. In this paper, to extract core information, we automatically extracted the terminologies and their definition based on definitional sentences patterns and the structure of technical documents. Based on this, we proposed the system to build a specialized terminology dictionary. And further we suggested the personalized services so that users can utilize the terminology dictionary in various ways as an knowledge memory. The results of this study will allow users to find up-to-date information faster and easier. In addition, providing a personalized terminology dictionary to users can maximize the value, usability, and retrieval efficiency of the dictionary.

참고문헌

1

강현화. (2009). 전문용어 표준화 제도 장비를 위한 정책 연구. 국립국어원.

2

김재호. (2004). 의학 전문용어의 정의문 자동 추출 (922-924). 한국정보과학회 학술발표논문집.

3

남길임. (2016). 과학 텍스트 정의문의 유형 분석. 한국어 의미학, 52, 111-138. http://dx.doi.org/10.19033/sks.2016.06.52.111.

4

미래창조과학부. (2017). 2016 과학기술통계백서:휴먼컬처아리랑.

5

박정오. (2000). 전문용어 추출시스템 (381-383). 한국정보과학회 학술발표논문집.

6

신효식. (2002). 텍스트로부터 용어 정의문의 자동 추출 방법 (292-299). 한국정보과학회 언어공학연구회 학술발표 논문집.

7

오종훈. (2003). EM 알고리즘을 이용한 전문용어의 자동추출 (487-489). 한국정보과학회 학술발표논문집.

8

오종훈. (2002). 분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출. 정보과학회논문지 : 소프트웨어 및 응용, 29(4), 258-269.

9

오종훈. (2004). 정보통합을 통한 생물/의학 분야 전문용어의 자동 추출 (775-777). 한국정보과학회 학술발표논문집.

10

최선화. (2006). 사전 정의문의 구문패턴에 기반한 상위어 판별규칙 학습.

11

한국과학기술정보연구원. (2014). 국가R&D 보고서원문 성과 활용 분석 및 경제적 기여도 분석 연구보고서. 한국과학기술정보연구원.

12

한국학술단체총연합회. (2006). 전문용어정리방법론 개발 연구보고서. 한국학술단체총연합회.

13

Flowerdew, J.. (1992). Definitions in science lectures. Applied Linguistics, 13(2), 202-221. http://dx.doi.org/10.1093/applin/13.2.202.

14

Trimble, L.. (1985). English for science and technology: A discourse approach:Cambridge University Press.

정보관리학회지