바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073

자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색

Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion

정보관리학회지, (P)1013-0799; (E)2586-2073
2004, v.21 no.2, pp.235-248
https://doi.org/10.3743/KOSIM.2004.21.2.235
윤성희 (상명대학교)

  • 다운로드 수
  • 조회수

초록

웹 문서 검색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

Abstract

For the users of information retrieval systems, natural language query is the more ideal interface, compared with keyword and boolean expressions. This paper proposes a retrieval technique with expanded keyword from syntactically-analyzed structures of natural language query as user input. Through the steps combining or splitting the compound nouns based on syntactic tree traversal of the query, and expanding the other-formed or shorten-formed into multiple keyword, it can enhance the precision and correctness of the retrieval system.

참고문헌

1

(2004). 한글 문서의 색인어와 색인 기법. 22(4), 72-77.

2

(2002). 개념 검색어 확장을 통해 질의 형식화를 도와주는 개념 마법사의 설계 및 구현. 9-B(4), 437-444.

3

(1999). 구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성. 26(10), 1219-1229.

4

(1998). 한글공학:정보검색. 5(5), -.

5

(2002). 로그 분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구. 19(3), 111-122.

6

(2003). 규칙에 기반한 한국어 부분 구문분석기의 구현. 10-B(4), 389-396.

7

(2001). 의미기반 정보검색. 19(10), 7-18.

8

(2000). 형태소 및 구문 모호성 축소를 위한 구문단위 형태소의 이용. 27(7), -.

9

(1998). Phrase-based Information Retrieval. 34(6), -.

10

(1999). Modern Informa- tion Retrieval. , -.

11

(1987). “Experiments in automatic phrase indexing for document retrieval a comparison of syntactic and non-syntactic me- thods. , -.

12

(1989). “The effective of a non-syntactic approach to automatic phrase indexing for document retrieval. , -.

13

(1999). Using syntactic information in handling natural language queries for extended boolean retrieval model. , 63-70.

14

(2000). Natural Language Information Retrieval : progress report. 36(1), -.

15

(1988). “Automatic text processing. , -.

16

(2000). Integrated indexing method using compound noun segmentation and noun phrase synthesis. 27(1), -.

17

(1997). Fast statistical parsing of noun phrases for document indexing. , 312-319.

18

http://kibs.kaist.ac.kr. , -.

19

http://www.google.co.kr. , -.

20

http://www.naver.com. , -.

21

http://kr.yahoo.com. , -.

정보관리학회지