바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색

Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion

정보관리학회지 / Journal of the Korean Society for Information Management, (P)1013-0799; (E)2586-2073
2004, v.21 no.2, pp.235-248
https://doi.org/10.3743/KOSIM.2004.21.2.235
윤성희 (상명대학교)
  • 다운로드 수
  • 조회수

초록

웹 문서 검색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

keywords
웹 정보 검색, 자연어 질의, 구문 분석, 검색어 확장 information retrieval, natural language query, syntactic analysis, keyword expansion, 웹 정보 검색, 자연어 질의, 구문 분석, 검색어 확장 information retrieval, natural language query, syntactic analysis, keyword expansion

Abstract

For the users of information retrieval systems, natural language query is the more ideal interface, compared with keyword and boolean expressions. This paper proposes a retrieval technique with expanded keyword from syntactically-analyzed structures of natural language query as user input. Through the steps combining or splitting the compound nouns based on syntactic tree traversal of the query, and expanding the other-formed or shorten-formed into multiple keyword, it can enhance the precision and correctness of the retrieval system.

keywords
웹 정보 검색, 자연어 질의, 구문 분석, 검색어 확장 information retrieval, natural language query, syntactic analysis, keyword expansion, 웹 정보 검색, 자연어 질의, 구문 분석, 검색어 확장 information retrieval, natural language query, syntactic analysis, keyword expansion

참고문헌

1.

(2004). 한글 문서의 색인어와 색인 기법. 22(4), 72-77.

2.

(2002). 개념 검색어 확장을 통해 질의 형식화를 도와주는 개념 마법사의 설계 및 구현. 9-B(4), 437-444.

3.

(1999). 구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성. 26(10), 1219-1229.

4.

(1998). 한글공학:정보검색. 5(5), -.

5.

(2002). 로그 분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구. 19(3), 111-122.

6.

(2003). 규칙에 기반한 한국어 부분 구문분석기의 구현. 10-B(4), 389-396.

7.

(2001). 의미기반 정보검색. 19(10), 7-18.

8.

(2000). 형태소 및 구문 모호성 축소를 위한 구문단위 형태소의 이용. 27(7), -.

9.

(1998). Phrase-based Information Retrieval. 34(6), -.

10.

(1999). Modern Informa- tion Retrieval. , -.

11.

(1987). “Experiments in automatic phrase indexing for document retrieval a comparison of syntactic and non-syntactic me- thods. , -.

12.

(1989). “The effective of a non-syntactic approach to automatic phrase indexing for document retrieval. , -.

13.

(1999). Using syntactic information in handling natural language queries for extended boolean retrieval model. , 63-70.

14.

(2000). Natural Language Information Retrieval : progress report. 36(1), -.

15.

(1988). “Automatic text processing. , -.

16.

(2000). Integrated indexing method using compound noun segmentation and noun phrase synthesis. 27(1), -.

17.

(1997). Fast statistical parsing of noun phrases for document indexing. , 312-319.

18.

http://kibs.kaist.ac.kr. , -.

19.

http://www.google.co.kr. , -.

20.

http://www.naver.com. , -.

21.

http://kr.yahoo.com. , -.

정보관리학회지