바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073

질의로그 데이터에 기반한 특허 및 상표검색에 관한 연구

Analysis of Korean Patent & Trademark Retrieval Query Log to Improve Retrieval and Query Reformulation Efficiency

정보관리학회지, (P)1013-0799; (E)2586-2073
2006, v.23 no.2, pp.61-79
https://doi.org/10.3743/KOSIM.2006.23.2.061
이지연 (연세대학교)
백우진 (건국대학교)

  • 다운로드 수
  • 조회수

초록

본 연구는 특허 및 상표 검색 개선을 위한 방법을 제안하고자 하는 목적에서 출발하였다. 이를 위해 193일간 한국특허정보원의 특허기술정보서비스를 이용한 17,559명의 이용자가 작성한 100,016개의 질의문에 대한 로그 데이터를 분석하였다. 개별적인 질의로그 분석 이외에, 2,202개의 복수 질의문을 이용한 탐색세션을 분석함으로써 검색 개선을 위한 추가적인 단서를 발견하였다. 분석결과에 의하면, 특허 및 상표검색은 일반적인 웹 검색의 유형과 유사한데, 특히 질의문의 길이가 짧다는 측면에서 매우 흡사하다. 그러나 특허 및 상표검색의 경우, 일반 웹 검색보다 불리언 연산자를 많이 사용하고 있었다. 복수 질의문 분석을 통해 이용자들이 질의문을 재작성하는데 도움이 될 수 있는 탐색기능을 제안할 수 있었다. 복수의 질의문으로 구성된 탐색세션을 분석한 결과, 이용자들은 질의문을 재작성하기 위하여 부연하기, 특정화하기, 일반화하기, 교체하기, 중단하기와 같은 방법을 사용하고 있음을 알 수 있었다.

Abstract

To come up with the recommendations to improve the patent & trademark retrieval efficiency, 100,016 patent & trademark search requests by 17,559 unique users over a period of 193 days were analyzed. By analyzing 2,202 multi-query sessions, where one user issuing two or more queries consecutively, we discovered a number of retrieval efficiency improvements clues. The session analysis result also led to suggestions for new system features to help users reformulating queries. The patent & trademark retrieval users were found to be similar to the typical web users in certain aspects especially in issuing short queries. However, we also found that the patent & trademark retrieval users used Boolean operators more than the typical web search users. By analyzing the multi-query sessions, we found that the users had five intentions in reformulating queries such as paraphrasing, specialization, generalization, alternation, and interruption, which were also used by the web search engine users.

참고문헌

1

Blecic, D.D. (1998). Using transaction log analysis to improve OPAC retrieval results. 59(1), 39-50.

2

Hoelscher, C.. (1998). How Internet experts search for information on the Web. , -.

3

Jansen, B. (2000). Real life, real users, and real needs: A study and analysis of user queries on the web. 36(2), 207-227.

4

Noriaki, K. (2003). Semantic Log Analysis Based on a User Query Behavior Model. , 107-115.

5

Silverstein, C. (1999). . Analysis of Analysis of a very large Web search engine query logvery large Web search engine query log. SIGIR Forum. 33(1), 6-12.

6

Yoo, Jae Bok. (2004). Theories and Practices of Patent Information Retrieval. , -.

정보관리학회지