바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073

태그결합을 이용한 불리언 검색에서 순위화된 검색결과를 제공하기 위한 시스템 설계 및 구현

Design and Implementation of Tag Coupling-based Boolean Query Matching System for Ranked Search Result

정보관리학회지, (P)1013-0799; (E)2586-2073
2012, v.29 no.4, pp.101-121
https://doi.org/10.3743/KOSIM.2012.29.4.101
김용 (전북대학교)
주원균 (한국과학기술정보연구원)

  • 다운로드 수
  • 조회수

초록

불리언 검색만을 제공하는 정보시스템들은 순위화된 검색 결과를 제공하지 않아 이용자들이 많은 시간을 들여 수많은 결과를 일일이 확인해야하는 단점이 있다. 따라서 본 연구에서는 불리언 검색 모델의 단점을 극복하기 위한 방법으로써 불리언 검색에서 적용되고 있는 색인 가중치 정보 대신에 태그 간의 결합 관계 정보를 이용하여 순위화된 검색 결과를 제공하기 위한 시스템을 제안한다. 본 연구에서 제안하고 있는 방법은 일반적인 키워드 질의 대신에 문서를 질의로 사용하기 때문에 해당 문서에서 질의로 사용하는 핵심태그를 추출한다. 질의 생성 과정에서는 태그결합도에 따라 다양한 그룹의 불리언 질의를 생성하고, 매칭 과정에서는 해당 질의어 그룹 간에 차별성 정보와 태그 중요도 정보를 이용하여 순위화를 처리한다. 본 연구에서 제안하고 있는 방법의 유용성을 평가하기 위하여 선정된 연구정보와 관련된 동향분석정보를 추출하는 과정에 적용하여 실험을 수행하였다. 또한 제안된 방법에 대한 이용자 평가를 위하여 다수의 이용자들을 대상으로 약 1년간 서비스를 제공하였으며 그 결과 높은 이용자 만족도를 확보할 수 있다고 조사되었다.

Abstract

Since IR systems which adopt only Boolean IR model can not provide ranked search result, users have to conduct time-consuming checking process for huge result sets one by one. This study proposes a method to provide search results ranked by using coupling information between tags instead of index weight information in Boolean IR model. Because document queries are used instead of general user queries in the proposed method, key tags used as queries in a relevant document are extracted. A variety of groups of Boolean queries based on tag couplings are created in the process of extracting queries. Ranked search result can be extracted through the process of matching conducted with differential information among the query groups and tag significance information. To prove the usability of the proposed method, the experiment was conducted to find research trend analysis information on selected research information. Aslo, the service based on the proposed methods was provided to get user feedback for a year. The result showed high user satisfaction.

참고문헌

1

김은희. (2010). 사용자 태그와 중심성 지수를 이용한 블로그 검색 성능 향상에 관한 연구. 정보관리학회지, 27(1), 61-77.

2

이성재. (2011). 위키피디아 기반의 의미 연관성을 이용한 태깅된 웹 이미지의 검색순위 조정. 멀티미디어학회논문지, 14(11), 1491-1499.

3

이수상. (2009). 차세대 검색서비스의 속성에 관한 연구. 정보관리학회지, 26(4), 93-112.

4

이정미. (2007). 폭소노미의 개념적 접근과 웹 정보 서비스에의 적용. 한국비블리아학회지, 18(2), 141-159.

5

엄태영. (2010). 태그 네트워크를 이용한 개인화 북마크 추천시스템. 한국전자거래학회지, 15(4), 181-195.

6

임영석. (2011). 사용자 활동 점수에 기반한 태그 검색 개선. 정보과학회논문지 : 컴퓨팅의 실제 및 레터, 17(3), 150-158.

7

Baeza-Yates, R.. (1999). Modern information retrieval:Addison-Wesley Longman.

8

Bao, S.. (2007). Optimizing web search using social annotations (501-510). Proceedings of the 16th international conference on World Wide Web (WWW '07).

9

Begelman, G. (2005). Automated tag clustering: Improving search and exploration in the tag space (-). Paper presented at the Collaborative Web Tagging Workshop at WWW 06.

10

Bookstein, A.. (1980). Fussy requests : An approach to weighted boolean searches. Journal of the American Society for Information Science, 31(4), 275-279.

11

Carmagnola, F.. (2007). Towards a tag-based user model: How can user model benefit from tags? (445-449). Lecture Notes in Computer Science.

12

Cattuto, C.. (2008). Semantic grounding of tag relatedness in social bookmarking systems (615-631). Lecture Notes in Computer Science.

13

Chen, H.. (1995). Automatic thesaurus generation for an electronic community system. Journal of the American Society for Information Science, 46(3), 175-193.

14

최윤선. (2010). Implications of Social Tagging for Digital Libraries: Benefiting from User Collaboration in the Creation of Digital Knowledge. 정보관리학회지, 27(2), 225-239.

15

Heymann, P.. (2008). Can social bookmarking improve web search? (195-206). Proceedings of the 2008 International Conference on Web Search and Data Mining (WSDM '08).

16

Jeh, G.. (2002). SimRank: A measure of structural-context similarity (538-543). Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '02).

17

Jing, Y.. (1994). An association thesaurus for information retrieval (146-160). Proceedings of the RIAO '94 Conference.

18

Kent, A.. (1955). Machine literature searchingⅧ: Operational criteria for designing information retrieval systems (93-101). American Documentation.

19

Lee, Bog-Gi. (1999). A new document ranking algorithm in boolean retrieval system. Journal of Kyungwon College, 21, 159-165.

20

Moffat, A.. (2008). Rank-biased precision for measurement of retrieval effectiveness. ACM Transactions on Information Systems, 27(1), 1-26.

21

Nakamoto, R. Y.. (2008). Reasonable tag-based collaborative filtering for social tagging systems (11-18). Proceedings of the 2nd ACM Workshop on Information Credibility on the Web (WICOW '08).

22

National Discovery for Science Leaders (NDSL). http://www.ndsl.kr.

23

National R&D Outcome Service. http://roots.ntis.go.kr.

24

National Science and Technology Information Service (NTIS). http://www.ntis.go.kr.

25

NDSL Trend Service. http://radar.ndsl.kr.

26

Page, L.. (1998). The PageRank citation ranking : Bringing order to the web (161-172). Proceedings of the 7th International World Wide Web Conference Brisbane.

27

Salton, G.. (1983). Introduction to modern information retrieval:McGraw Hill.

28

Salton, G.. (1983). Extended boolean information retrieval. Communications of the ACM, 36(11), 1022-1036.

29

Schmitz, P.. (2006). Inducing ontology from flickr tags (-). Paper presented at the Collaborative Web Tagging Workshop at WWW 06.

30

Waller, W. G.. (1979). A mathematical model for a weighted boolean retrieval system. Information Processing and Management, 15(5), 235-245.

31

Xu, Z.. (2006). Towards the semantic web: collaborative tag suggestions (-). Paper presented at the Collaborative Web Tagging Workshop at WWW 06.

32

Yanbe, Y.. (2007). Can social bookmarking enhance search in the web? (107-116). Proceedings of the 7th ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL '07).

33

Yi, K.. (2009). Linking folksonomy to library of congress subject headings : An exploratory study. Journal of Documentation, 65(6), 872-900.

정보관리학회지