바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073

사용자 태그와 중심성 지수를 이용한 블로그 검색 성능 향상에 관한 연구

Enhancing the Performance of Blog Retrieval by User Tagging and Social Network Analysis

정보관리학회지, (P)1013-0799; (E)2586-2073
2010, v.27 no.1, pp.61-77
https://doi.org/10.3743/KOSIM.2010.27.1.061
김은희 (연세대학교)
정영미 (연세대학교)

  • 다운로드 수
  • 조회수

초록

최근 다양한 주제 분야의 블로그가 이용자의 정보요구를 충족시켜주는 웹 정보원 중 하나로 활용되고 있다. 본 연구에서는 블로그 페이지의 검색 성능을 향상시키기 위하여 이용자가 부여한 태그 및 트랙백을 이용하여 블로그 페이지의 검색 실험을 수행하였다. 실험을 위해 4,908개의 블로그 페이지와 각 페이지에 트랙백으로 연결된 다른 블로그 페이지의 URL을 수집하였다. 검색 자질로 본문의 용어에 이용자 태그를 추가하였을 경우와 네트워크 중심성 값을 반영하였을 경우 모두 검색 성능이 향상되었고, 본문 용어와 이용자 태그를 검색 자질로 함께 사용하고 여기에 중심성 값을 반영하였을 경우 가장 좋은 성능을 보였다.

Abstract

Blogs are now one of the major information resources on the web. The purpose of this study is to enhance the performance of blog retrieval by means of user assigned tags and trackback information. To this end, retrieval experiments were performed with a dataset of 4,908 blog pages together with their associated trackback URLs. In the experiments, text terms, user tags, and network centrality values based on trackbacks were variously combined as retrieval features. The experimental results showed that employing user tags and network centrality values as retrieval features in addition to text words could improve the performance of blog retrieval.

참고문헌

1

김기주. (2007). 소규모 집단의 웹 사이트들을 위한 사이트 순위 결정 알고리즘. 한국인터넷정보학회: 학술대회논문집, 8(1), 379-383.

2

김기현. (2009). 이용자 태그 확장을 통한 블로그 자동분류 성능 향상에 관한 연구.

3

김영주. (2005). 블로그: 1인 미디어의 가능성과 한계:한국언론재단.

4

김용학. (2007). 사회 연결망 분석:박영사.

5

김정훈. (2009). 블로그의 구조적 특성을 고려한 효율적인 블로그 검색 알고리즘. 정보과학회논문지 : 소프트웨어 및 응용, 36(7), 580-589.

6

김지수. (2004). 블로그의 사회문화적 이슈. 정보통신 정책, 16(8), 18-36.

7

박한우. (2007). 블로그에 나타난 정치인 네트워크: 17대 국회의원을 대상으로. 한국언론학보, 51(3), 385-406.

8

이경희. (2003). 문서간의 유사도를 이용한 개선된 PageRank 알고리즘. 한국정보과학회: 학술발표논문집, 30(2), 169-171.

9

이재현. (2005). 블로그와 저널리즘. 관훈 저널, (봄), 22-30.

10

정영미. (2005). 정보검색연구:구미무역 (주) 출판부.

11

홍성국. (2004). 블로그의 속성과 이용 동기에 관한 연구.

12

Adar, E.. (2004). Implicit structure and the dynamics of blogspace (-). Proceed ings of the 13th International World Wide Web Conference.

13

Adamic, L. A.. (2005). The political blogosphere and the 2004 U.S. election: divided they blog (36-43). Proceedings of the 3rd International Workshop on Link Discovery.

14

Agarwal, N.. (2008). A study of communities and Influence in Blogosphere (19-24). Proceedings of the 2nd SIGMOD PhD Workshop on Innovative Database Research.

15

Agarwal, N.. (2008). Blogosphere: Research issues, tools, and applications. KDD Explorations, 10(1), 19-29.

16

Agarwal, N.. (2008). Identifying the influential bloggers in a community (207-218). Proceedings of the International Conference on Web Search and Web Data Mining.

17

Akritidis, L.. (2009). Identifying influential bloggers: time does matter:Arxiv.

18

Blood, R.. (2003). Weblogs and journalism: Do they connect?. Nieman Reports, 57(3), 61-63.

19

Borgatti, S.P.. (1999). UCINET 6.0 Version 1.00:Analytic Technologies.

20

Chin, A.. (2008). Automatic detection of cohesive subgroups within social hypertext: A heuristic apporoach. New Review of Hypermedia and Multimedia, 14(1), 121-143.

21

Clyde, L. A.. (2004). Library weblogs. Library Management, 25(5), 183-189.

22

Katz, E.. (1955). Personal Influence:The Free Press.

23

Kritikopoulos, A.. (2006). BlogRank: Ranking weblogs based on connectivity and similarity features (-). Proceedings of the 2nd International Workshop on Advanced Architectures and Algorithms for Internet Delivery and Applications.

24

Langville, Amy N.. (2008). Google's pagerank and beyond: The science of search engine rankings:Princeton University Press.

25

Lin, F.. (2008). The multi rank bootstrap algorithm: Semi-Supervised political blog classification and ranking using semi-supervised link classification (206-207). Proceedings of the International Conference on Web Search and Web Data Mining Poster.

26

Macdonald, C.. (2008). Overview of the TREC-2007 Blog Track (-). Proceeding of TREC 2007.

27

Mishne, G.. (2007). Using blog properties to improve retrieval (831-840). Proceedings of the 16th ACM Conference on Conference on Information and Knowledge Management.

28

Ounis, I.. (2007). Overview of the TREC-2006 Blog Track (-). Proceeding of TREC 2006.

29

Ounis, I.. (2008). On the TREC Blog Track (-). Proceeding of TREC 2008.

30

Song, X.. (2007). Identifying opinion leaders in the blogosphere (971-974). Proceedings of the 16th ACM conference on Conference on Information and Knowledge Management.

31

Song, X.. (2007). Summarization system by identifying blogs (-). International Conference on Weblogs and Social Media.

32

Todeva, E.. (2009). Pharmaceutical blogging and on-line distribution of information (1-13). Proceeding of the 42th Hawaii International Conference on System Science.

33

Wikipedia. http://en.wikipedia.org/. http://en.wikipedia.org/.

정보관리학회지