바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: information value, 검색결과: 3
1
김희섭(경북대학교) ; 정영미(동의대학교) 2005, Vol.22, No.2, pp.165-184 https://doi.org/10.3743/KOSIM.2005.22.2.165
초록보기
초록

지식정보 사회가 점차 발전되어 감에 따라 온라인으로 제공되고 있는 정보에 대한 가치와 그 중요성이 날로 증가되고 있다. 하지만 정당화된 방법론이나 모델의 부재로 인하여 정보의 가치에 관련된 연구는 다소 미진한 실정이다. 이에 본 연구에서는 온라인 정보의 경제적 가치 평가 모델을 제안하고, 제안된 모델을 이용하여 실제로 정보통신부의 지원사업으로 개발 운영중인 정보통신 통합정보시스템(즉, ITFIND)에서 온라인으로 제공되고 있는 정보의 경제적 가치를 산출하였다. 경제적인 가치를 측정하기 위해 첫째, 정보의 카테고리별 이용가치와 교환가치를 측정하였고, 둘째, 이용자의 연간 수요량을 통해 정보 카테고리별 연간 일인당 CSUV와 CSEV를 산출하였으며, 마지막으로 ITFIND 전체 이용자의 연간 일인당 모평균 CSUV와 CSEV 추정을 통해 ITFIND에서 제공하고 있는 정보의 연간 경제적 가치인 CSUV와 CSEV를 산출하였다.

Abstract

Value and importance of online information are increased day by day as the knowledge and information society is emerging. However there is little study on information assessments due to the lack of the valid methodologies and models in this field. In this study we proposed a model of the economic value assessments for online information and utilized it to the contents of ITFIND which is an integrated IT information system supported by the MIC(Ministry of Information and Communication). We measured information value of ITFIND as follows: (1)both ‘use value' and ‘exchange value,' (2) annual CSUVand CSEV per person by the category of each information, and (3) annual economic value of CSUV and CSEV of ITFIND information based on it's users' annual CSUV and CSEV per person.

초록보기
초록

최근 다양한 주제 분야의 블로그가 이용자의 정보요구를 충족시켜주는 웹 정보원 중 하나로 활용되고 있다. 본 연구에서는 블로그 페이지의 검색 성능을 향상시키기 위하여 이용자가 부여한 태그 및 트랙백을 이용하여 블로그 페이지의 검색 실험을 수행하였다. 실험을 위해 4,908개의 블로그 페이지와 각 페이지에 트랙백으로 연결된 다른 블로그 페이지의 URL을 수집하였다. 검색 자질로 본문의 용어에 이용자 태그를 추가하였을 경우와 네트워크 중심성 값을 반영하였을 경우 모두 검색 성능이 향상되었고, 본문 용어와 이용자 태그를 검색 자질로 함께 사용하고 여기에 중심성 값을 반영하였을 경우 가장 좋은 성능을 보였다.

Abstract

Blogs are now one of the major information resources on the web. The purpose of this study is to enhance the performance of blog retrieval by means of user assigned tags and trackback information. To this end, retrieval experiments were performed with a dataset of 4,908 blog pages together with their associated trackback URLs. In the experiments, text terms, user tags, and network centrality values based on trackbacks were variously combined as retrieval features. The experimental results showed that employing user tags and network centrality values as retrieval features in addition to text words could improve the performance of blog retrieval.

3
김용환(연세대학교) ; 정영미(연세대학교) 2012, Vol.29, No.2, pp.155-171 https://doi.org/10.3743/KOSIM.2012.29.2.155
초록보기
초록

텍스트 범주화에 있어서 일반적인 문제는 문헌을 표현하는 핵심적인 용어라도 학습문헌 집합에 나타나지 않으면 이 용어는 분류자질로 선정되지 않는다는 것과 형태가 다른 동의어들은 서로 다른 자질로 사용된다는 점이다. 이 연구에서는 위키피디아를 활용하여 문헌에 나타나는 동의어들을 하나의 분류자질로 변환하고, 학습문헌 집합에 출현하지 않은 입력문헌의 용어를 가장 유사한 학습문헌의 용어로 대체함으로써 범주화 성능을 향상시키고자 하였다. 분류자질 선정 실험에서는 (1) 비학습용어 추출 시 범주 정보의 사용여부, (2) 용어의 유사도 측정 방법(위키피디아 문서의 제목과 본문, 카테고리 정보, 링크 정보), (3) 유사도 척도(단순 공기빈도, 정규화된 공기빈도) 등 세 가지 조건을 결합하여 실험을 수행하였다. 비학습용어를 유사도 임계치 이상의 최고 유사도를 갖는 학습용어로 대체하여 kNN 분류기로 분류할 경우 모든 조건 결합에서 범주화 성능이 0.35%~1.85% 향상되었다. 실험 결과 범주화 성능이 크게 향상되지는 못하였지만 위키피디아를 활용하여 분류자질을 선정하는 방법이 효과적인 것으로 확인되었다.

Abstract

In text categorization, core terms of an input document are hardly selected as classification features if they do not occur in a training document set. Besides, synonymous terms with the same concept are usually treated as different features. This study aims to improve text categorization performance by integrating synonyms into a single feature and by replacing input terms not in the training document set with the most similar term occurring in training documents using Wikipedia. For the selection of classification features, experiments were performed in various settings composed of three different conditions: the use of category information of non-training terms, the part of Wikipedia used for measuring term-term similarity, and the type of similarity measures. The categorization performance of a kNN classifier was improved by 0.35~1.85% in F1 value in all the experimental settings when non-learning terms were replaced by the learning term with the highest similarity above the threshold value. Although the improvement ratio is not as high as expected, several semantic as well as structural devices of Wikipedia could be used for selecting more effective classification features.

정보관리학회지