바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 평가, 검색결과: 2
1
김희섭(경북대학교) ; 정영미(동의대학교) 2005, Vol.22, No.2, pp.165-184 https://doi.org/10.3743/KOSIM.2005.22.2.165
초록보기
초록

지식정보 사회가 점차 발전되어 감에 따라 온라인으로 제공되고 있는 정보에 대한 가치와 그 중요성이 날로 증가되고 있다. 하지만 정당화된 방법론이나 모델의 부재로 인하여 정보의 가치에 관련된 연구는 다소 미진한 실정이다. 이에 본 연구에서는 온라인 정보의 경제적 가치 평가 모델을 제안하고, 제안된 모델을 이용하여 실제로 정보통신부의 지원사업으로 개발 운영중인 정보통신 통합정보시스템(즉, ITFIND)에서 온라인으로 제공되고 있는 정보의 경제적 가치를 산출하였다. 경제적인 가치를 측정하기 위해 첫째, 정보의 카테고리별 이용가치와 교환가치를 측정하였고, 둘째, 이용자의 연간 수요량을 통해 정보 카테고리별 연간 일인당 CSUV와 CSEV를 산출하였으며, 마지막으로 ITFIND 전체 이용자의 연간 일인당 모평균 CSUV와 CSEV 추정을 통해 ITFIND에서 제공하고 있는 정보의 연간 경제적 가치인 CSUV와 CSEV를 산출하였다.

Abstract

Value and importance of online information are increased day by day as the knowledge and information society is emerging. However there is little study on information assessments due to the lack of the valid methodologies and models in this field. In this study we proposed a model of the economic value assessments for online information and utilized it to the contents of ITFIND which is an integrated IT information system supported by the MIC(Ministry of Information and Communication). We measured information value of ITFIND as follows: (1)both ‘use value' and ‘exchange value,' (2) annual CSUVand CSEV per person by the category of each information, and (3) annual economic value of CSUV and CSEV of ITFIND information based on it's users' annual CSUV and CSEV per person.

2
정영미(연세대학교) ; 이용구(계명대학교) 2005, Vol.22, No.2, pp.125-145 https://doi.org/10.3743/KOSIM.2005.22.2.125
초록보기
초록

이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음, 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 92%의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 67% 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 39.6%의 정확률을 보였고, EM 알고리즘 통합 검색이 약 36%의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 37%와 비교하면 나이브 베이즈 통합 검색은 약 7.4%의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 3%의 성능 저하율을 보였다.

Abstract

This paper presents a semantic vector space retrieval model incorporating a word sense disambiguation algorithm in an attempt to improve retrieval effectiveness. Nine Korean homonyms are selected for the sense disambiguation and retrieval experiments. The total of approximately 120,000 news articles comprise the raw test collection and 18 queries including homonyms as query words are used for the retrieval experiments. A Naive Bayes classifier and EM algorithm representing supervised and unsupervised learning algorithms respectively are used for the disambiguation process. The Naive Bayes classifier achieved 92% disambiguation accuracy, while the clustering performance of the EM algorithm is 67% on the average. The retrieval effectiveness of the semantic vector space model incorporating the Naive Bayes classifier showed 39.6% precision achieving about 7.4% improvement. However, the retrieval effectiveness of the EM algorithm-based semantic retrieval is 3% lower than the baseline retrieval without disambiguation. It is worth noting that the performances of disambiguation and retrieval depend on the distribution patterns of homonyms to be disambiguated as well as the characteristics of queries.

정보관리학회지