바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 이용가능성, 검색결과: 3
1
심원식(성균관대학교) ; 김성환(성균관대학교) 2007, Vol.24, No.4, pp.153-171 https://doi.org/10.3743/KOSIM.2007.24.4.153
초록보기
초록

본 연구는 이용이 매우 활발한 국내 학위논문의 원문 검색 서비스를 개선하기 위한 하나의 방법으로 한국직업능력개발원이 개발한 커리어넷의 학과정보 분류체계를 한국교육학술정보원이 운영하는 RISS에 포함된 학위논문 정보에 적용한 것이다. 연구 결과 커리어넷의 학과정보 분류체계는 최근 3년간 국내에서 생산되거나 이용된 학위논문을 분류하는데 비교적 적합한 것으로 나타났다. 최근 3개년 동안의 학과분류별 논문생산량과 논문이용량을 분석하였으며, 이를 바탕으로 학과분류 적용 가능성을 검토하고 활용방안을 모색하였다.

Abstract

This study suggests that improvement of theses and dissertations retrieval can be made by applying appropriate academic department classification. We applied the Korea Research Institute for Vocational Education and Training(KRIVET)'s department classification to these and dissertations being serviced by Korea Education & Research Information Service(KERIS). The results show that the chosen classification appropriately represents diverse academic department information contained in the theses and dissertations either published or used within the recent three year period. The study also makes a number of suggestions that will facilitate the application of an academic department classification to a live system.

초록보기
초록

오늘날 정보환경은 정보이용자로 하여금 도서관 장서뿐만 아니라 다양한 디지털 정보자원으로의 접근을 가능하게 하였다. 변화하는 환경에서 이용률이 증가하는 디지털 정보자원으로 웹사이트, 각종 데이터, 홈페이지 등을 들 수 있다. 이 연구는 ISI Web of Knowledge의 Essential Science Indicators에서 제공하는 인용정보를 이용하여 임상의학 분야의 피인용 횟수가 높은 저자들과 이 저자들의 논문을 인용한 저자들의 홈페이지에 수록된 연구 성과물을 추출한 후, 의학대학 디지털 도서관 및 학술포털과 비교 분석하였다. 10,000여명의 저자 중 연구 성과물 정보를 제시하는 146명의 홈페이지 연구정보를 분석하였는데, 홈페이지에서만 제공하는 연구정보는 학술지 논문, 단행본, 학술대회 발표논문, 강의노트를 포함하였다. 이 중 학술지 논문은 약 15%, 단행본은 약 32%, 학술대회 발표논문은 약 48%, 강의노트는 100% 모두 홈페이지를 통해서만 접근할 수 있는 연구 성과물로 분석되었다. 실제로 의학대학 도서관과 학술포털에서 제공하는 연구정보가 대부분 일치했던 점을 고려할 때, 저명한 연구자들의 홈페이지를 통한 연구정보의 확충이 디지털 도서관 장서개발의 양적, 질적 향상을 위한 방안이 될 수 있다.

Abstract

Nowadays the information environment enables users to access the traditional library collection as well as various digital information resources. In this rapidly changing environment, the use of digital information resources such as web sites, data, and homepages has increased. In this research, highly-cited authors' research outcomes as well as the research outcomes of the people, who cited the highly-cited authors' works, were extracted then compared with information stored in the medical colleges' digital libraries and the academic information portals in the clinical medicine area by using the citation information provided by Essential Science Indicators from ISI Web of Knowledge. Out of 10,000 authors, 146 people's homepages, which present research outcomes, were analyzed. The research outcomes listed in the homepages included journal papers, monographs, conference proceedings, and lecture notes. About 15% of the journal papers, 32% of the monographs, 48% of the conference proceedings, and 100% of lecture notes were accessible only through the homepages. The research outcomes accessible from the homepages were almost analogous to the ones available through the medical college's digital libraries and the academic information portals. Therefore, the digital library collection will be improved and expanded quantitatively and qualitatively by collecting and using the information in the homepages of the prestigious researchers.

초록보기
초록

이 연구에서는 분포 유사도를 문헌 클러스터링에 적용하여 전통적인 코사인 유사도 공식을 대체할 수 있는 가능성을 모색해보았다. 대표적인 분포 유사도인 KL 다이버전스 공식을 변형한 Jansen-Shannon 다이버전스, 대칭적 스큐 다이버전스, 최소 스큐 다이버전스의 세 가지 공식을 문헌 벡터에 적용하는 방안을 고안하였다. 분포 유사도를 적용한 문헌 클러스터링 성능을 검증하기 위해서 세 실험 집단을 대상으로 두 가지 실험을 준비하여 실행하였다. 첫 번째 문헌 클러스터링 실험에서는 최소 스큐 다이버전스가 코사인 유사도 뿐만 아니라 다른 다이버전스 공식의 성능도 확연히 앞서는 뛰어난 성능을 보였다. 두 번째 실험에서는 피어슨 상관계수를 이용하여 1차 유사도 행렬로부터 2차 분포 유사도를 산출하여 문헌 클러스터링을 수행하였다. 실험 결과는 2차 분포 유사도가 전반적으로 더 좋은 문헌 클러스터링 성능을 보이는 것으로 나타났다. 문헌 클러스터링에서 처리 시간과 분류 성능을 함께 고려한다면 이 연구에서 제안한 최소 스큐 다이버전스 공식을 사용하고, 분류 성능만 고려할 경우에는 2차 분포 유사도 방식을 사용하는 것이 바람직하다고 판단된다.

Abstract

In this study, measures of distributional similarity such as KL-divergence are applied to cluster documents instead of traditional cosine measure, which is the most prevalent vector similarity measure for document clustering. Three variations of KL-divergence are investigated; Jansen-Shannon divergence, symmetric skew divergence, and minimum skew divergence. In order to verify the contribution of distributional similarities to document clustering, two experiments are designed and carried out on three test collections. In the first experiment the clustering performances of the three divergence measures are compared to that of cosine measure. The result showed that minimum skew divergence outperformed the other divergence measures as well as cosine measure. In the second experiment second-order distributional similarities are calculated with Pearson correlation coefficient from the first-order similarity matrixes. From the result of the second experiment, second-order distributional similarities were found to improve the overall performance of document clustering. These results suggest that minimum skew divergence must be selected as document vector similarity measure when considering both time and accuracy, and second-order similarity is a good choice for considering clustering accuracy only.

정보관리학회지