바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: common collection, 검색결과: 14
초록보기
초록

로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부여 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

Abstract

This study examines various weighting methods for improving the performance of automatic classification based on Rocchio algorithm on two collections(LISA, Reuters-21578). First, three factors for weighting are identified as document factor, document factor, category factor for each weighting schemes, the performance of each was investigated. Second, the performance of combined weighting methods between the single schemes were examined. As a result, for the single schemes based on each factor, category-factor-based schemes showed the best performance, document set-factor-based schemes the second, and document-factor-based schemes the worst. For the combined weighting schemes, the schemes(idf*cat) which combine document set factor with category factor show better performance than the combined schemes(tf*cat or ltf*cat) which combine document factor with category factor as well as the common schemes(tfidf or ltfidf) that combining document factor with document set factor. However, according to the results of comparing the single weighting schemes with combined weighting schemes in the view of the collections, while category-factor-based schemes(cat only) perform best on LISA, the combined schemes(idf*cat) which combine document set factor with category factor showed best performance on the Reuters-21578. Therefore for the practical application of the weighting methods, it needs careful consideration of the categories in a collection for automatic classification.

12
김성진(인하공업전문대학) 2006, Vol.23, No.4, pp.197-214 https://doi.org/10.3743/KOSIM.2006.23.4.197
초록보기
초록

전통적인 정보환경에 비해 웹 환경은 매우 다양하고 이질적인 이용자들을 대상으로 하기 때문에 이용자의 개별적 특성에 초점을 맞추어서는 웹 정보탐색행위에 대한 일반적인 이해가 불가능하다. 따라서 본 연구는 웹 이용자에게서 보여지는 공통된 정보탐색행위에 초점을 맞춰 이용자들이 웹에서 어떻게 정보를 찾는지 그 행위 패턴을 분석하고자 한다. 이를 위해 시간대별 인터뷰 기법을 적용하여 Dervin의 인지이동 개념을 기반으로 웹과의 상호작용 속에서 이루어진 일련의 인지적 움직임을 파악하고 하였다. 본 연구는 응답자 21명을 대상으로 37개의 웹 탐색 경험을 조사하였다. 분석결과, 웹 정보탐색행위는 시작, 검색, 브라우징, 조사, 정보발견, 결정/행동, 종료의 7가지 유형으로 구성되었다. 응답자별로 매우 다양한 행위 패턴을 보였으며 특히 브라우징 단계를 중심으로 반복되고 순환되면서 웹 정보탐색행위의 다방향적이고 비선형적인 특징을 보였다.

Abstract

A Web-based environment has very various and heterogeneous users. The emphasis on their individual characteristics may make it hard to reach the general understanding of how they seek and use information on the Web. The purpose of this study is to find common patterns in information seeking behavior on the Web by analyzing a series of cognitive movement of users in interaction with the Web. Based on Dervin’s concept and Timeline interview methodology, this study collected 37 Web experience descriptions from 21 respondents, which consisted of 302 steps. Findings addressed that Web information seeking behavior can be classified into seven types: Starting, Searching, Viewing/Browsing, Examining/Comparing, Finding/Compiling, Deciding/Acting, and Ending. Movement paths in the seven-type information seeking process showed that user’s interaction with the Web was repeated and circulated at the Viewing/Browsing step and that information seeking behavior on the Web was multi-directional and non-linear.

초록보기
초록

본 연구는 저작권법의 도서관 예외규정에 대한 이해를 높이고 국내 규정의 개선방향을 모색하기 위한 것이다. 이를 위하여 한국, 일본, 영국, 호주, 미국의 저작권법에서 도서관 예외규정을 비교분석하였다. 그 결과 이용자를 위한 복제물 제공, 보존을 위한 복제, 상호대차를 위한 복제, 도서관자료의 디지털화를 위한 복제 등이 대표적인 예외규정이었으나 그 세부 조건은 국가마다 상당한 차이가 있었다. 본 연구는 우리나라 저작권법의 도서관 예외규정에서 미공표저작물 및 구하기 힘든 저작물과 정기간행물에 대한 이용자용 복제의 분량 재조정, 제한된 조건하에서 이용자에게 디지털 복제물을 전송, 자체 보존용 복제가 가능한 조건 마련, 상호대차 근거규정 마련, 디지털화 대상범위 제한과 이용범위 확대 등을 제안하였다.

Abstract

The purpose of this study is to enhance the understanding of the provisions for library exceptions in copyright laws and to suggest the direction for the revision of provision in the Copyright Act of Korea. This study compares and analyzes the provisions for library exceptions in several countries’ copyright law including Korea, Japan, UK, Australia and USA. This study found that the most common issues in library exception provisions are providing reproduction for users, reproduction for preservation, reproduction for interlibrary loan and digitization of library collections but the conditions for each issue are quite different. The suggestions for the revision of the library exceptions in the Copyright Act of Korea are as follows: changing the amount of reproduction of unpublished works, of works which cannot be obtained at a fair price and of periodicals for users, the transmitting digital reproduction to the user under limited conditions, preparing conditions for reproduction for preservation in libraries, preparing the applicable provisions for reproductions for interlibrary loans and for the limitation of works to be digitized and extending their use at the same time.

14
김진원(명지대학교 문헌정보학과 석사과정) ; 이한슬(명지대학교 문헌정보학과 조교수) 2024, Vol.41, No.1, pp.411-438 https://doi.org/10.3743/KOSIM.2024.41.1.411
초록보기
초록

본 연구는 계량서지학적 분석 방법을 통해 여러 영역으로 나누어진 국내 건강정보 관련 연구를 통합적인 시각으로 보고자 하였다. 이를 위해 한국학술지인용색인 데이터베이스를 통해 2002년부터 2023년까지의 국내 ‘건강정보’ 관련 논문 1,193편을 수집하여 시기별 동향, 학문분야, 지적구조, 키워드 변화 시기를 분석하였다. 분석결과, 건강정보 관련 논문 수는 지속적으로 증가하였으며, 2021년 이후 감소하고 있다. 건강정보 관련 연구의 주요 학문분야는 ‘의공학’, ‘예방의학/직업환경의학’, ‘법학’, ‘간호학’, ‘문헌정보학’, ‘학제간연구’로 볼 수 있다. 건강정보 관련 연구의 지적구조를 파악하기 위해 단어동시출현분석을 시행하였다. 이후 도출된 네트워크의 구조와 군집파악을 위해 병렬최근접이웃클러스터링 알고리즘을 적용한 결과 ‘건강정보에 대한 의료공학적 관점’과 ‘건강정보에 대한 사회과학적 관점’이라는 2개의 대군집을 중심으로 그에 속한 4개의 중군집, 17개의 소군집을 파악할 수 있었다. 학문분야와 키워드의 변화 시기를 추적하기 위해 변곡점 분석을 시도하였으며 공통적으로 2010년과 2011년 사이에 변화가 있는 것으로 나타났다. 마지막으로 평균 출판년도와 단어출현빈도를 통해 전략 다이어그램을 도출하였으며 고빈도 키워드를 ‘유망’, ‘성장’, ‘성숙’ 영역으로 구분하여 제시하였다. 본 연구는 주로 내용분석 중심의 선행연구들과 다르게 여러 가지 계량서지학적 방법을 통해 건강정보 관련 연구영역을 통합적인 시각으로 바라보았다는 데 의의가 있다.

Abstract

This study aims to identify and comprehensively view health information-related research trends using a bibliometric analysis. To this end, 1,193 papers from 2002 to 2023 related to “health information” were collected through the Korea Citation Index (KCI) database and analyzed in diverse aspects: research trends by period, academic fields, intellectual structure, and keyword changes. Results indicated that the number of papers related to health information continued to increase and has been decreasing since 2021. The main academic fields of health information-related research included “biomedical engineering,” “preventive medicine/occupational environmental medicine,” “law,” “nursing,” “library and information science,” and “interdisciplinary research.” Moreover, a co-word analysis was performed to understand the intellectual structure of research related to health information. As a result of applying the parallel nearest neighbor clustering (PNNC) algorithm to identify the structure and cluster of the derived network, four clusters and 17 subgroups belonging to them could be identified, centering on two conglomerates: “medical engineering perspective on health information” and “social science perspective on health information.” An inflection point analysis was attempted to track the timing of change in the academic field and keywords, and common changes were observed between 2010 and 2011. Finally, a strategy diagram was derived through the average publication year and word frequency, and high-frequency keywords were presented by dividing them into “promising,” “growth,” and “mature.” Unlike previous studies that mainly focused on content analysis, this study is meaningful in that it viewed the research area related to health information from an integrated perspective using various bibliometric methods.

정보관리학회지