바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: document similarities, 검색결과: 16
11
김수연(연세대학교) ; 정영미(연세대학교) 2006, Vol.23, No.3, pp.147-165 https://doi.org/10.3743/KOSIM.2006.23.3.147
초록보기
초록

이 연구에서는 전체 문헌집단으로부터 초기 질의어에 대한 연관용어 선정 시 사용할 수 있는 최적의 기법을 찾기 위해 연관규칙 마이닝과 용어 클러스터링 기법을 이용하여 연관용어 선정 실험을 수행하였다. 연관규칙 마이닝 기법에서는 Apriori 알고리즘을 사용하였으며, 용어 클러스터링 기법에서는 연관성 척도로 GSS 계수, 자카드계수, 코사인계수, 소칼 & 스니스 5, 상호정보량을 사용하였다. 성능평가 척도로는 연관용어 정확률과 연관용어 일치율을 사용하였으며, 실험결과 Apriori 알고리즘과 GSS 계수가 가장 좋은 성능을 나타냈다.

Abstract

In this study, experiments for selection of association terms were conducted in order to discover the optimum method in selecting additional terms that are related to an initial query term. Association term sets were generated by using support, confidence, and lift measures of the Apriori algorithm, and also by using the similarity measures such as GSS, Jaccard coefficient, cosine coefficient, and Sokal & Sneath 5, and mutual information. In performance evaluation of term selection methods, precision of association terms as well as the overlap ratio of association terms and relevant documents' indexing terms were used. It was found that Apriori algorithm and GSS achieved the highest level of performances.

12
남영준(중앙대학교) ; 서현정(중앙대학교) ; 김규환(중앙대학교) 2011, Vol.28, No.4, pp.201-220 https://doi.org/10.3743/KOSIM.2011.28.4.201
초록보기
초록

이 연구에서는 우리나라 토목공학분야 연구자들이 참조하는 정보원의 유형을 인용분석을 통해 조사하였다. 분석 결과는 다음과 같다. 1)주요 인용정보원은 학술지(55.7%)와 단행본(15.6%)과 회의자료(10.2%) 순이었다. 2)출판 후 10년 이내(26.1%)의 문헌을 가장 많이 인용하였다. 3)핵심학술지는 국내학술지였으며, 상위권 핵심학술지 선호도에서도 국내와 국외문헌의 의존도가 유사하였다. 4)최신자료의 경우 국내문헌을, 출판 이후 경과시간이 오래된 자료의 경우 국외문헌을 선호하였다. 5)국내외 모든 핵심학술지들이 영향력 지수와 즉시성 지수의 값이 동시에 높게 나타나지 않았다.

Abstract

This study analyzes types of primary sources cited by South Korean civil engineers. The results are as follows: 1) primary sources by preference are academic journal (55.7%), book (15.6%), seminar contents (10.2%). 2) documents published within last 10 years (26.1%) are cited most often. 3) domestic journal is the primary academic journal cited, and the finding is similar in preference of top-ranked primary reference (domestic and foreign combined). 4) In terms of time, domestic sources are preferred for up-to-date publications, and foreign sources for relatively non-recent publications. 5) The indices of influence and extemporaneity for both domestic and foreign sources do not show high numbers simultaneously.

13
한승희(일본 Keio University) ; 정영미(연세대학교) 2004, Vol.21, No.3, pp.251-267 https://doi.org/10.3743/KOSIM.2004.21.3.251
초록보기
초록

The purpose of this study is to generate the local level knowledge structure of a single document, similar to end-of-the-book indexes and table of contents of printed material, through the use of term clustering and cluster representative term selection. Furthermore, it aims to analyze the functionalities of the knowledge structure, and to confirm the applicability of these methods in user-friendly information services. The results of the term clustering experiment showed that the performance of the Ward's method was superior to that of the fuzzy K-means clustering method. In the cluster representative term selection experiment, using the highest passage frequency term as the representative yielded the best performance. Finally, the result of user task-based functionality tests illustrate that the automatically generated knowledge structure in this study functions similarly to the local level knowledge structure presented in printed material.攀*** 본 연구는 연세대학교 대학원 박사학위논문의 일부를 요약한 것임.*** 日本 慶應義塾大學(Keio University) 圖書館情報學科 訪問硏究員(libinfo@yonsei.ac.kr)****연세대학교 문헌정보학과 교수(ymchung@yonsei.ac.kr) 논문접수일자 : 2004년 8월 17일 게재확정일자 : 2004년 9월 10일攀攀

Abstract

14
유재복(한국원자력연구원) ; 정영미(연세대학교) 2010, Vol.27, No.1, pp.103-118 https://doi.org/10.3743/KOSIM.2010.27.1.103
초록보기
초록

최근 특허기술의 가치평가가 크게 강조되고 있으며, 그 평가의 수단으로 특허의 피인용횟수가 매우 유용한 척도 중의 하나로 받아들여지고 있다. 그에 따라 이 연구에서는 특허의 피인용횟수와 이에 영향을 미칠만한 형태적․기술적․개념적 요인의 17개 변수들 간의 상관관계를 미국특허를 대상으로 5개 주제분야에 걸쳐 분석하였다. 분석결과 특허의 피인용횟수와 일정 수준 이상의 상관관계, 즉 5% 이상의 설명력을 갖는 변수는 페이지 수, 청구항 수, 참고문헌 평균 피인용횟수, 기술분야 특허증감율, 서지결합도, 동시인용도 및 문헌간유사도 등 7개로 나타났다. 또한 이들 변수에 대한 분산분석 결과 7개 변수 모두 전반적으로 대부분의 주제분야 간에 있어서 평균값의 차이가 있는 것으로 나타났다.

Abstract

Recently, the valuation of patented technology has been greatly emphasized, and patent citation has been accepted as a very useful index of this technology. In this study, we performed correlation analyses between the patent citation counts and 17 explanatory variables of morphological, technological, and conceptual factors with a test dataset of U.S. patents in five subject fields. Seven variables having 5% or more standardized variances(r2) with patent citation counts were identified; number of pages, number of claims, reference-average-citation rate, patent increase/decrease rate, strength of bibliographic coupling, co-citation counts and document similarity. The result of the ANOVA test shows that the mean values of these variables vary among most subject fields.

15
김나연(이화여자대학교 일반대학원 문헌정보학과 석사) ; 정은경(이화여자대학교 문헌정보학과 교수) 2020, Vol.37, No.4, pp.1-26 https://doi.org/10.3743/KOSIM.2020.37.4.001
초록보기
초록

오늘날 점차 데이터 집약적으로 변모하는 학문 환경 속에서 데이터는 연구부산물이 아닌 연구성과물로써 학술 커뮤니케이션의 기반으로 자리 잡아가고 있다. 그러나 데이터 공급의 확대나 접근가능성의 확보만으로는 실제적인 데이터 재이용을 담보하는 데 한계가 있다. 이를 극복하기 위해서는 학술연구자의 데이터 재이용 행위와 데이터요구를 심층적으로 파악할 필요성이 있다. 따라서 본 연구는 연구자의 주요 데이터 재이용 행위와 데이터요구를 규명하고자 하였다. 이를 위해 한국사회과학자료원(KOSSDA)의 최근 3개년 데이터 재이용문헌 중 KCI 등재 논문의 저자를 연구대상으로 선정하고, 인터뷰를 수락한 연구자 12명과의 심층면담을 수행하였다. 심층면담 분석결과, 데이터를 재이용하는 요인은 개인적, 경제적, 기술적, 사회적 측면 모두에서 나타났으며, 데이터 재이용 목적에 따라 데이터 그 자체를 이용하거나 데이터가 지닌 맥락정보를 활용하였다. 웹 기반의 정보원으로부터 데이터를 주로 습득하였으나 비공식적인 커뮤니케이션을 통해 파악하는 경우도 있었다. 한편 데이터 재이용 시에 발생하는 학술연구자의 데이터요구를 살펴보면 생산 단위는 기관을, 언어는 영어를, 국가로는 미국을 선호하였다. 또한 조사원 기입식 대인면접 조사 방식으로 수집된 양적 데이터를 우선시하였다. 메타데이터와 식별정보를 충분히 포함한 원자료 수준의 데이터를 긍정적으로 인식하였으나, 접근 및 이용이 통제된 데이터는 데이터가 지닌 가치에 대한 확신을 갖기 어려워 부정적으로 받아들였다. 그러나 데이터의 규모나 최신성과 관련된 선호는 뚜렷하게 나타나지 않았는데 이는 선택 가능한 유사 데이터가 부재하였기 때문이었다.

Abstract

In today’s increasingly data-intensive academic environment, data is becoming the foundation of academic communication as a research outcome rather than a research by-product. However, there is a limit to guaranteeing actual data reuse only by expanding the data supply or securing accessibility. In order to overcome this, it is necessary to understand the data reuse behavior and data needs in-depth. Therefore, this study attempted to identify the major data reuse behavior and data needs among researchers. To this end, the authors of KCI papers among the data reuse documents of the Korea Social Science Data Archive (KOSSDA) for the past 3 years were targeted. An in-depth interview was conducted with 12 researchers who accepted the interview. As a result, factors considered when reusing data were personal, economic, technical, and social aspects, and it was found that the data itself was used or contextual information of the data was used depending on the purpose of data reuse. The path to acquiring data is a web-based source of information, and a path through informal communication can also be found. In terms of the data needs, it was found that they prefer English, the United States, and institutional producers. Also they have a clear preference for quantitative data from an interviewer-filled interpersonal interview survey method, rich metadata along with raw data, and data that contains identification information. However, due to the lack of confidence in the value, it is negative for the use of data with controlled access and use, and it is difficult to confirm a clear preference because there is no similar data available for selection in terms of size and freshness.

16
심원식(성균관대학교 문헌정보학과 교수) 2019, Vol.36, No.4, pp.227-251 https://doi.org/10.3743/KOSIM.2019.36.4.227
초록보기
초록

최근 우리나라에서도 관련 법개정을 통해 해외 국가의 연구비 지원기관 등에서 시행하고 있는 데이터관리계획 정책이 도입되었다. 본 연구는 앞으로 연구데이터의 공유 및 재사용을 지원할 수 있는 인프라와 지원 서비스를 개발함에 있어 참고가 될 수 있는 호주의 사례를 분석하여 시사점을 도출하고자 하였다. 이를 위해 호주의 연구비 지원기관, 연구데이터 전담기관, 대학도서관의 다양한 전문가와의 면담을 시행하고 관련 문헌을 조사하였다. 호주의 경우 연방 차원에서 2015년 제정된 Public Data Policy에 연구데이터를 공공데이터 범위에 포함시키고, 연구비 지원기관의 정책 가이드라인에 연구데이터의 체계적인 관리와 공유를 권장하고 있지만 의무규정은 아니다. 연구데이터 전담기관인 Australian National Data Service(ANDS)는 국가의 연구인프라 구축의 중요한 부분이며 연구데이터 인프라의 구축, 교육, 정책 지원, 소규모 연구개발사업 지원 등의 다양한 역할을 수행하고 있다. 호주 대학도서관은 연구데이터 관련 일부 자체 시스템을 제공하고 있으나 아직까지는 연구데이터와 관련된 주요한 수요는 없는 것으로 보인다. 호주 사례의 시사점으로는 연구데이터 관련 정책 수립에 있어서 높은 투명성과 예측가능성, 연구데이터 전담 기관 설립을 통한 전문적 인프라 구축 및 교육/홍보 기능 수행, 대학도서관의 데이터 역량 개발을 들 수 있다.

Abstract

In early 2019, Korea passed the law that introduced data management plan policy similar to those adopted by national funding agencies in other countries. In anticipation of developing research data infrastructure and support services, this study analyzed Australia’s relevant policies and policy instruments. A number of face-to-face interviews with the experts at the national funding agency, a national research data agency and a number of research libraries, along with focused literature analysis. In Australia, the 2015 Public Data Policy is applied to research data from publicly funded research. Research data management and sharing is recommended but not required by the national funding agency it its policy documents. Australian National Data Service(ANDS), Australia’s national research data agency, is an important component of the national research infrastructure. ANDS plays a wide range of roles including research data platform development, education and training, policy support, and funding agency for small-scale R&D. Some of the Australian research libraries have developed in-house systems for research data storage and publishing. However, there is no significant demand for research data service as yet. Lessons learned include the following: ensuring transparency and predictability of research data policies, establishing a dedicated agency responsible for research data platform development and training, and cultivating data capabilities at research libraries.

정보관리학회지