바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: science and technology, 검색결과: 2
1
노경란(한국과학기술정보연구원) ; 한상완(연세대학교) 2006, Vol.23, No.3, pp.223-239 https://doi.org/10.3743/KOSIM.2006.23.3.223
초록보기
초록

과학이 기술발전을 이끄는 주요 추진력이며 기술혁신이 궁극적으로 경제발전에 기여한다는 것이 밝혀짐에 따라 선진국은 과학과 기술간 상호작용을 중요하게 다루고 있다. 그러나 한국의 기술발전을 이끈 과학적 기반에 관한 연구가 거의 이루어지지 않았으며 한국의 기술과 강력한 연계를 맺고 있는 학문분야에 대한 연구도 미약한 실정이다. 따라서 이 연구는 특허에 인용된 과학논문을 이용하여 과학기술자의 인용행태를 추적하고, 인용행태 이면에 놓인 과학과 기술간 상호작용을 측정하고자 하였다. 과학논문이 특허의 혁신가치에 어떠한 영향을 미치고 있는지를 살펴봄으로써 기술개발에 있어 과학논문의 중요도를 밝히고자 하였다.

Abstract

As the fact that science is the driving force behind technological development and that technological innovation contributes to economic development has been proved empirically convincing, the interaction between science and technology is highly emphasized in advanced countries. But, Korea has not been active in conducting research on science-based technological development and on the scientific fields that have strong relationships with Korean technology. This study attempts to explore the influence of scientific research papers cited in US patents by Koreans on other US patents and identify the interactions between scientific research papers and patents, by examining the scientific references cited in the Korean-originated US patents.

초록보기
초록

본 연구는 실재 시스템 환경에서 문헌 분류를 위해 범주화 기법을 적용할 경우, 범주화 성능이 어느 정도이며, 적정한 문헌범주화 성능의 달성을 위하여 분류기 학습에 필요한 범주당 가장 이상적인 학습문헌집합의 규모는 무엇인가를 파악하기 위하여 kNN 분류기를 사용하여 실험하였다. 실험문헌집단으로15만 여건의 실제 서비스되는 데이터베이스에서 2,556건 이상의 문헌을 가진 8개 범주를 선정하였다. 이들을 대상으로 범주당 학습문헌수 20개(Tr20)에서 2,000개(Tr2000)까지 단계별로 증가시키며 8개 학습문헌집합 규모를 갖도록 하위문헌집단을 구성한 후, 학습문헌집합 규모에 따른 하위문헌집단 간 범주화 성능을 비교하였다. 8개 하위문헌집단의 거시평균 성능은 F1 값 30%로 선행연구에서 발견된 kNN 분류기의 일반적인 성능에 미치지 못하는 낮은 성능을 보였다. 실험을 수행한 8개 대상문헌집단 중 학습문헌수가 100개인 Tr100 문헌집단이 F1 값 31%로 비용대 효과면에서 분류기 학습에 필요한 최적정의 실험문헌집합수로 판단되었다. 또한, 실험문헌집단에 부여된 주제범주 정확도를 수작업 재분류를 통하여 확인한 후, 이들의 범주별 범주화 성능과 관련성을 기반으로 위 결론의 신빙성을 높였다.

Abstract

This paper examines a level of categorization performance in a reallife collection of abstract articles in the fields of science and technology, and tests the optimal size of documents per category in a training set using a kNN classifier. The corpus is built by choosing categories that hold more than 2,556 documents first, and then 2,556 documents per category are randomly selected. It is further divided into eight subsets of different size of training documents: each set is randomly selected to build training documents ranging from 20 documents (Tr20) to 2,000 documents (Tr2000) per category. The categorization performances of the 8 subsets are compared. The average performance of the eight subsets is 30% in F1 measure which is relatively poor compared to the findings of previous studies. The experimental results suggest that among the eight subsets the Tr100 appears to be the most optimal size for training a kNN classifier. In addition, the correctness of subject categories assigned to the training sets is probed by manually reclassifying the training sets in order to support the above conclusion by establishing a relation between and the correctness and categorization performance.

정보관리학회지