바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: subject, 검색결과: 11
1
심경(Systems R&D Center, Iris.Net) ; 정영미(연세대학교) 2006, Vol.23, No.2, pp.265-285 https://doi.org/10.3743/KOSIM.2006.23.2.265
초록보기
초록

문헌범주화에서는 학습문헌집합에 부여된 주제범주의 정확성이 일정 수준을 가진다고 가정한다. 그러나, 이는 실제 문헌집단에 대한 지식이 없이 이루어진 가정이다. 본 연구는 실제 문헌집단에서 기 부여된 주제범주의 정확성의 수준을 알아보고, 학습문헌집합에 기 부여된 주제범주의 정확도와 문헌범주화 성능과의 관계를 확인하려고 시도하였다. 특히, 학습문헌집합에 부여된 주제범주의 질을 수작업 재색인을 통하여 향상시킴으로써 어느 정도까지 범주화 성능을 향상시킬 수 있는가를 파악하고자 하였다. 이를 위하여 과학기술분야의 1,150 초록 레코드 1,150건을 전문가 집단을 활용하여 재색인한 후, 15개의 중복문헌을 제거하고 907개의 학습문헌집합과 227개의 실험문헌집합으로 나누었다. 이들을 초기문헌집단, Recat-1, Recat-2의 재 색인 이전과 이후 문헌집단의 범주화 성능을 kNN 분류기를 이용하여 비교하였다. 초기문헌집단의 범주부여 평균 정확성은 16%였으며, 이 문헌집단의 범주화 성능은 F1값으로 17%였다. 반면, 주제범주의 정확성을 향상시킨 Recat-1 집단은 F1값 61%로 초기문헌집단의 성능을 3.6배나 향상시켰다.

Abstract

In text categorization a certain level of correctness of labels assigned to training documents is assumed without solid knowledge on that of real-world collections. Our research attempts to explore the quality of pre-assigned subject categories in a real-world collection, and to identify the relationship between the quality of category assignment in training set and text categorization performance. Particularly, we are interested in to what extent the performance can be improved by enhancing the quality (i.e., correctness) of category assignment in training documents. A collection of 1,150 abstracts in computer science is re-classified by an expert group, and divided into 907 training documents and 227 test documents (15 duplicates are removed). The performances of before and after re-classification groups, called Initial set and Recat-1/Recat-2 sets respectively, are compared using a kNN classifier. The average correctness of subject categories in the Initial set is 16%, and the categorization performance with the Initial set shows 17% in F1 value. On the other hand, the Recat-1 set scores F1 value of 61%, which is 3.6 times higher than that of the Initial set.

2
민기은(진성고등학교) ; 정영미(연세대학교) 2007, Vol.24, No.4, pp.73-96 https://doi.org/10.3743/KOSIM.2007.24.4.073
초록보기
초록

이 연구에서는 웹과 학술지를 통한 학술 커뮤니케이션의 특성을 각각 분석하고, 웹상에서의 학술 커뮤니케이션 패턴이 학문 분야에 따라 어떤 차이를 보이는지 비교하였다. 경제학과 컴퓨터공학정보시스템 분야에서 키워드를 추출하여 이와 관련된 학술적 웹페이지와 학술지 논문을 수집하였고, 이를 학술적 웹페이지의 특성, 웹페이지 동시링크와 학술지 논문 동시인용 데이터의 다차원척도(MDS) 분석, 시간의 흐름에 따른 학술 활동의 변화 등 세 가지 측면에서 분석하였다. 분석 결과, 웹과 학술지를 통한 학술 커뮤니케이션에는 공통점과 차이점이 나타났으며, 이런 현상은 두 학문 분야에서 모두 확인되었다. 그리고 웹을 통한 학술 커뮤니케이션의 경우 같은 학문 분야 내의 세부 주제에 따라서 고유한 특성이 나타나는 것을 볼 수 있었다.

Abstract

In this study, the characteristics of scholarly communication through the Web and scientific journals are explored, and scholarly communication patterns in two scientific disciplines are compared to reveal the difference. Economics and Computer Science-Information Systems are selected as two disciplines to be analyzed. In the data collection process, 10 keywords are extracted from a database for each subject field, and scholarly Web pages and journal articles related to these keywords are collected and analyzed. Our investigation includes the characteristics of scholarly Web pages, Multi-Dimensional Scaling (MDS) analysis of co-linked Web pages as well as co-cited journal articles, and changes in the scholarly communication activities occurring on the Web and in scientific journals respectively over time. We found certain differences as well as common features in scholarly communication patterns between the Web and scientific journals for both fields of Economics and Computer Science. We also found that scholarly communication occurring on the Web displays unique features for each subtopic within the same field of study.

초록보기
초록

Abstract

This study explores knowledge structures of science and technology disciplines using a cocitation analysis of journal subject categories with the publication data of a science & technology oriented university in Korea. References cited in the articles published by the faculty of the university were analyzed to produce MDS maps and network centralities. For the whole university research domain, six clusters were created including clusters of Biology related subjects, Medicine related subjects, Chemistry plus Engineering subjects, and multidisciplinary sciences plus other subjects of multidisciplinary nature. It was found that subjects of multidisciplinary nature and Biology related subjects function as central nodes in knowledge communication network in science and technology. Same analysis procedure was applied to two natural science disciplines and another two engineering disciplines to present knowledge structures of the departmental research domains.

초록보기
초록

과학기술분야 국제협력은 국가 경쟁력 확보를 위해서 필수적이다. 한국은 과학기술의 인적․물적 자원의 한계를 극복하고자 연구의 국제화를 추진하고 있으며 최근 아시아 국가와 연구협력에서 높은 성장률을 보여주었다. 본 연구에서는 네트워크 분석을 이용하여 한국과의 공동연구가 크게 증가한 아시아 국가 간 공동연구 현황을 공저논문 수와 주제범주로 구분하여 실증적으로 파악하였다. 최근 5년간 아시아 국가 간 공저논문 수 기반 네트워크를 살펴보면, 일본, 중국, 한국 등 동북아시아 국가들이 네트워크 중심부에 있었으며 국가 상호 간 공동연구가 활발하게 이루어졌다. 또한 아시아 지역별로 공동연구의 주제범주를 분석한 결과, 동북아시아 지역은 기초과학 분야에서, 남부아시아, 동남아시아, 서남아시아 지역은 의학 분야에서 공동연구가 활발하게 이루어진 것으로 나타났다.

Abstract

Recently, research community in Korea has shown a rapid growth in collaborating with Asian countries. In this study, we analyzed research collaboration among Asian countries using network analysis of co-authored papers as well as subject categories. The network of co-authored papers among Asian countries over the 5-year period since 2005 revealed that Japan, China, and Korea were positioned at the central part of the network and highly productive in collaborative research. In the analysis of the subject categories of co-authored papers in four different Asian regions with 2009 data, physics and material science were found the most productive subject fields in collaborative research in Northeast Asia. On the other hand, medical science was the most collaborative subject field in the remaining Asian regions.

5
유재복(한국원자력연구원) ; 정영미(연세대학교) 2010, Vol.27, No.4, pp.239-258 https://doi.org/10.3743/KOSIM.2010.27.4.239
초록보기
초록

이 연구에서는 특허의 인용에 영향을 미치는 주요 변수들을 토대로 특허의 피인용횟수를 예측하기 위한 모형을 제시하였다. 이를 위해 미국특허를 대상으로 5개 주제분야에 걸쳐 특허의 피인용횟수와 일정 수준 이상의 상관관계, 즉 5% 이상의 설명력을 갖는 것으로 밝혀진 페이지 수, 청구항 수, 참고문헌 평균 피인용횟수, 서지결합도, 문헌간유사도 등 5개 변수들을 토대로 다중회귀분석을 실시하였다. 연구결과에 따르면, 제시된 5개 주제분야의 특허인용 예측모형의 설명력은 주제분야에 따라 58.3%~89.6%로 나타났으며, 예측변수로 사용된 5개의 독립변수 중 특허 피인용횟수에 가장 영향력이 높은 변수는 ‘문헌간유사도’로 나타났다. 또한 이 연구에서 추정된 주제분야별 예측모형을 토대로 산출한 특허 피인용횟수에 대한 예측값과 실제값을 비교한 결과 이들 예측모형은 5개 주제분야에서 모두 적합한 것으로 나타났다.

Abstract

The purpose of this study is to develop a prediction model of patent citation counts based on major factors which affect patent citation. To this end, we performed multiple regression analysis between the patent citation counts and five explanatory variables such as the number of pages, the number of claims, the reference-average-citation rate, the strength of bibliographic coupling, and the document similarity proved as having 5% or more standardized variances(r2) with patent citation counts, with a test dataset of U.S. patents in five subject fields. As a result, our prediction models showed 58.3% to 89.6% predictability depending on subject fields and revealed the document similarity has the highest impact on citation counts among the five predictive variables in all the subject fields. The result of comparison between the predicted citation counts and the actual ones confirmed the usefulness of the citation prediction models built for each subject field.

초록보기
초록

이 연구에서는 한국형 포털에 적합한 커뮤니티 기반 개인화 검색 서비스 모형을 제안하였다. 개인화 검색 서비스 모형은 이용자의 관심 주제를 파악하는 과정과 이를 반영한 검색 결과 재순위화 및 관련 주제 카테고리와 질의어 추천 과정으로 구성된다. 개인화 검색 모형의 유용성을 검증하기 위한 실험에서는 포털 사이트 다음에서 12일간 수집한 이용자 로그 데이터를 사용하였다. 실험 결과 개별 이용자의 주제 카테고리 선정에 사용한 카페 활동성 분석과 신지식 활동성 분석 데이터는 매우 유용한 것으로 나타났으며, 개인화 검색 결과와 추천 서비스에 대한 만족도도 비교적 높게 나타났다.

Abstract

This study proposes an expanded model of personalized search service based on community activities on a Korean Web portal. The model is composed of defining subject categories of users, providing personalized search results, and recommending additional subject categories and queries. Several experiments were performed to verify the feasibility and effectiveness of the proposed model. It was found that users’ activities on community services provide valuable data for identifying their interests, and the personalized search service increases users’ satisfaction.

7
유재복(한국원자력연구원) ; 정영미(연세대학교) 2010, Vol.27, No.1, pp.103-118 https://doi.org/10.3743/KOSIM.2010.27.1.103
초록보기
초록

최근 특허기술의 가치평가가 크게 강조되고 있으며, 그 평가의 수단으로 특허의 피인용횟수가 매우 유용한 척도 중의 하나로 받아들여지고 있다. 그에 따라 이 연구에서는 특허의 피인용횟수와 이에 영향을 미칠만한 형태적․기술적․개념적 요인의 17개 변수들 간의 상관관계를 미국특허를 대상으로 5개 주제분야에 걸쳐 분석하였다. 분석결과 특허의 피인용횟수와 일정 수준 이상의 상관관계, 즉 5% 이상의 설명력을 갖는 변수는 페이지 수, 청구항 수, 참고문헌 평균 피인용횟수, 기술분야 특허증감율, 서지결합도, 동시인용도 및 문헌간유사도 등 7개로 나타났다. 또한 이들 변수에 대한 분산분석 결과 7개 변수 모두 전반적으로 대부분의 주제분야 간에 있어서 평균값의 차이가 있는 것으로 나타났다.

Abstract

Recently, the valuation of patented technology has been greatly emphasized, and patent citation has been accepted as a very useful index of this technology. In this study, we performed correlation analyses between the patent citation counts and 17 explanatory variables of morphological, technological, and conceptual factors with a test dataset of U.S. patents in five subject fields. Seven variables having 5% or more standardized variances(r2) with patent citation counts were identified; number of pages, number of claims, reference-average-citation rate, patent increase/decrease rate, strength of bibliographic coupling, co-citation counts and document similarity. The result of the ANOVA test shows that the mean values of these variables vary among most subject fields.

8
박재신(연세대학교) ; 정영미(연세대학교) 2010, Vol.27, No.3, pp.83-102 https://doi.org/10.3743/KOSIM.2010.27.3.083
초록보기
초록

본 연구에서는 지구적 환경문제의 해결 방식으로서 환경과학 분야의 학술활동과 같은 학문적 접근 방식과 환경 NGO 중심의 환경운동과 같은 실천적 접근 방식을 두 가지 주요 흐름이라 보고, 이들 각각의 특성을 계량정보학적 분석을 통해 파악하고 비교하였다. 지난 10년 간 환경과학 분야에서 인용된 저널의 주제범주 간 동시인용 관계를 분석함으로써 이 분야의 지식 구조를 파악하였고, 환경 NGO의 웹 사이트에서 수집된 외부링크 데이터를 이용하여 이들의 관심 분야를 확인하였다. 또한 저널 논문과 NGO 뉴스에서 추출된 핵심어를 이용한 동시출현단어 분석을 통해 하위 주제를 파악하여 이들 간의 주제적 유사성과 상이성을 구체화하였다.

Abstract

This study aims to understand and compare the characteristics of two major approaches to solving global environmental problems-an academic approach including scholarly activities of environmental sciences and a practical approach of environmental movements led by NGOs-by employing informetric analysis methods. Knowledge structure of environmental sciences is depicted through co-citation networks of subject categories assigned to the cited journals in the discipline of environmental sciences for the 10-year period from 2000 to 2009. Furthermore, major interests of environmental NGOs are identified on the basis of external link data collected from web sites of the NGOs. Co-word analyses are also performed using the texts of journal papers in environmental sciences as well as news articles provided by NGO sites. Through the analyses, dominant subject areas of environmental sciences and environmental movements are identified demonstrating similarities and differences between the two approaches.

9
Hae-Young Kim(Yonsei University) ; 정영미(연세대학교) ; Ji-Hye Lee(Yonsei University) 2008, Vol.25, No.2, pp.143-155 https://doi.org/10.3743/KOSIM.2008.25.2.143
초록보기
초록

Abstract

Authoritative as well as objective information on ranking or dominant research areas of academic departments/schools in a certain discipline is essential for the graduate school applicants. In this study, we performed an informetric analysis to identify dominant research areas in the top 10 U.S. LIS schools. We used two different datasets of research productivity and research interests of the LIS faculty. The correspondence analysis method was employed to graphically display the association between research areas and the LIS schools. We found that the research productivity data collected from SSCI database generated a very informative map presenting which research areas were dominant in which LIS schools. We also found that for the two most productive subject areas in LIS over the past 10-year period, the proportion of research articles in information retrieval decreased to a great extent in the recent 5-year period, whereas that of information seeking behavior showed an almost same degree of increase.

초록보기
초록

이 논문에서는 학술지 인용 데이터와 웹 링크 데이터를 이용하여 8개 과학기술 분야의 학제적 구조를 파악하고 각 학문분야 간 학제성을 비교하였다. 분석 대상이 되는 학술지와 웹 페이지의 주제적 성격을 파악하기 위해 기존의 과학기술 분류체계를 재구성하여 이용하였다. 이 연구에서 학제성은 여러 학문분야 간 학제적 연결의 측면에서 파악하였으며, 학제성의 정도는 연관 학문분야의 수로 측정한 학제적 다양성과 자기인용률에 의해 평가하였다. 분석 결과 학술지 인용 분석에서는 밝혀내지 못한 새로운 학제적 연결을 웹 링크 분석에 의해 파악하였으며, 이를 통해 웹 링크 분석이 학제성을 연구하는 수단으로서 유용함을 알 수 있었다. 또한 인용 분석과 링크 분석에서 모두 자연과학 분야에 비해 공학 분야의 학제성이 대체로 더 높게 나타났다.

Abstract

This study identifies the interdisciplinary structures of 8 scientific disciplines in science and technology using the data from journal citations and web links, and compares the interdisciplinarity among these scientific disciplines. The interdisciplinarity refers to interdisciplinary connections among scientific fields and the degree of interdisciplinarity is measured by the number of associated fields and the rate of self-citation. A re-arranged classification scheme for science and technology was adopted to identify subject categories of journals and web pages. Web link analysis revealed a few additional interdisciplinary connections that were not identified by the journal citation analysis, thus demonstrating that it is useful means of investigating the interdisciplinarity of scientific fields. Besides, in most of the cases the interdisciplinarity of the engineering fields were found greater than that of the fields in natural sciences in both analyses.

정보관리학회지