바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 정영미, 검색결과: 33
초록보기
초록

이 연구에서는 연구자의 연구 이력을 분석하기 위해서 White(2000)가 제안한 인용 정체성과 Hellsten 등(2007)이 제안한 자기 인용 네트워크의 두 가지 최신 기법을 비교해보았다. 국내 대표적인 정보학자인 정영미의 연구 성과물을 대상으로 실험적인 분석을 수행해본 결과 두 기법에서 구분한 연구 시기가 동일하게 나뉘었으며 주요 연구 주제도 유사하게 파악되었다. 그러나 인용 정체성 지도에서는 주제영역별로 영향받은 주요 저자를 파악할 수 있는 반면에 자기 인용 네트워크에서는 시기별 핵심 문헌과 선도 문헌이 식별되었다. 따라서 이 두 가지 기법을 상호보완적으로 사용할 때 연구자의 연구 이력에 대해서 풍부한 정보를 획득할 수 있다는 결론을 얻었다.

Abstract

This paper compares two recent methods for exploring a scientist's research history: citation identity and self-citation network. The former is proposed by White(2000), while the latter is suggested by Hellsten et al.(2007). An experimental citation analysis was carried out on the research output of Young Mee Chung, a renouned Korean information scientist. The result shows that the two methods divided the research period into two sub-periods in the same way. They also identified the major research themes very similarly. In the analysis of each method's performance in depth, the two methods revealed different functions to understand a researcher's history. Citation identity was useful to identify authors who have affected Chung's research in terms of research topics. whereas, self-citation network was successful to identify the core papers and leading papers of the research sub-periods. This study indicates the combination of two methods can provide rich information on a scientist's research history.

초록보기
초록

본 연구는 인쇄형 해외학술지 원문제공서비스(DDS)의 경제성을 분석하기 위해 이용자 기반의 경제적 가치 평가 방법론 및 모델을 개발하고자 하였다. 본 연구를 위해 K기관의 구독중인 해외학술지 원문제공서비스의 데이터 중 일부가 분석을 위해 사용되었고 K기관 원문제공서비스 이용자를 대상으로 웹 서베이를 실시하였다. 해외학술지 원문제공서비스의 경제적 가치는 사용가치, 비사용가치, 그리고 기대가치가 고려되었고 사용가치 산출을 위해서는 소득접근법과 시장접근법을 제안하였다. 이용자에 의한 가치 산출을 위해, 본 연구는 조건부가치평가법을 적용하였고 이를 위해 가상 시나리오를 설정하였다.

Abstract

This study is to develope a user-based economic valuation methodology and model for the economic analysis on the DDS of foreign journals. For this study, the sampling data on the annual subscribed journals by K institution was used and the online questionnaire was used to collect data. There are three aspects of the economic value of DDS journals was classified as use value, non-use value, and expectancy value. We suggested the income and market approach to measure its economic use value. To estimate the its value by individual users, this study applied a contingent valuation method and designed the imaginary scenarios.

초록보기
초록

XML 웹 문서 포맷은 문헌 내에 내용뿐만 아니라 의미 있는 논리적인 구조 정보를 포함할 수 있어, 검색에서 문서의 내용 뿐만 아니라 구조로 접근하는 것을 제공한다. 그래서 본 연구의 목적은 XML 검색에 있어 내용 검색에 추가적인 요소로 사용된 구조적인 제한이 얼마나 유용한지를 실험하기 위해 내용만으로 검색한 결과와 내용과 구조적인 제한을 가지고 검색한 결과간의 성능을 비교하였다. 이 실험은 자체 개발된 단말노드 언어모델기반의 XML 검색시스템을 사용하였고 INEX 2005의 ad-hoc트랙에 참여하여 모든 실험방법과 INEX 2005의 실험 문헌 집단을 사용하였다.

Abstract

XML documents format on the Web provides a mechanism to impose their content and logical structure information. Therefore, an XML processor provides access to their content and strucure. The purpose of this study is to investigate the usefulness of structural hints in the leaf node language model-based XML document retrieval. In order to this purpose, this experiment tested the performances of the leaf node language model-based XML retrieval system to compare the queries for a topic containing only content-only constraints and both content constrains and structure constraints. A newly designed and implemented leaf node language model-based XML retrieval system was used. And we participated in the ad-hoc track of INEX 2005 and conducted an experiment using a large-scale XML test collection provided by INEX 2005.

초록보기
초록

본 연구의 목적은 이용자의 인지적 특성 중 하나인 성격 유형과 OPAC 탐색 과정에서 나타나는 이용자의 정보 탐색 성향 및 만족도의 관계를 파악하고자 하였다. 본 연구에서는 실험대상자들을 대상으로 KEPTI 에니어그램 검사를 통해 성격 유형을 파악하였고, 데이터는 실험-전 질문지, 태스크A 질문지, 태스크B 질문지, 그리고 실험-후 질문지로 수집되었다. 분석결과, 에니어그램의 힘의 중심에 의한 집단 간에는 탐색의 용이성, 탐색시간, 탐색시간의 충분성, 탐색결과의 유용성, 탐색과정의 쉬움에서 통계적으로 유의한 차이가 나타났고 호니비언 집단 간에는 질의에 대한 친숙성과 흥미에서 통계적으로 유의한 차이가 나타났다.

Abstract

This study examined the relation between personality types and users' searching trait and satisfaction when interacting with OPAC system. In this study, personality type was measured by the KEPTI Enneagram tools. Data was collected through four questionnaires, pre-test, TaskA, TaskB, and post-test survey. The results indicated that there was a statistically significant difference in perceptions on the expected ease of search, completion time, adequacy of search time, usefulness of search results, and performed ease of search within the Three Triads of Enneagram. Also a statistically significant difference was found on familiarity and interest in the selected queries within the Hornivian group.

초록보기
초록

이 연구에서는 한국형 포털에 적합한 커뮤니티 기반 개인화 검색 서비스 모형을 제안하였다. 개인화 검색 서비스 모형은 이용자의 관심 주제를 파악하는 과정과 이를 반영한 검색 결과 재순위화 및 관련 주제 카테고리와 질의어 추천 과정으로 구성된다. 개인화 검색 모형의 유용성을 검증하기 위한 실험에서는 포털 사이트 다음에서 12일간 수집한 이용자 로그 데이터를 사용하였다. 실험 결과 개별 이용자의 주제 카테고리 선정에 사용한 카페 활동성 분석과 신지식 활동성 분석 데이터는 매우 유용한 것으로 나타났으며, 개인화 검색 결과와 추천 서비스에 대한 만족도도 비교적 높게 나타났다.

Abstract

This study proposes an expanded model of personalized search service based on community activities on a Korean Web portal. The model is composed of defining subject categories of users, providing personalized search results, and recommending additional subject categories and queries. Several experiments were performed to verify the feasibility and effectiveness of the proposed model. It was found that users’ activities on community services provide valuable data for identifying their interests, and the personalized search service increases users’ satisfaction.

6
유재복(한국원자력연구원) ; 정영미(연세대학교) 2010, Vol.27, No.4, pp.239-258 https://doi.org/10.3743/KOSIM.2010.27.4.239
초록보기
초록

이 연구에서는 특허의 인용에 영향을 미치는 주요 변수들을 토대로 특허의 피인용횟수를 예측하기 위한 모형을 제시하였다. 이를 위해 미국특허를 대상으로 5개 주제분야에 걸쳐 특허의 피인용횟수와 일정 수준 이상의 상관관계, 즉 5% 이상의 설명력을 갖는 것으로 밝혀진 페이지 수, 청구항 수, 참고문헌 평균 피인용횟수, 서지결합도, 문헌간유사도 등 5개 변수들을 토대로 다중회귀분석을 실시하였다. 연구결과에 따르면, 제시된 5개 주제분야의 특허인용 예측모형의 설명력은 주제분야에 따라 58.3%~89.6%로 나타났으며, 예측변수로 사용된 5개의 독립변수 중 특허 피인용횟수에 가장 영향력이 높은 변수는 ‘문헌간유사도’로 나타났다. 또한 이 연구에서 추정된 주제분야별 예측모형을 토대로 산출한 특허 피인용횟수에 대한 예측값과 실제값을 비교한 결과 이들 예측모형은 5개 주제분야에서 모두 적합한 것으로 나타났다.

Abstract

The purpose of this study is to develop a prediction model of patent citation counts based on major factors which affect patent citation. To this end, we performed multiple regression analysis between the patent citation counts and five explanatory variables such as the number of pages, the number of claims, the reference-average-citation rate, the strength of bibliographic coupling, and the document similarity proved as having 5% or more standardized variances(r2) with patent citation counts, with a test dataset of U.S. patents in five subject fields. As a result, our prediction models showed 58.3% to 89.6% predictability depending on subject fields and revealed the document similarity has the highest impact on citation counts among the five predictive variables in all the subject fields. The result of comparison between the predicted citation counts and the actual ones confirmed the usefulness of the citation prediction models built for each subject field.

7
김수연(연세대학교) ; 정영미(연세대학교) 2006, Vol.23, No.3, pp.147-165 https://doi.org/10.3743/KOSIM.2006.23.3.147
초록보기
초록

이 연구에서는 전체 문헌집단으로부터 초기 질의어에 대한 연관용어 선정 시 사용할 수 있는 최적의 기법을 찾기 위해 연관규칙 마이닝과 용어 클러스터링 기법을 이용하여 연관용어 선정 실험을 수행하였다. 연관규칙 마이닝 기법에서는 Apriori 알고리즘을 사용하였으며, 용어 클러스터링 기법에서는 연관성 척도로 GSS 계수, 자카드계수, 코사인계수, 소칼 & 스니스 5, 상호정보량을 사용하였다. 성능평가 척도로는 연관용어 정확률과 연관용어 일치율을 사용하였으며, 실험결과 Apriori 알고리즘과 GSS 계수가 가장 좋은 성능을 나타냈다.

Abstract

In this study, experiments for selection of association terms were conducted in order to discover the optimum method in selecting additional terms that are related to an initial query term. Association term sets were generated by using support, confidence, and lift measures of the Apriori algorithm, and also by using the similarity measures such as GSS, Jaccard coefficient, cosine coefficient, and Sokal & Sneath 5, and mutual information. In performance evaluation of term selection methods, precision of association terms as well as the overlap ratio of association terms and relevant documents' indexing terms were used. It was found that Apriori algorithm and GSS achieved the highest level of performances.

8
최상희(대구가톨릭대학교) ; 정영미(연세대학교) 2004, Vol.21, No.3, pp.289-303 https://doi.org/10.3743/KOSIM.2004.21.3.289
초록보기
초록

This experimental study proposes a multi-document summarization method that produces optimal summaries in which users can find answers to their queries. In order to identify the most effective method for this purpose, the performance of the three summarization methods were compared. The investigated methods are sentence clustering, passage extraction through spreading activation, and clustering-passage extraction hybrid methods. The effectiveness of each summarizing method was evaluated by two criteria used to measure the accuracy and the redundancy of a summary. The passage extraction method using the sequential bnb search algorithm proved to be most effective in summarizing multiple documents with regard to summarization precision. This study proposes the passage extraction method as the optimal multi-document summarization method. 攀*** 본 연구는 연세대학교 대학원 박사학위논문의 일부를 요약한 것임.*** 연세대학교 문헌정보학과 시간강사(shchoi@lis.yonsei.ac.kr)****연세대학교 문헌정보학과 교수(ymchung@yonsei.ac.kr) 논문접수일자 : 2004년 8월 27일 게재확정일자 : 2004년 9월 13일攀攀

Abstract

9
민기은(진성고등학교) ; 정영미(연세대학교) 2007, Vol.24, No.4, pp.73-96 https://doi.org/10.3743/KOSIM.2007.24.4.073
초록보기
초록

이 연구에서는 웹과 학술지를 통한 학술 커뮤니케이션의 특성을 각각 분석하고, 웹상에서의 학술 커뮤니케이션 패턴이 학문 분야에 따라 어떤 차이를 보이는지 비교하였다. 경제학과 컴퓨터공학정보시스템 분야에서 키워드를 추출하여 이와 관련된 학술적 웹페이지와 학술지 논문을 수집하였고, 이를 학술적 웹페이지의 특성, 웹페이지 동시링크와 학술지 논문 동시인용 데이터의 다차원척도(MDS) 분석, 시간의 흐름에 따른 학술 활동의 변화 등 세 가지 측면에서 분석하였다. 분석 결과, 웹과 학술지를 통한 학술 커뮤니케이션에는 공통점과 차이점이 나타났으며, 이런 현상은 두 학문 분야에서 모두 확인되었다. 그리고 웹을 통한 학술 커뮤니케이션의 경우 같은 학문 분야 내의 세부 주제에 따라서 고유한 특성이 나타나는 것을 볼 수 있었다.

Abstract

In this study, the characteristics of scholarly communication through the Web and scientific journals are explored, and scholarly communication patterns in two scientific disciplines are compared to reveal the difference. Economics and Computer Science-Information Systems are selected as two disciplines to be analyzed. In the data collection process, 10 keywords are extracted from a database for each subject field, and scholarly Web pages and journal articles related to these keywords are collected and analyzed. Our investigation includes the characteristics of scholarly Web pages, Multi-Dimensional Scaling (MDS) analysis of co-linked Web pages as well as co-cited journal articles, and changes in the scholarly communication activities occurring on the Web and in scientific journals respectively over time. We found certain differences as well as common features in scholarly communication patterns between the Web and scientific journals for both fields of Economics and Computer Science. We also found that scholarly communication occurring on the Web displays unique features for each subtopic within the same field of study.

10
이지숙(NHN㈜) ; 정영미(연세대학교) 2007, Vol.24, No.3, pp.201-218 https://doi.org/10.3743/KOSIM.2007.24.3.201
초록보기
초록

이 연구에서는 TREC이 제시한 토픽 검색의 정의에 따라 질의에 적합한 웹 사이트를 검색하는 효과적인 토픽 검색 알고리즘을 제안하고 실험을 통해 그 성능을 평가하였다. 이 연구의 토픽 검색 알고리즘은 먼저 질의에 대한 웹 페이지 검색 결과로부터 적합한 웹 사이트를 선정한 다음, 선정된 사이트의 구조를 이용하여 질의에 대한 적합성 점수를 산출한다. TREC의 .GOV 실험 문헌 집단과 TREC-2004 실험의 질의 및 적합문헌 리스트를 이용한 검색 실험 결과 이 토픽 검색 알고리즘은 상위 10위 안에 최소 2개 이상의 적합 사이트를 검색하여 비교적 높은 수준의 성능을 보였다. 또한 TREC-2004의 적합문헌 리스트 분석을 통해 적합문헌 선정에 토픽 검색의 정의가 엄격하게 적용되지 않은 경우가 있음을 확인하고, 수정된 적합문헌 리스트를 이용하여 토픽 검색 성능을 재평가한 결과 이 연구에서 제안한 토픽 검색 알고리즘의 성능이 월등히 향상되었다.

Abstract

This study proposes a topic distillation algorithm that ranks the relevant sites selected from retrieved web pages, and evaluates the performance of the algorithm. The algorithm calculates the topic score of a site using its hierarchical structure. The TREC .GOV test collection and a set of TREC-2004 queries for topic distillation task are used for the experiment. The experimental results showed the algorithm returned at least 2 relevant sites in top ten retrieval results. We performed an in-depth analysis of the relevant sites list provided by TREC-2004 to find out that the definition of topic distillation was not strictly applied in selecting relevant sites. When we re-evaluated the retrieved sites/sub-sites using the revised list of relevant sites, the performance of the proposed algorithm was improved significantly.

정보관리학회지