바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 정보추출, 검색결과: 8
1
이용구(계명대학교) ; 정영미(연세대학교) 2007, Vol.24, No.1, pp.321-342 https://doi.org/10.3743/KOSIM.2007.24.1.321
초록보기
초록

이 연구에서는 수작업 태깅없이 기계가독형 사전을 이용하여 자동으로 의미를 태깅한 후 학습데이터로 구축한 분류기에 대해 의미를 분류하는 단어 중의성 해소 모형을 제시하였다. 자동 태깅을 위해 사전 추출 정보 기반 방법과 연어 공기 기반 방법을 적용하였다. 실험 결과, 자동 태깅에서는 복수 자질 축소를 적용한 사전 추출 정보 기반 방법이 70.06%의 태깅 정확도를 보여 연어 공기 기반 방법의 56.33% 보다 24.37% 향상된 성능을 가져왔다. 사전 추출 정보 기반 방법을 이용한 분류기의 분류 정학도는 68.11%로서 연어 공기 기반 방법의 62.09% 보다 9.7% 향상된 성능을 보였다. 또한 두 자동 태깅 방법을 결합한 결과 태깅 정확도는 76.09%, 분류 정확도는 76.16%로 나타났다.

Abstract

This study presents an effective word sense disambiguation model that does not require manual sense tagging process by automatically tagging the right sense using a machine-readable dictionary, and attempts to classify the senses of those words using a classifier built from the training data. The automatic tagging technique was implemnted by the dictionary information-based and the collocation co-occurrence-based methods. The dictionary information-based method that applied multiple feature selection showed the tagging accuracy of 70.06%, and the collocation co-occurrence-based method 56.33%. The sense classifier using the dictionary information-based tagging method showed the classification accuracy of 68.11%, and that using the collocation co-occurrence-based tagging method 62.09%. The combined tagging method applying data fusion technique achieved a greater performance of 76.09% resulting in the classification accuracy of 76.16%.

초록보기
초록

도서관 서비스 품질평가 도구인LibQUAL+TM에 대한 많은 연구논문이 발표되었으나, LibQUAL+TM 요인과 도서관 서비스 이용의도 사의의 관계를 연구한 사례는 매우 드물다. 본 논문은 Icek Ajzen의 계획적 행위이론을 적용하여 도서관 서비스 이용의도에 영향을 미치는 요인을 추출하고자 하였다. 이러한 요인을 추출하기 위하여 미국 대학생을 대상으로 웹 설문을 실시하였고, 요인분석 및 다중회귀분석을 통하여 수집된 데이터를 분석하였다. 분석결과, 도서관 서비스 이용의도는 도서관에서 제공되는 서비스 품질에 대한 이용자의 태도와 관련이 있었다. 통계분석결과 유의미하게 나타난 태도요인은 이용자가 지각한 (1) 정보원 및 시스템 이용시의 주도성, (2) 서비스 제공 의향 정도, (3) 제공되는 정보의 포괄성이었다. LibQUAL+TM 요인간의 상대적 중요도를 측정하였다. 반면에, 이용의도에 유의미한 영향을 미치지 않는 요인으로는 정보접근의 적시성과 물리적인 공간으로서의 도서관을 지각하는 부분이었다. 본 연구의 의의는 도서관 서비스 품질평가에 대한 연구의 영역을 확장시키고 이용의도를 고려한 새로운 평가 체계를 제시한 점이다.

Abstract

While LibQUAL+TM is in the headlines of many articles focusing on library service evaluations, little research has been conducted to study the relationship between the LibQUAL+TM factors and the adoption of library services. It remains unclear whether the factors of LibQUAL+TM have any effect on its adoption. A framework was adapted from Icek Ajzens theory of planned behavior and proposed to extract factors affecting the adoption of library services. The factors were examined via data collection from a Web-based questionnaire survey with college students in the United States. Factor analyses and multiple regression analysis were conducted. Findings show that the intention to use library services is explained by attitude toward library service quality. The attitudinal factors that are significant are (1) perceived personal control, (2) perceived affect of service, and (3) perceived comprehensiveness of information. The relative importance among the factors is also represented by the numbered sequence. However, perceived timeliness of information access and the perception of library as place do not have a significant effect on the intention. This study extends the research on library service evaluation, and provides a new evaluation framework by applying adoption behaviors.

3
박상규(중앙대학교) ; 김성희(중앙대학교) ; 이찬규(중앙대학교) ; 이준호(숭실대학교) ; 윤경현(중앙대학교) 2007, Vol.24, No.4, pp.255-265 https://doi.org/10.3743/KOSIM.2007.24.4.255
초록보기
초록

본 연구에서는 12개의 표본 비디오 집단과 14명의 피조사자들을 이용하여 영상 초록 및 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정해 보았다. 측정 결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났으며 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다. 둘째, 영상 초록의 색인어 및 요약문 정확도가 전체 클립의 정확도 보다 떨어지지만 절반치에 근접한 것으로 나타나 영상 초록이 비디오 의미 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도(0.45)가 요약문 정확도(0.40) 보다 더 높게 나타나 영상 초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 실험 결과에 기초하여 영상 초록이 색인어 또는 요약문 추출 작업에 활용될 수 있을 뿐만 아니라, 디지털 도서관 환경에서 텍스트 초록과 같은 다른 메타데이터 요소들과 함께 사용된다면 이용자의 적합성 판정을 좀 더 용이하게 할 것이며, 더 나아가 영상 질의의 매칭 자료로도 이용될 수 있음을 제안하였다. 끝으로 영상 초록의 품질을 높이기 위한 키프레임 추출 알고리즘 및 키프레임 배열 모형 설계 등 후속 연구에 대해서 제언하였다.

Abstract

This study is designed to assess whether storyboard surrogates are useful enough to be utilized for indexing sources as well as for metadata elements using 12 sample videos and 14 participants. Study shows that first, the match rates of index terms and summaries are significantly different according to video types, which means storyboard surrogates are especially useful for the type of videos of conveying their meanings mainly through images. Second, participants could assign subject keywords and summaries to digital video, sacrificing a little loss of full video clips' match rates. Moreover, the match rate of index terms (0.45) is higher than that of summaries (0.40). This means storyboard surrogates could be more useful for indexing videos rather than summarizing them. The study suggests that 1)storyboard surrogates can be used as sources for indexing and abstracting digital videos; 2) using storyboard surrogates along with other metadata elements (e.g., text-based abstracts) can be more useful for users' relevance judgement; and 3)storyboard surrogates can be utilized as match sources of image-based queries. Finally, in order to improve storyboard surrogates quality, this study proposes future studies: constructing key frame extraction algorithms and designing key frame arrangement models.

초록보기
초록

본 연구에서는 12개의 표본 비디오 집단과 14명의 피조사자들을 이용하여 영상 초록 및 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정해 보았다. 측정 결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났으며 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다. 둘째, 영상 초록의 색인어 및 요약문 정확도가 전체 클립의 정확도 보다 떨어지지만 절반치에 근접한 것으로 나타나 영상 초록이 비디오 의미 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도(0.45)가 요약문 정확도(0.40) 보다 더 높게 나타나 영상 초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 실험 결과에 기초하여 영상 초록이 색인어 또는 요약문 추출 작업에 활용될 수 있을 뿐만 아니라, 디지털 도서관 환경에서 텍스트 초록과 같은 다른 메타데이터 요소들과 함께 사용된다면 이용자의 적합성 판정을 좀 더 용이하게 할 것이며, 더 나아가 영상 질의의 매칭 자료로도 이용될 수 있음을 제안하였다. 끝으로 영상 초록의 품질을 높이기 위한 키프레임 추출 알고리즘 및 키프레임 배열 모형 설계 등 후속 연구에 대해서 제언하였다.

Abstract

This study is designed to assess whether storyboard surrogates are useful enough to be utilized for indexing sources as well as for metadata elements using 12 sample videos and 14 participants. Study shows that first, the match rates of index terms and summaries are significantly different according to video types, which means storyboard surrogates are especially useful for the type of videos of conveying their meanings mainly through images. Second, participants could assign subject keywords and summaries to digital video, sacrificing a little loss of full video clips' match rates. Moreover, the match rate of index terms (0.45) is higher than that of summaries (0.40). This means storyboard surrogates could be more useful for indexing videos rather than summarizing them. The study suggests that 1)storyboard surrogates can be used as sources for indexing and abstracting digital videos; 2) using storyboard surrogates along with other metadata elements (e.g., text-based abstracts) can be more useful for users' relevance judgement; and 3)storyboard surrogates can be utilized as match sources of image-based queries. Finally, in order to improve storyboard surrogates quality, this study proposes future studies: constructing key frame extraction algorithms and designing key frame arrangement models.

초록보기
초록

오늘날 정보환경은 정보이용자로 하여금 도서관 장서뿐만 아니라 다양한 디지털 정보자원으로의 접근을 가능하게 하였다. 변화하는 환경에서 이용률이 증가하는 디지털 정보자원으로 웹사이트, 각종 데이터, 홈페이지 등을 들 수 있다. 이 연구는 ISI Web of Knowledge의 Essential Science Indicators에서 제공하는 인용정보를 이용하여 임상의학 분야의 피인용 횟수가 높은 저자들과 이 저자들의 논문을 인용한 저자들의 홈페이지에 수록된 연구 성과물을 추출한 후, 의학대학 디지털 도서관 및 학술포털과 비교 분석하였다. 10,000여명의 저자 중 연구 성과물 정보를 제시하는 146명의 홈페이지 연구정보를 분석하였는데, 홈페이지에서만 제공하는 연구정보는 학술지 논문, 단행본, 학술대회 발표논문, 강의노트를 포함하였다. 이 중 학술지 논문은 약 15%, 단행본은 약 32%, 학술대회 발표논문은 약 48%, 강의노트는 100% 모두 홈페이지를 통해서만 접근할 수 있는 연구 성과물로 분석되었다. 실제로 의학대학 도서관과 학술포털에서 제공하는 연구정보가 대부분 일치했던 점을 고려할 때, 저명한 연구자들의 홈페이지를 통한 연구정보의 확충이 디지털 도서관 장서개발의 양적, 질적 향상을 위한 방안이 될 수 있다.

Abstract

Nowadays the information environment enables users to access the traditional library collection as well as various digital information resources. In this rapidly changing environment, the use of digital information resources such as web sites, data, and homepages has increased. In this research, highly-cited authors' research outcomes as well as the research outcomes of the people, who cited the highly-cited authors' works, were extracted then compared with information stored in the medical colleges' digital libraries and the academic information portals in the clinical medicine area by using the citation information provided by Essential Science Indicators from ISI Web of Knowledge. Out of 10,000 authors, 146 people's homepages, which present research outcomes, were analyzed. The research outcomes listed in the homepages included journal papers, monographs, conference proceedings, and lecture notes. About 15% of the journal papers, 32% of the monographs, 48% of the conference proceedings, and 100% of lecture notes were accessible only through the homepages. The research outcomes accessible from the homepages were almost analogous to the ones available through the medical college's digital libraries and the academic information portals. Therefore, the digital library collection will be improved and expanded quantitatively and qualitatively by collecting and using the information in the homepages of the prestigious researchers.

초록보기
초록

본 연구는 특정 영역 소규모 업무(Small Unit Operation) 수행을 지원하는 태스크 온톨로지 모형 개발에 관한 것이다. 기존 정보관리에서 효과적으로 진화된 지식시스템을 구축하기 위해서는 사전 작업인 온톨로지 개발이 필요하다. 대표적 SUO의 하나인 시민단체를 대상으로 선정하여 시민단체의 조직특성, 기대역할과 부진한 기능, 그리고 업무과정에서 발생되는 정보관리나 활용실태 등을 조사하였다. 그러나 온톨로지 구현의 기초 자료로 삼을 수 있는 시민운동이나 단체들에 대한 분류체계나 시소러스 등이 없는 상황에서 단체 특성 및 관련 업무 그리고 출판물 등의 생산정보나 사이트구성, 활동주제 및 내역 등의 기존 데이터만으로는 지식획득은 부족하다. 따라서 본 연구에서 채택된 모형 개발 방법론은 해당 분야 실무자 및 전문가와의 심도 높은 면담과 관찰이며 이를 통해 현장실무의 업무처리 과정에서 발생하는 지식을 추출하고 정보의 흐름 구조를 파악하여 그를 기반으로 시민단체의 역할 수행을 지원하는 태스크 온톨로지 모형을 구현하였다.

Abstract

This paper presents a model of Task-Ontology for small unit operations(SUO) such as non-government organizations. Despite the rapid development and extension of NGOs in domestic area, most has insufficient structural domain resources in existence and underestimates the importance of information management. To improve the citizen's participation and to activate the conjoint actions among the NGOs, which are critical to its social role-playing in global society, the modeling Task-Ontology is ultimately intended to implement the knowledge management system of NGO. In the perspective of ontology competency, not only the analysis of resources in vary, but also in-depth interviews with the NGO's practicing personnels and subject experts, and also the intensive observations of task-processing are required for the knowledge acquisition.

초록보기
초록

본 논문은 C대학도서관의 학술정보시스템(LAS)에 구축되어 있는 장서와 대출기록 및 고객관련 데이터를 수집하여 이를 분석하고 그 결과를 고객관계관리(CRM)에 적용할 수 있는 방안을 제시하였다. 수집된 자료는 C 대학도서관에서 소장하고 있는 대출이 가능한 단행본 총 269,387책의서지데이타와고객 12,281명의 데이터, 이용자 대출기록 39,269건이었다. 대출기록 분석 데이터에서 관계변수로 이용자 신분, 대출빈도, 대출책수와 대출횟수, 출판년도를 추출하여 데이터 마이닝 기법으로 분석하고, 상관계수로 검증하였다.

Abstract

The books and circulation-related data in the Library Automation System(LAS) of C-academic library were collected and analyzed, and also the method which may be applied to the Customer Relationship Management (CRM) based on the results was suggested in this paper. Collected data were 269,387 bibliographic data of books, 12,281 patron data, and 39,269 circulation records. User identity, circulation frequencies, total number of circulated books, and publication year as relation factor from the analyzed data of circulation records were extracted. They were also analyzed, and verified by correlation coefficient.

8
민기은(진성고등학교) ; 정영미(연세대학교) 2007, Vol.24, No.4, pp.73-96 https://doi.org/10.3743/KOSIM.2007.24.4.073
초록보기
초록

이 연구에서는 웹과 학술지를 통한 학술 커뮤니케이션의 특성을 각각 분석하고, 웹상에서의 학술 커뮤니케이션 패턴이 학문 분야에 따라 어떤 차이를 보이는지 비교하였다. 경제학과 컴퓨터공학정보시스템 분야에서 키워드를 추출하여 이와 관련된 학술적 웹페이지와 학술지 논문을 수집하였고, 이를 학술적 웹페이지의 특성, 웹페이지 동시링크와 학술지 논문 동시인용 데이터의 다차원척도(MDS) 분석, 시간의 흐름에 따른 학술 활동의 변화 등 세 가지 측면에서 분석하였다. 분석 결과, 웹과 학술지를 통한 학술 커뮤니케이션에는 공통점과 차이점이 나타났으며, 이런 현상은 두 학문 분야에서 모두 확인되었다. 그리고 웹을 통한 학술 커뮤니케이션의 경우 같은 학문 분야 내의 세부 주제에 따라서 고유한 특성이 나타나는 것을 볼 수 있었다.

Abstract

In this study, the characteristics of scholarly communication through the Web and scientific journals are explored, and scholarly communication patterns in two scientific disciplines are compared to reveal the difference. Economics and Computer Science-Information Systems are selected as two disciplines to be analyzed. In the data collection process, 10 keywords are extracted from a database for each subject field, and scholarly Web pages and journal articles related to these keywords are collected and analyzed. Our investigation includes the characteristics of scholarly Web pages, Multi-Dimensional Scaling (MDS) analysis of co-linked Web pages as well as co-cited journal articles, and changes in the scholarly communication activities occurring on the Web and in scientific journals respectively over time. We found certain differences as well as common features in scholarly communication patterns between the Web and scientific journals for both fields of Economics and Computer Science. We also found that scholarly communication occurring on the Web displays unique features for each subtopic within the same field of study.

정보관리학회지