바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 재현율, 검색결과: 19
1
양동민(전북대학교 기록관리학과) ; 최광훈(알엠소프트) ; 김지혜(전북대학교 기록관리학과 박사과정) ; 유남희(전북대학교 기록관리학과) 2023, Vol.40, No.4, pp.167-200 https://doi.org/10.3743/KOSIM.2023.40.4.167
초록보기
초록

국내 행정정보 데이터세트 기록관리에서는 행정정보 데이터세트를 이관할 때 이관규격으로 SIARD를 활용할 것을 권고하고 있다. 그러나 행정정보 데이터세트의 기록관리 단위, SIARD를 지원하는 도구의 기술적 한계, 공공기관의 현실적인 상황 등으로 인해 SIARD 적용이 적합하지 않은 경우가 다수 발생하고 있다. 본 연구에서는 SIARD 이외에 행정정보 데이터세트의 이관규격을 다양화하는 방안을 제안하고자 한다. 행정정보 데이터세트의 기록관리에서는 데이터세트와 연계된 사용자 인터페이스의 재현에 대한 필요성에 대한 논의는 지속되고 있지만 구체적으로 제시되고 있지 않다. 본 연구에서는 필수보존속성(Significant Properties) 관점에서 사용자 인터페이스도 함께 보존되어야 할 속성임을 확인하고, 사용자 인터페이스를 효과적으로 재현하는 방안을 제시하고, 실제 검증한 사례를 제공하고자 한다.

Abstract

For the record management of administrative information datasets in Korea, it is recommended to utilize SIARD as a transfer specification when transferring administrative information datasets. However, there are many cases where the application of SIARD is not suitable due to the record management unit of administrative information datasets, technical limitations of tools that support SIARD, and the realistic situation of public institutions. In this study, we propose a plan to diversify the transfer specifications of administrative information datasets other than SIARD. In the record management of administrative information datasets, the need to reproduce the user interface associated with the dataset has been discussed but not specifically presented. This study confirms that the user interface is a property to be preserved from the perspective of Significant Properties, proposes a method to effectively reproduce the user interface, and provides an example of actual verification.

2
함정은(연세대학교 문헌정보학과) ; 송민(연세대학교) 2015, Vol.32, No.2, pp.87-103 https://doi.org/10.3743/KOSIM.2015.32.2.087
초록보기
초록

많은 연구들 가운데 살펴볼 가치가 있는 대상을 찾아 제시해주는 문헌기반 발견의 접근법은 연구자들에게 매우 유용할 것이다. 문헌기반 발견 연구의 대표 이론인 Swanson의 ABC 모델은 기존에 검증되지 않은 개체들의 관계를 연구할 것을 제안해 준다. 본 연구는 Swanson의 ABC 모델에 인용 정보를 고려하여 유의한 관계에 있는 개체들을 더 효율적으로 찾아내고자 하였다. 수집 논문들의 참고문헌 목록에서 인용 정보를 확인하고 논문의 표제와 초록을 대상으로 텍스트 마이닝 기법으로 중요한 단어들을 추출하였다. Swanson의 연구들 중 어유와 레이노드 질병 및 증상의 관계를 재현하였으며 기존의 접근법으로 확인되는 개체들과 어떤 차이가 있는지 분석하였다.

Abstract

It is useful to find something valuable for researching through literature based discovery. Swanson’s ABC model, known as literature based discovery, suggests the relationship between entities undiscovered yet. This study tries to find the valid relationship between entities by referring to citation which connects articles on similar topic. We collect citation from references in articles, and extract important concepts in titles and abstracts through text mining techniques. We reproduce the relationship between fish oil and Raynaud’s disease, which is known as one of Swanson’s works, and compare the results with entities identified from traditional approach.

초록보기
초록

본 연구에서는 웹 환경에서의 학습 방법이 학생들의 정보검색 및 정보종합 능력에 어떠한 영향을 미치는가를 규명하고자 하였다. 본 연구의 결과는 다음과 같다. 첫째, 과제 중심형 학습 집단이 기법 중심형 학습 집단보다 정보검색 능력 중 정보성취도 검사점수가 높게 나타났으며, 통계적으로 유의미한 차이를 보였다 (t=3.59, p〈.05). 둘째, 네이버 국내 웹 1차 검색 (재현율 t=1.81, 정확율 t=.61)에서 과제 중심형 학습 집단과 기법 중심형 학습 집단간에 재현율과 정확율 모두 유의미한 차이가 없었다 (p〉.05). 그러나 2차 검색 (재현율 t=2.93, 정확율 t=2.45)과 3차 검색 (재현율 t=3.48, 정확율 t=2.50)에서는 과제중심형 학습 집단이 기법 중심형 학습 집단보다 재현율과 정확율이 높게 나타났으며, 통계적으로 유의미한 차이를 보였다 (p〈.05). 셋째, 과제 중심형 학습 집단과 기법 중심형 학습 집단은 정보종합 능력의 검사 점수 차이가 통계적으로 유의미하지 않았다 (t=1.95, p〉.05). 위 실험 결과를 종합해 보면, 인터넷에서 정보를 검색하는 경우에 과제에 대한 분석과 그에 알맞는 정보검색 기법을 적용하는 것이 중요하다. 기법에 의존하기보다는 과제를 분석하고 그에 알맞는 검색을 수행해야 한다. 또 정보 이용 교육이 정보검색 수준에서 머무르는 것이 아니라, 정보검색과 정보종합에 관한 교육이 정보 문제 해결의 맥락에서 이루어져야 할 것이다.

Abstract

The purpose of this study is to investigate the effects of learning methods on students'''' information retrieval and information synthesis capability in web. This is an experimental study comparing the two different learning methods as task-based learning and technic-based learning. The findings of this study were as follows: 1. The task-based learning was more effective than the technic-based learning in information achievements as information retrieval capability (t= 3.59, p〈.05). 2. In the 1st retrieval (recall ratio t=1.81 precision ratio t=.61) of Naver Korean Web Retrieval, there was no significant difference (p〉.05). In the 2nd retrieval (recall ratio t=2.93 precision ratio t=2.45) and 3rd retrieval (recall ratio t=3.48 precision ratio t= 2.50), the task-based group was more effective than the technic-based group (p〈.05). 3. There was no significant difference in students'''' information synthesis capability between the task-based learning and technic-based learning (t= 1.95, p〉.05). The findings of this study suggest that the task-based learning approach is more effective to improve students'''' information literacy, and that professionals should consider better instructional principles for the improvement of instructional quality.

4
박주현(건국초등학교 사서교사) ; 박성훈(행정안전부 국가정보자원관리원) ; 강봉숙(대구 다사고등학교) 2019, Vol.36, No.3, pp.81-107 https://doi.org/10.3743/KOSIM.2019.36.3.081
초록보기
초록

본 연구의 목적은 문헌정보학에서 미디어 교육을 적극적으로 수용해야 하는 당위성을 주장하고 문헌정보학의 관점에서 미디어의 개념과 분류기준에 따라 미디어의 종류를 제시하는 데 있다. 미디어의 개념에 따른 미디어 종류를 제시하기 위하여 미디어의 사전적 개념과 목록규칙 RDA에 제시된 미디어 분류를 고찰하였고, 고등학교 ‘언어와 매체’ 교과서와 한국언론학회의 초․중등학생용 교육 자료 및 문헌정보학 교과서를 분석하였다. 그리고 분석 결과를 바탕으로 미디어의 개념과 분류기준에 따른 미디어의 종류를 제시하였다. 본 연구에서는 미디어를 매체와 동일한 의미로 설정하고, 미디어가 의사소통의 수단으로 기능하며, 정보를 담고 있거나 전달하거나 재현하는 물리적인 물체를 통해 그 속에 담긴 정보를 인간의 감각기관을 통해 획득할 수 있는 것으로 정의하였으며, ‘미디어 속 정보’, ‘자료’, ‘재현 장치’를 미디어의 3가지의 논리적 구성요소로 설정하였다.

Abstract

The purpose of this study is to assert the justification for actively accepting media education in Library and Information Science and to suggest the media type according to the concept and classification criteria of the media from the perspective of Library and Information Science. In order to present the media type according to the concept of the media, the dictionary concept of the media was reviewed, the language and media for high school students in Korean language, the educational materials for elementary and secondary school students written by Media Education Committee of Korean Society for Journalism & Communication Studies, the educational textbooks for elementary and secondary school students in Library and Information Science, and media classification presented in the RDA of the cataloging rules were analyzed. In addition, the implications were derived based on the analysis results of the concepts and media type. The concept of media was set based on the analysis results and implications, and the media types were presented according to the concepts and classification criteria. In this study, the media was set up in the same meaning as the medium, and it was defined that the media function as a means of communication and that information contained in it can be obtained through the human sensory apparatus through physical objects that contain, transmit or reproduce information. The media was set up as three logical components of the media in this study: information in the media, materials, and representation devices.

초록보기
초록

웹 문서 검색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

Abstract

For the users of information retrieval systems, natural language query is the more ideal interface, compared with keyword and boolean expressions. This paper proposes a retrieval technique with expanded keyword from syntactically-analyzed structures of natural language query as user input. Through the steps combining or splitting the compound nouns based on syntactic tree traversal of the query, and expanding the other-formed or shorten-formed into multiple keyword, it can enhance the precision and correctness of the retrieval system.

6
정유경(연세대학교 근대한국학연구소 HK연구교수) ; 반재유(연세대학교 근대한국학연구소 HK연구교수) 2019, Vol.36, No.4, pp.7-19 https://doi.org/10.3743/KOSIM.2019.36.4.007
초록보기
초록

본 연구는 국한문 혼용 텍스트를 대상으로 한글 형태소 분석 기법과 한문 어조사를 반영한 색인어 추출기법을 제안하였다. 국한문 혼용체로 작성된 시사총보 논설을 대상으로 해당 시기에 사용된 고유명사 및 한자어 사전을 보완하였으며 한자어 불용어 리스트를 고려하여 색인어를 추출하였다. 본 연구에서 제안한 국한문 색인 시스템은 수작업 색인 결과를 기준으로, 중국어형태소 분석기에 비해 재현율과 정확률 측면에서 상대적으로 높은 성능을 보였으며, 어문법이 확립되지 않은 근현대 시기의 국한문 혼용체를 대상으로 한 첫 번째 색인어 추출기법을 제안하였다는 데에서 연구의 차별점이 있다.

Abstract

The aim of this study is to develop a technique for keyword extraction in Korean-Chinese text in the modern period. We considered a Korean morphological analyzer and a particle in classical Chinese as a possible method for this study. We applied our method to the journal “Sisachongbo,” employing proper-noun dictionaries and a list of stop words to extract index terms. The results show that our system achieved better performance than a Chinese morphological analyzer in terms of recall and precision. This study is the first research to develop an automatic indexing system in the traditional Korean-Chinese mixed text.

초록보기
초록

웹을 통해 제공되는 뉴스 페이지의 경우 필요한 정보 뿐 아니라 많은 불필요한 정보를 담고 있다. 이러한 불필요한 정보는 뉴스를 처리하는 시스템의 성능 저하와 비효율성을 가져온다. 이 연구에서는 웹 페이지로부터 뉴스 콘텐츠를 추출하기 위해 문장과 블록에 기반한 뉴스 기사 추출 방법을 제시하였다. 또한 이들을 결합하여 최적의 성능을 가져올 수 있는 방안을 모색하였다. 실험 결과, 웹 페이지에 대해 하이퍼링크 텍스트를 제거한 후 문장을 이용한 추출 방법을 적용하였을 때 효과적이었으며, 여기에 블록을 이용한 추출 방법과 결합하였을 때 더 좋은 결과를 가져왔다. 문장을 이용한 추출 방법은 추출 재현율을 높여주는 효과가 있는 것으로 나타났다.

Abstract

The news pages provided through the web contain unnecessary information. This causes low performance and inefficiency of the news processing system. In this study, news content extraction methods, which are based on sentence identification and block-level tags news web pages, was suggested. To obtain optimal performance, combinations of these methods were applied. The results showed good performance when using an extraction method which applied the sentence identification and eliminated hyperlink text from web pages. Moreover, this method showed better results when combined with the extraction method which used block-level. Extraction methods, which used sentence identification, were effective for raising the extraction recall ratio.

초록보기
초록

인터넷 정보검색과정에서 가장 보편적으로 사용되고 있는 검색방법은 키워드 검색이다. 키워드 검색은 정확률과 재현율의 관점에서 여러가지 단점을 지니고 있다. 이러한 키워드 검색의 단점을 보완해 줄 수 있는 장치로서 다수의 웹 포털에서 디렉토리 검색서비스를 제공하고 있다. 검색포털에서 제공하고 있는 디렉토리 서비스는 포털별로 상이한 분류체계를 사용하는 이유로 이용자에게 불편을 주고 있으며, 이러한 불편의 해소를 위해 디렉토리 서비스간 통합검색을 제공하는 중개 게이트웨이의 구축필요성이 제기되고 있다. 이에 따라 이 연구에서는 네이버, 야후, 엠파스 등 국내 주요 포털의 디렉토리 서비스를 대상으로 통합검색을 제공하는 중개 게이트웨이의 모형을 구축하고 그 성능을 평가하였다.

Abstract

The most widely used information searching method in the current internet environment is the keyword-based one, which has certain limitations in terms of precision and recall. Most major internet portals provide directory-based searching as a means to complement these limitations. However, that they adopt different classification schemes brings significant inconvenience to the users, and it consequently suggests a need to develop mapping gateway to provide cross-portal, or cross-directory information searching. In this context, this study attempts to develop a prototype system of intermediary gateway for integrated search, using the directory services of three major portals, Naver, Yahoo and Empas, and test its performance.

9
정영미(연세대학교) ; 김용광(연세대학교) 2008, Vol.25, No.4, pp.227-243 https://doi.org/10.3743/KOSIM.2008.25.4.227
초록보기
초록

이 연구에서는 사건중심 뉴스기사 요약문을 자동생성하기 위해 뉴스기사들을 SVM 분류기를 이용하여 사건 주제범주로 먼저 분류한 후, 각 주제범주 내에서 싱글패스 클러스터링 알고리즘을 통해 특정한 사건 관련 기사들을 탐지하는 기법을 제안하였다. 사건탐지 성능을 높이기 위해 고유명사에 가중치를 부여하고, 뉴스의 발생시간을 고려한 시간벌점함수를 제안하였다. 또한 일정 규모 이상의 클러스터를 분할하여 적절한 크기의 사건 클러스터를 생성하도록 수정된 싱글패스 알고리즘을 사용하였다. 이 연구에서 제안한 사건탐지 기법의 성능은 단순 싱글패스 클러스터링 기법에 비해 정확률, 재현율, F-척도에서 각각 37.1%, 0.1%, 35.4%의 성능 향상률을 보였고, 오보율과 탐지비용에서는 각각 74.7%, 11.3%의 향상률을 나타냈다.

Abstract

This study investigates an event detection method with the aim of generating an event-focused news summary from a set of news articles on a certain event using a multi-document summarization technique. The event detection method first classifies news articles into the event related topic categories by employing a SVM classifier and then creates event clusters containing news articles on an event by a modified single pass clustering algorithm. The clustering algorithm applies a time penalty function as well as cluster partitioning to enhance the clustering performance. It was found that the event detection method proposed in this study showed a satisfactory performance in terms of both the F-measure and the detection cost.

초록보기
초록

로치오 알고리즘에 기초한 통제어휘 자동색인 또는 텍스트 범주화에서 적용되어 온 여러 성능 요인들을 재검토하였고, 성능 향상을 위한 기본적인 방법을 찾아보았다. 또한, 동등한 조건에서 통제어휘 자동색인을 위한 로치오 알고리즘 기반 방법의 성능을 다른 학습기반 방법들의 성능과 비교하였다. 결과에 따르면, 통제어휘 자동색인을 위한 로치오 기반의 프로파일 방법은 구현의 용이성과 컴퓨터 처리시간 측면의 경제성이라는 기존의 장점을 그대로 유지하면서도, 다른 학습기반 방법들(SVM, VPT, NB)과 거의 동등하거나 더 나은 성능을 보여주었다. 특히, 색인전문가의 색인작업을 지원하는 반-자동 색인의 목적으로는 비교적 높은 수준의 재현율을 유지하면서 학습 데이터의 증가에 따라 정확률이 크게 향상되는 로치오 알고리즘을 이용한 방법을 우선적으로 고려할 수 있을 것이다.

Abstract

Several performance factors which have applied to the automatic indexing with controlled vocabulary and text categorization based on Rocchio algorithm were examined, and the simple method for performance improvement of them were tried. Also, results of the methods using Rocchio algorithm were compared with those of other learning based methods on the same conditions. As a result, keeping with the strong points which are implementational easiness and computational efficiency, the methods based Rocchio algorithms showed equivalent or better results than other learning based methods(SVM, VPT, NB). Especially, for the semi-automatic indexing(computer-aided indexing), the methods using Rocchio algorithm with a high recall level could be used preferentially.

정보관리학회지