바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 색인, 검색결과: 53
초록보기
초록

Abstract

The purpose of this study is to investigate the characteristics of indexes by human and machine, and differences between them in terms of term identification in a fulltext environment. A back-of-book index and two indexes produced by two term identifiers (LinkIt and Termer) as pseudo-indexing systems for a whole body of a monograph are examined. In the investigation, the traditional contrast between manual and automatic indexing is confirmed in fulltext environment; manual index is for browsing and human use, and automatic index is for searching and machine use. The border between them, however, becomes vague. Some considerations for the use of the term identifiers for browsing and for searching are discussed, and further research for the use of the term identifier is suggested.

초록보기
초록

이 연구는 색인가가 주제 색인하는 과정에서 참조하는 여러 문서구성요소를 문서 범주화의 정보원으로 인식하여 이들이 문서 범주화 성능에 미치는 영향을 살펴보는데 그 목적이 있다. 이는 기존의 문서 범주화 연구가 전문(full text)에 치중하는 것과는 달리 문서구성요소로서 정보원의 영향을 평가하여 문서 범주화에 효율적으로 사용될 수 있는지를 파악하고자 한다. 전형적인 과학기술 분야의 저널 및 회의록 논문을 데이터 집합으로 하였을 때 정보원은 본문정보 중심과 문서구성요소 중심으로 나뉘어 질 수 있다. 본문정보 중심은 본론 자체와 서론과 결론으로 구성되며, 문서구성요소 중심은 제목, 인용, 출처, 초록, 키워드로 파악된다. 실험 결과를 살펴보면, 인용, 출처, 제목 정보원은 본문 정보원과 비교하여 유의한 차이를 보이지 않으며, 키워드 정보원은 본문 정보원과 비교하여 유의한 차이를 보인다. 이러한 결과는 색인가가 참고하는 문서구성요소로서의 정보원이 문서 범주화에 본문을 대신하여 효율적으로 활용될 수 있음을 보여주고 있다.

Abstract

The purpose of this study is to examine whether the information resources referenced by human indexers during indexing process are effective on Text Categorization. More specifically, information resources from bibliographic information as well as full text information were explored in the context of a typical scientific journal article data set. The experiment results pointed out that information resources such as citation, source title, and title were not significantly different with full text. Whereas keyword was found to be significantly different with full text. The findings of this study identify that information resources referenced by human indexers can be considered good candidates for text categorization for automatic subject term assignment.

초록보기
초록

이미지 색인은 이미지 정보로의 접근에 핵심적인 역할을 수행하는 부분으로 다양한 이미지 색인 방법 및 시스템이 이미지 정보의 종류에 따라 소개되어 왔다. 이미지 색인은 Panofsky의 정보의 단계별 색인에서 출발하여 시소러스, 분류체계, 이미지 기술요소, 범주화 방식 등을 이용하는 방식으로 발전하여 왔다. 이 연구는 Panofsky의 이미지 정보 중 이차 이미지 정보의 색인(iconographical analysis of image information)에 있어 이용자들을 대상으로 하여 그 객관성을 측정하고, 색인의 객관성과 관련된 이미지 기술요소들을 밝혀내고자 하였다. 이미지 속의 인물이나 물체 등 사실적이고 정형화된 일차 이미지 정보와는 대조적으로, 보다 주관적이고 해석적인 이차 이미지 정보의 예로 감정정보를 택하여 48명의 이용자들을 대상으로 2차에 걸친 실험을 하였다. 1차 실험에서는 같은 이미지 안에서 각각의 이용자들이 읽어내는 감정정보의 일치도를 측정하였고 2차 실험에서는 이용자들이 이미지 탐색 과정 중 검색된 이미지에 부여된 색인어에 대한 동의 정도를 통하여 색인의 객관성을 측정하였다. 1차와 2차 실험 결과는 이용자들이 같은 이미지에 대하여 다양한 해석을 내리고 있으며 주관적인 해석이나 개인차가 이차 이미지 정보의 색인에 영향을 미치는 요소로 작용하고 있음을 보여 주었다. 이 연구의 결과는 이차 이미지 정보에 대한 이용자들의 주관적인 반응을 수렴할 수 있는 색인 시스템이나 탐색기법에 대한 계속적인 연구 및 개발의 필요성을 강조하고 있다.

Abstract

Developing good methods for image description and indexing is fundamental for successful image retrieval, regardless of the content of images. Researchers and practitioners in the field of image indexing have developed a variety of image indexing systems and methods with the consideration of information types delivered by images. Such efforts in developing image indexing systems and methods include Panofsky''''s levels of image indexing and indexing systems adopting different approaches such as thesauri-based approach, classification approach. description element-based approach, and categorization approach. This study investigated users'''' perception of the objectiveness of image indexing, especially the iconographical analysis of image information advocated by Panofsky. One of the best examples of subjectiveness and conditional-dependence of image information is emotion. As a result, this study dealt with visual emotional information. Experiments were conducted in two phases : one was to measure the degree of agreement or disagreement about the emotional content of pictures among forty-eight participants and the other was to examine the inter-rater consistency defined as the degree of users'''' agreement on indexing. The results showed that the experiment participants made fairly subjective interpretation when they were viewing pictures. It was also found that the subjective interpretation made by the participants resulted from the individual differences in terms of their educational or cultural background. The study results emphasize the importance of developing new ways of indexing and/or searching for images, which can alleviate the limitations of access to images due to the subjective interpretation made by different users.

4
최광남(한국과학기술정보연구원) ; 조현양(경기대학교) ; 안세필(Kins,Inc) 2002, Vol.19, No.4, pp.77-94 https://doi.org/10.3743/KOSIM.2002.19.4.077
초록보기
초록

본 연구에서는 한국과학기술정보연구원에서 구축중인 한국과학기술인용색인을 바탕으로 국내 주요 과학기술계 학술지에 수록된 연구 논문을 중심으로 연구자들의 인용현황을 분석하였다. 또한 기계공학 분야를 실험 대상으로 선정하여 현재 SCI의 기계공학 분야의 인용 순위와 비교한 결과 SCI의 JCR과는 실질적인 차이가 있음을 발견하였다. 본 연구는 국내 연구자에게 분야별 필수적인 연구 정보원의 제공과 국내 기관별, 분야별 과학기술 수준을 파악하고 평가하기 위한 도구로서 활용이 가능한 한국인용색인데이터베이스의 효율적인 구축방안 및 서비스모델을 제안한다.

Abstract

In this study we analyze the present situation of cited and citing references among researchers, based on Korean Science Citation Index developed by Korea Institute of Science & Technology Information. There are some differences on the rank of frequently cited journals between JCR of ISI and KSCI, especially in the field of mechanical engineering. The purpose of this study is to find an efficient way of constructing KSCI database and to propose a service model which can be available as a tool to evaluate research activities and to provide researcher with basic information resources.

5
유영준(나사렛대학교) 2003, Vol.20, No.3, pp.277-297 https://doi.org/10.3743/KOSIM.2003.20.3.277
초록보기
초록

이 연구는 색인어가 특정 주제 영역의 지식 구조를 표현할 수 있다는 것을 전제로 한다. 여기에서는 문헌정보학 관련 학술지인 정보관리학회지, 한국도서관정보학회지, 한국문헌정보학회지 등에 수록된 논문을 대상으로 국회도서관이 배정한 색인어를 클러스터링하여 문헌정보학의 지식 구조를 파악하였다.그 과정에서, 색인어간의 연관도 및 동시 출현 빈도를 이용하여 색인어 군집을 생성하였고, 초출색인어와 시기 구분에 의한 시계열 분석을 수행함으로써 문헌정보학의 발전 과정과 그 동향을 밝혔다. 또한 색인어 군집에 의해 도출된 지식 구조와 기존의 전통적인 분류체계의 지식 구조를 비교하여 두 지식 구조간의 차이를 분석하였다.

Abstract

This study was conducted upon the premise that index terms display the intellectual structure of a specific subject field. In this study, an attempt was made to grasp the intellectual structure of Library and Information Science by clustering the index terms of the journals of the related academic societies at the Library of National Assembly - such as the Journal of the Korean Society for Information Management, the Journal of the Korean Library and Information Science Society, and the Journal of the Korean Society for Library and Information Science. Through the course of the study, index term clusters were generated based on the linkage of the index terms and the frequency of co-occurrence, and moreover, time periods analysis was conducted along with studies on first-appearing terms, in order to clarify the trend and development process of the Library and Information Science. This study also analysed the difference between two intellectual structure by comparing the structure generated by index term clusters with the existing structure of traditional classification systems.

6
정유경(연세대학교 근대한국학연구소 HK연구교수) ; 반재유(연세대학교 근대한국학연구소 HK연구교수) 2019, Vol.36, No.4, pp.7-19 https://doi.org/10.3743/KOSIM.2019.36.4.007
초록보기
초록

본 연구는 국한문 혼용 텍스트를 대상으로 한글 형태소 분석 기법과 한문 어조사를 반영한 색인어 추출기법을 제안하였다. 국한문 혼용체로 작성된 시사총보 논설을 대상으로 해당 시기에 사용된 고유명사 및 한자어 사전을 보완하였으며 한자어 불용어 리스트를 고려하여 색인어를 추출하였다. 본 연구에서 제안한 국한문 색인 시스템은 수작업 색인 결과를 기준으로, 중국어형태소 분석기에 비해 재현율과 정확률 측면에서 상대적으로 높은 성능을 보였으며, 어문법이 확립되지 않은 근현대 시기의 국한문 혼용체를 대상으로 한 첫 번째 색인어 추출기법을 제안하였다는 데에서 연구의 차별점이 있다.

Abstract

The aim of this study is to develop a technique for keyword extraction in Korean-Chinese text in the modern period. We considered a Korean morphological analyzer and a particle in classical Chinese as a possible method for this study. We applied our method to the journal “Sisachongbo,” employing proper-noun dictionaries and a list of stop words to extract index terms. The results show that our system achieved better performance than a Chinese morphological analyzer in terms of recall and precision. This study is the first research to develop an automatic indexing system in the traditional Korean-Chinese mixed text.

초록보기
초록

한국어 및 영어의 글쓰기를 도와주는 문장 및 문단 제공시스템을 구축하기 위하여 색인작성과 탐색시에 필요한 색인언어를 연구하였다. 색인언어로 명사어와 술어 및 부사어를 선정하였고 여러 가지 보조 색인기호들도 추가하였다. 접근점으로 주제명과 키워드를 사용하였고 키워드 검색은 1절, 2절, 3 절, 문맥첨가 탐색을 포함하였다. 검색의 만족도는 긍정적이었으며 데이터베이스의 양과 질을 충실히 보완한다면 문장이나 문단을 제공하여 주는 시스템은 효과적일 수 있다.

Abstract

An indexing language were studied to construct the sentences and paragraphs providing system aided to write a Korean or English composition. The indexing language includes the index terms like noun, predicate, and adverb. and also various index symbols. The subject name and the keyword Included the symbols, which Indicate the connectives between clauses in a sentence, is used as the access point. The search results show this system will be effective with large database and developed retrieval methods.

초록보기
초록

이 연구의 목적은 인문학분야를 대상으로 인용DB간 구축 정보를 비교하고 차이가 있는 경우 그 원인과 문제점을 분석하여 구축 정보의 정확성을 향상시킬 수 있는 방안을 제시하는데 있다. 이를 위해 인용정보를 구성하는 주요 항목 중의 하나인 피인용횟수를 기준으로 네이버와 KCI에서 국내학술논문을 비교하였다. 조사결과, KCI가 네이버보다 좀 더 정확한 인용정보를 제공하고 있었지만 그 차이는 크지 않았다. 각 인용DB간 차이의 원인은 수록범위의 불완전성, 서지정보의 오류, 참고문헌 구축의 불완전성, 링크와 관련된 오류 등으로 조사되었다. 두 인용DB 모두 개선의 여지가 남아있으며, 양자를 상호보완적으로 활용한다면 인문학 분야에서 더욱 완전한 인용정보를 파악할 수 있을 것이다.

Abstract

The purpose of this study was to identify differences between KCI and Naver Scholar as citation analysis tools. Four subcategories in the humanities category were selected as the subject of study. The recall of Naver Scholar was 64%(2,227 times) and the KCI's was 77%(2,665 times). There were some differences in the results at the individual article level or the subcategory level, but the gaps were not significant. Therefore, researchers who analyze citations are urged to use both databases because neither of them are complete, but supplementary to each other.

초록보기
초록

로치오 알고리즘에 기초한 통제어휘 자동색인 또는 텍스트 범주화에서 적용되어 온 여러 성능 요인들을 재검토하였고, 성능 향상을 위한 기본적인 방법을 찾아보았다. 또한, 동등한 조건에서 통제어휘 자동색인을 위한 로치오 알고리즘 기반 방법의 성능을 다른 학습기반 방법들의 성능과 비교하였다. 결과에 따르면, 통제어휘 자동색인을 위한 로치오 기반의 프로파일 방법은 구현의 용이성과 컴퓨터 처리시간 측면의 경제성이라는 기존의 장점을 그대로 유지하면서도, 다른 학습기반 방법들(SVM, VPT, NB)과 거의 동등하거나 더 나은 성능을 보여주었다. 특히, 색인전문가의 색인작업을 지원하는 반-자동 색인의 목적으로는 비교적 높은 수준의 재현율을 유지하면서 학습 데이터의 증가에 따라 정확률이 크게 향상되는 로치오 알고리즘을 이용한 방법을 우선적으로 고려할 수 있을 것이다.

Abstract

Several performance factors which have applied to the automatic indexing with controlled vocabulary and text categorization based on Rocchio algorithm were examined, and the simple method for performance improvement of them were tried. Also, results of the methods using Rocchio algorithm were compared with those of other learning based methods on the same conditions. As a result, keeping with the strong points which are implementational easiness and computational efficiency, the methods based Rocchio algorithms showed equivalent or better results than other learning based methods(SVM, VPT, NB). Especially, for the semi-automatic indexing(computer-aided indexing), the methods using Rocchio algorithm with a high recall level could be used preferentially.

초록보기
초록

본 연구에서는 의견이나 감정을 담고 있는 의견 문서들의 자동 분류 성능을 향상시키기 위하여 개념색인의 하나인 잠재의미색인 기법을 사용한 분류 실험을 수행하였다. 실험을 위해 수집한 1,000개의 의견 문서는 500개씩의 긍정 문서와 부정 문서를 포함한다. 의견 문서 텍스트의 형태소 분석을 통해 명사 형태의 내용어 집합과 용언, 부사, 어기로 구성되는 의견어 집합을 생성하였다. 각기 다른 자질 집합들을 대상으로 의견 문서를 분류한 결과 용어색인에서는 의견어 집합, 잠재의미색인에서는 내용어와 의견어를 통합한 집합, 지도적 잠재의미색인에서는 내용어 집합이 가장 좋은 성능을 보였다. 전체적으로 의견 문서의 자동 분류에서 용어색인 보다는 잠재의미색인 기법의 분류 성능이 더 좋았으며, 특히 지도적 잠재의미색인 기법을 사용할 경우 최고의 분류 성능을 보였다.

Abstract

The aim of this study is to apply latent semantic indexing(LSI) techniques for efficient automatic classification of opinionated documents. For the experiments, we collected 1,000 opinionated documents such as reviews and news, with 500 among them labelled as positive documents and the remaining 500 as negative. In this study, sets of content words and sentiment words were extracted using a POS tagger in order to identify the optimal feature set in opinion classification. Findings addressed that it was more effective to employ LSI techniques than using a term indexing method in sentiment classification. The best performance was achieved by a supervised LSI technique.

정보관리학회지