바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: feature, 검색결과: 6
초록보기
초록

기계학습 기반 문서범주화 기법에 있어서 최적의 자질을 구성하는 것이 성능향상에 있어서 중요하다. 본 연구는 학술지 수록 논문의 필수적 구성요소인 저자 제공 키워드와 논문제목을 대상으로 자질확장에 관한 실험을 수행하였다. 자질확장은 기본적으로 선정된 자질에 기반하여 WordNet과 같은 의미기반 사전 도구를 활용하는 것이 일반적이다. 본 연구는 키워드와 논문제목을 대상으로 WordNet 동의어 관계 용어를 활용하여 자질확장을 수행하였으며, 실험 결과 문서범주화 성능이 자질확장을 적용하지 않은 결과와 비교하여 월등히 향상됨을 보여주었다. 이러한 성능향상에 긍정적인 영향을 미치는 요소로 파악된 것은 정제된 자질 기반 및 분류어 기준의 동의어 자질확장이다. 이때 용어의 중의성 해소 적용과 비적용 모두 성능향상에 영향을 미친 것으로 파악되었다. 본 연구의 결과로 키워드와 논문제목을 활용한 분류어 기준 동의어 자질 확장은 문서 범주화 성능향상에 긍정적인 요소라는 것을 제시하였다.

Abstract

Identifying optimal feature sets in Text Categorization(TC) is crucial in terms of improving the effectiveness. In this study, experiments on feature expansion were conducted using author provided keyword sets and article titles from typical scientific journal articles. The tool used for expanding feature sets is WordNet, a lexical database for English words. Given a data set and a lexical tool, this study presented that feature expansion with synonymous relationship was significantly effective on improving the results of TC. The experiment results pointed out that when expanding feature sets with synonyms using on classifier names, the effectiveness of TC was considerably improved regardless of word sense disambiguation.

2
이수상(부산대학교) ; 이순영(부산대학교) 2009, Vol.26, No.4, pp.93-112 https://doi.org/10.3743/KOSIM.2009.26.4.093
초록보기
초록

최근 정보검색 환경은 검색 2.0으로 대표되는 차세대 검색서비스에 대한 논의들이 활발해지고 있다. 따라서 이 연구에서는 정보검색의 발전과 진화에 대한 다양한 논의들을 토대로 정보검색의 발전 과정을 구분하였다. 그리고 현재 거론되고 있는 차세대 검색서비스의 등장 배경, 주요 개념, 그리고 관련 사례와 속성을 파악하였으며, 이러한 속성과 사례에 대한 데이터를 통해 차세대 검색서비스를 설명하는 핵심적인 키워드를 확인하기 위한 군집 분석을 수행하였다. 군집 분석의 결과 차세대 검색서비스를 대표하는 주요 키워드는 소셜 검색, 지능형 의미 검색, 그리고 관계기반 검색 등으로 나타났다.

Abstract

Recently in the area of the information environment, there are lively discussions about search 2.0 which is representative of the next generation search services. In this study, we divide information search model into matching and linking models according the developmental stages. Therefore, on the one hand, we analyze the background, main concepts, related attributes and cases of the next generation search services and the other, we identify the representative keywords by the group analysis of various attributes and cases of it. The result shows that the main keywords such as social search, artificial intelligence and semantic search, and relation/network based search are representative of the search 2.0.

초록보기
초록

향토문화란 한 지방의 자연환경 속에서 과거로부터 현재까지 면면히 전승되어 온 역사와 전통, 풍물과 생활, 예술과 유물 및 유적 등의 모든 유산을 의미한다. 한국학중앙연구원에서는 이런 향토문화를 디지털 콘텐츠로 제작하고 이를 이용하여 『한국향토문화전자대전』을 편찬하였다. 향토문화 콘텐츠는 기록물의 특성을 가지고 있어 출처주의, 계층목록과 같은 기록물관리체계를 따르고 있으며 이를 편찬․관리하기 위한 시스템은 기초자료, 단편적 정보 및 고급정보 등이 하나의 시스템 안에서 순환하면서 새로운 지식정보를 만들어내도록 도와주는 순환형 지식정보관리시스템을 지향한다. 순환형 지식정보관리시스템의 이용자는 이 시스템을 통해 직접적으로 자료를 수집할 수 있을 뿐만 아니라 다른 곳으로부터 데이터를 수집할 수 있으며, 나아가 수집한 데이터를 가공하여 새로운 지식 정보를 창출할 수 있다. 그러나 다양한 향토문화 콘텐츠의 구조에 포함된 의미적인 특징을 손상시키지 않고 데이터베이스를 구축하기가 매우 어렵고, 또한 이러한 작업은 장시간에 걸쳐 여러 차례의 교정 작업이 수행되어야 하므로 문서편찬, 교정, 서비스가 동시에 수행되는 시스템을 필요로 한다. 따라서 본 논문에서는 『한국향토문화전자대전』의 사례를 중심으로 고문서가 많이 포함된 향토문화 콘텐츠의 의미적인 특징을 손상시키지 않으면서, 문서의 구조정보를 표현할 수 있는 XML 기반의 디지털 편찬 관리시스템을 제시하고 본 연구에서 개발된 관리시스템에서 향토문화 콘텐츠 관리를 위해 확장된 기능을 소개한다.

Abstract

Local culture is a cultural heritage that has come down from generation to generation in the natural environment of a region. It includes history, tradition, natural features, art, and historic relics. The Academy of Korean Studies has complied “The Encyclopedia of Korean Local Culture” using those local culture contents. Local culture content shave the features of documentary, such as authenticating the source, and managing hierarchy structure. Thus, to deal with local culture contents, a “circular knowledge information management system” is sought for that helps basic, fragmentary, and high-level information to circulate to create new knowledge information within the system. A user of this circular knowledge information management system is able not only to collect data directly in it, but also to fetch data from other database. Besides, processing the collected data helps to create new knowledge information. But, it’s very difficult to sustain the features of the original hierarchy bearing meaning contained in the various kinds of local culture contents when building a new database. Moreover, this kind of work needs many times of correction over a long period of time. Therefore, a system in which compilation, correction, and service can be done simultaneously is needed. Therefore, in this study, focusing on the case of “The Encyclopedia of Korean Local Culture”, I propose a XML-based digital compilation management system that can express hierarchy information and sustain the semantic features of the local culture contents containing lots of ancient documents, and introduce the expanded functions developed to manage contents in the system.

초록보기
초록

디지털도서관은 통합관리를 위해 정보기술의 표준화 모델인 아키텍처와 거버넌스를 도입하고 있으며, 도서관의 체계적인 정보기술 거버넌스는 도서관의 정보기술과 업무 부문의 효과적인 융합으로 통합적인 조직의 전략 및 목표를 개발하고, 추진하여 관리하는 조직 기능이라 할 수 있다. 이러한 맥락에서, 본 연구의 목적은 도서관 조직 내의 정보기술 및 업무 관련 사회연결망 구조를 통해 도서관의 통합적 관리․운영을 위한 전략적 연계의 사회적 자본에 대한 분석 모델을 제시하는 데 있다. 전략적 연계를 위한 사회적 자본의 분석 모형은 첫째, 인적자원의 특성을 통한 전체 사회연결망 분석으로 둘째, 1) 커뮤니케이션 2) 경쟁력 및 가치 3) 거버넌스 4) 파트너쉽 5) 범위와 아키텍처 6) 역량의 전략적 연계 요소 분석으로 셋째, 전략적 통합성 및 기능적 통합성의 전략 적 연계 분석으로 설계하였다. 이러한 세 가지 사회적 자본은 사회연결망 분석 이론의 연결성, 중심성, 관계성으로 평가된다.

Abstract

This research applied the concepts of IT architecture and IT governance for managing with an integrated computing environment and organized structure, which base a digital library’s management and operation. It also aims to analyze the structural system between information technology of human resources and strategy alignment elements of business, which both constitute the core content. Social network analysis software was used to investigate the complicated relationship between IT and business-related strategy alignment elements. The following is the results of carrying out this research on the social network structure and features of strategy alignment elements for a digital library. First, analysis indexes for strategy alignment elements and social network of a digital library were developed. Second, an analysis model was designed based on the analysis index for social network as to strategy alignment elements. Analysis model was appraised by collecting social network datasets for such strategy alignment elements as Communications, Competency and Value, Governance, Partnership, Scope and Architecture, and Skills against the Business strategy, Information strategy, Business and Technology of a digital library. As for the content of analysis, social network structure and specific features were analyzed in relation to a digital library’s (1) General social network, (2) Structure of strategy alignment elements, (3) Strategy fit and Functional integration.

초록보기
초록

본 연구에서는 의견이나 감정을 담고 있는 의견 문서들의 자동 분류 성능을 향상시키기 위하여 개념색인의 하나인 잠재의미색인 기법을 사용한 분류 실험을 수행하였다. 실험을 위해 수집한 1,000개의 의견 문서는 500개씩의 긍정 문서와 부정 문서를 포함한다. 의견 문서 텍스트의 형태소 분석을 통해 명사 형태의 내용어 집합과 용언, 부사, 어기로 구성되는 의견어 집합을 생성하였다. 각기 다른 자질 집합들을 대상으로 의견 문서를 분류한 결과 용어색인에서는 의견어 집합, 잠재의미색인에서는 내용어와 의견어를 통합한 집합, 지도적 잠재의미색인에서는 내용어 집합이 가장 좋은 성능을 보였다. 전체적으로 의견 문서의 자동 분류에서 용어색인 보다는 잠재의미색인 기법의 분류 성능이 더 좋았으며, 특히 지도적 잠재의미색인 기법을 사용할 경우 최고의 분류 성능을 보였다.

Abstract

The aim of this study is to apply latent semantic indexing(LSI) techniques for efficient automatic classification of opinionated documents. For the experiments, we collected 1,000 opinionated documents such as reviews and news, with 500 among them labelled as positive documents and the remaining 500 as negative. In this study, sets of content words and sentiment words were extracted using a POS tagger in order to identify the optimal feature set in opinion classification. Findings addressed that it was more effective to employ LSI techniques than using a term indexing method in sentiment classification. The best performance was achieved by a supervised LSI technique.

초록보기
초록

웹을 통해 접할 수 있는 정보의 양이 급격하게 증가함에 따라, 북마크는 이용자가 정보요구에 적합한 웹 정보를 효율적으로 재이용할 수 있게 해주는 도구라는 점에서 중요해졌다. 이 연구에서는 웹에서의 정보 수집 및 관리 도구로서의 북마크 이용 행태를 파악하고, 이와 관련하여 북마크 기능이 어떻게 개선되어야 하는지를 분석하였다. 이를 위해 응답자 5명을 대상으로 인터뷰 및 관찰을 실시하고, 180명의 이용자를 대상으로 설문조사를 실시하여 북마크 이용 목적에 따라 이용 행태와 기능 개선에 대한 요구사항에 차이가 있는지를 조사하였다. 분석 결과, 웹 정보의 수집을 위해 북마크를 이용하는 경우 맥락 정보에 대한 요구사항이 높은 것으로 나타났다. 또한 북마크 이용 빈도가 낮은 집단은 웹 정보 재이용이라는 목적에 대해 북마크 기능이 필수적이라고 여기는 것으로 나타났다.

Abstract

As the amount of web information grows, a bookmark has become an important tool to reuse web information effectively which is relevant to users’ information needs. Thus, this study aimed to investigate how bookmarks are used as a management tool of web information, and what functions users require concerned with it. For this purpose, semi-structured interviews and observations were carried out from 5 respondents, and a survey was conducted to investigate the relationship between bookmark using behaviors and requirements for function improvement. The users who use bookmark less frequently think bookmark feature essential for the purpose of reusing web information.

정보관리학회지