바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: content features, 검색결과: 18
초록보기
초록

연구전선이란 연구논문들 간에 인용이 빈번하게 발생하며, 지속적으로 발전이 이루어지고 있는 연구영역을 의미한다. 연구행위가 집중되는 핵심 연구분야로 발전 가능성이 높은 연구전선을 조기에 예측해내는 것은 학계와 산업계, 정부기관, 나아가 국가의 과학기술 발전에 큰 유익을 가져다 줄 수 있는 유용한 사회적 자원이 된다. 본 연구는 복합자질을 활용하여 연구전선을 추론하는 모델을 제시하고자 시도하였다. 연구전선 추론은 핵심 연구영역으로 발전할 가능성이 높은 문헌들이 포함될 수 있도록 문헌을 복합자질로 표현하고, 그 자질들을 심층학습하여 새로 발행된 문헌들이 연구전선에 포함될 수 있는지 그 가능성을 예측하였다. 서지 자질, 네트워크 자질, 내용 자질 등 복합자질 세트를 사용하여 문헌을 표현하고 피인용을 많이 받을 가능성이 있는 문헌을 추론하기 위해서 확률기반 팩터그래프 모델을 적용하였다. 추출된 자질들은 팩터그래프의 변수로 표현되어 합-곱 알고리즘과 접합 트리 알고리즘을 적용하여 연구전선 추론이 이루어졌다. 팩터그래프 확률모델을 적용하여 연구전선을 추론․구축한 결과, 서지결합도 4 이상으로 구축된 베이스라인 연구전선과 큰 차이를 보였다. 팩터그래프 기반 연구전선그룹이 서지결합 기반 연구전선그룹보다 문헌 간의 직접 연결정도가 강하며 연결 관계에 있지 않은 두 개의 문헌을 연결시키는 매개정도 또한 강한 집단으로 나타났다.

Abstract

This study attempts to infer research fronts using factor graph model based on heterogeneous features. The model suggested by this study infers research fronts having documents with the potential to be cited multiple times in the future. To this end, the documents are represented by bibliographic, network, and content features. Bibliographic features contain bibliographic information such as the number of authors, the number of institutions to which the authors belong, proceedings, the number of keywords the authors provide, funds, the number of references, the number of pages, and the journal impact factor. Network features include degree centrality, betweenness, and closeness among the document network. Content features include keywords from the title and abstract using keyphrase extraction techniques. The model learns these features of a publication and infers whether the document would be an RF using sum-product algorithm and junction tree algorithm on a factor graph. We experimentally demonstrate that when predicting RFs, the FG predicted more densely connected documents than those predicted by RFs constructed using a traditional bibliometric approach. Our results also indicate that FG-predicted documents exhibit stronger degrees of centrality and betweenness among RFs.

2
심지영(연세대학교) ; 김태수(연세대학교) 2002, Vol.19, No.3, pp.5-30 https://doi.org/10.3743/KOSIM.2002.19.3.005
초록보기
초록

본 연구는 음악의 내용에 해당하는 음렬 패턴을 대상으로 분류자질을 선정하고 이를 기준으로 음렬간 유사도를 측정한 후 음렬간 군집을 형성하였다. 이는 내용기반음악검색 시스템에서 유사한 음렬을 검색 결과로 제시함으로써 이용자 탐색을 용이하게 하기 위함이다. 실험문헌집단으로는 「A Dictionary of Musical Themes」에 수록된 주제소절의 kern 형식 파일을 사용하였으며, 음렬 처리도구로는 Humdrum Toolkit version 1.0을 사용하였다. 음렬의 분절 여부와 시작 위치에 따른 네 가지 형태의 유사도 행렬을 대상으로 계층적 클러스터링 기법을 사용하여 유사한 음렬간 군집을 형성하였다. 이들 결과에 대한 평가는 외적 기준이 되는 수작업 분류표가 있는 경우 WACS 척도를 사용하였고, 음렬 내 임의의 위치에서부터 시작한 음렬을 대상으로 한 경우, 클러스터링 결과로부터 얻어낸 군집 내 공통 자질 패턴 분포를 통해 내적 기준을 마련하여 평가하였다. 평가 결과에 의하면 음렬의 시작 위치와 무관하게 분절한 자질을 사용하여 클러스터링한 결과가 그렇지 않은 것에 비해 뚜렷한 차이를 보이며 높게 나타났다.

Abstract

In this paper, classification feature is selected with focus of musical content, note sequences pattern, and measures similarity between note sequences followed by constructing clusters by similar note sequences, which is easier for users to search by showing the similar note sequences with the search result in the CBMR system. Experimental document was 「A Dictionary of Musical Themes」, the index of theme bar focused on classical music and obtained kern-type file. Humdrum Toolkit version 1.0 was used as note sequences treat tool. The hierarchical clustering method is by stages focused on four-type similarity matrices by whether the note sequences segmentation or not and where the starting point is. For the measurement of the result, WACS standard is used in the case of being manual classification and in the case of the note sequences starling from any point in the note sequences, there is used common feature pattern distribution in the cluster obtained from the clustering result. According to the result, clustering with segmented feature unconnected with the starting point Is higher with distinct difference compared with clustering with non-segmented feature.

3
김지수(한남대학교 정보융합연구소) ; 천희수(한남대학교 정보융합연구소) ; 문서현(한남대학교 정보융합연구소) ; 권선영(한남대학교 문헌정보학과) 2022, Vol.39, No.1, pp.219-256 https://doi.org/10.3743/KOSIM.2022.39.1.219
초록보기
초록

지능정보사회에서 VR 기술은 차세대 기술로서 주목받으며 그 중요성이 더욱 강조되고 있다. 이러한 배경에서 도서관에서도 VR 기술을 접목해야 할 필요성이 대두되고 있다. 본 연구는 국내외 도서관에서 이용되고 있는 VR 콘텐츠를 조사하여 분류하고 유형과 특징을 분석하는 데 목적이 있다. 따라서 본 연구에서는 VR 기술이 적용되고 있는 국내외 도서관을 대상으로 VR 콘텐츠 사례를 수집하여 분석하였으며, 분석 결과가 시사하는 바를 바탕으로 향후 VR 콘텐츠를 도서관에 적용하고자 할 때 유의해야 할 사항들을 제언하였다. 본 연구는 기존의 연구에서 중점적으로 논의되지 않았던 VR 콘텐츠를 대상으로 실제 사례에 기반하여 연구를 진행하였다는 점에서 의의가 있다.

Abstract

In an intelligent information society, VR technology is attracting attention as next-generation technology, and its importance as been emphasized. Against this background, there is a need to incorporate VR technology in libraries. The purpose of this study is to investigate and classify VR contents used in domestic and foreign libraries, and to analyze their characteristics and status. Therefore, in this study, cases of VR content were collected and analyzed for domestic and foreign libraries to which VR technology is applied and based on the implications of the analysis results, matters to be noted when applying VR content to the library in the future were suggested. This study is meaningful in that it conducted a study based on actual cases targeting VR content that was not discussed intensively in previous studies.

초록보기
초록

Abstract

As IT technology develops rapidly and the personal dissemination of smart devices increases, video material is especially used as a medium of information transmission among audiovisual materials. Video as an information service content has become an indispensable element, and it has been used in various ways such as unidirectional delivery through TV, interactive service through the Internet, and audiovisual library borrowing. Especially, in the Internet environment, the information provider tries to reduce the effort and cost for the processing of the provided information in view of the video service through the smart device. In addition, users want to utilize only the desired parts because of the burden on excessive network usage, time and space constraints. Therefore, it is necessary to enhance the usability of the video by automatically classifying, summarizing, and indexing similar parts of the contents. In this paper, we propose a method of automatically segmenting the shots that make up videos by analyzing the contents and characteristics of language education videos and indexing the detailed contents information of the linguistic videos by combining visual features. The accuracy of the semantic based shot segmentation is high, and it can be effectively applied to the summary service of language education videos.

초록보기
초록

향토문화란 한 지방의 자연환경 속에서 과거로부터 현재까지 면면히 전승되어 온 역사와 전통, 풍물과 생활, 예술과 유물 및 유적 등의 모든 유산을 의미한다. 한국학중앙연구원에서는 이런 향토문화를 디지털 콘텐츠로 제작하고 이를 이용하여 『한국향토문화전자대전』을 편찬하였다. 향토문화 콘텐츠는 기록물의 특성을 가지고 있어 출처주의, 계층목록과 같은 기록물관리체계를 따르고 있으며 이를 편찬․관리하기 위한 시스템은 기초자료, 단편적 정보 및 고급정보 등이 하나의 시스템 안에서 순환하면서 새로운 지식정보를 만들어내도록 도와주는 순환형 지식정보관리시스템을 지향한다. 순환형 지식정보관리시스템의 이용자는 이 시스템을 통해 직접적으로 자료를 수집할 수 있을 뿐만 아니라 다른 곳으로부터 데이터를 수집할 수 있으며, 나아가 수집한 데이터를 가공하여 새로운 지식 정보를 창출할 수 있다. 그러나 다양한 향토문화 콘텐츠의 구조에 포함된 의미적인 특징을 손상시키지 않고 데이터베이스를 구축하기가 매우 어렵고, 또한 이러한 작업은 장시간에 걸쳐 여러 차례의 교정 작업이 수행되어야 하므로 문서편찬, 교정, 서비스가 동시에 수행되는 시스템을 필요로 한다. 따라서 본 논문에서는 『한국향토문화전자대전』의 사례를 중심으로 고문서가 많이 포함된 향토문화 콘텐츠의 의미적인 특징을 손상시키지 않으면서, 문서의 구조정보를 표현할 수 있는 XML 기반의 디지털 편찬 관리시스템을 제시하고 본 연구에서 개발된 관리시스템에서 향토문화 콘텐츠 관리를 위해 확장된 기능을 소개한다.

Abstract

Local culture is a cultural heritage that has come down from generation to generation in the natural environment of a region. It includes history, tradition, natural features, art, and historic relics. The Academy of Korean Studies has complied “The Encyclopedia of Korean Local Culture” using those local culture contents. Local culture content shave the features of documentary, such as authenticating the source, and managing hierarchy structure. Thus, to deal with local culture contents, a “circular knowledge information management system” is sought for that helps basic, fragmentary, and high-level information to circulate to create new knowledge information within the system. A user of this circular knowledge information management system is able not only to collect data directly in it, but also to fetch data from other database. Besides, processing the collected data helps to create new knowledge information. But, it’s very difficult to sustain the features of the original hierarchy bearing meaning contained in the various kinds of local culture contents when building a new database. Moreover, this kind of work needs many times of correction over a long period of time. Therefore, a system in which compilation, correction, and service can be done simultaneously is needed. Therefore, in this study, focusing on the case of “The Encyclopedia of Korean Local Culture”, I propose a XML-based digital compilation management system that can express hierarchy information and sustain the semantic features of the local culture contents containing lots of ancient documents, and introduce the expanded functions developed to manage contents in the system.

초록보기
초록

본 연구의 목적은 국내 학술논문 데이터베이스에서 검색한 언어 네트워크 분석 관련 53편의 국내 학술논문들을 대상으로 하는 내용분석을 통해, 언어 네트워크 분석 방법의 기초적인 체계를 파악하기 위한 것이다. 내용분석의 범주는 분석대상의 언어 텍스트 유형, 키워드 선정 방법, 동시출현관계의 파악 방법, 네트워크의 구성 방법, 네트워크 분석도구와 분석지표의 유형이다. 분석결과로 나타난 주요 특성은 다음과 같다. 첫째, 학술논문과 인터뷰 자료를 분석대상의 언어 텍스트로 많이 사용하고 있다. 둘째, 키워드는 주로 텍스트의 본문에서 추출한 단어의 출현빈도를 사용하여 선정하고 있다. 셋째, 키워드 간 관계의 파악은 거의 동시출현빈도를 사용하고 있다. 넷째, 언어 네트워크는 단수의 네트워크보다 복수의 네트워크를 구성하고 있다. 다섯째, 네트워크 분석을 위해 NetMiner, UCINET/NetDraw, NodeXL, Pajek 등을 사용하고 있다. 여섯째, 밀도, 중심성, 하위 네트워크 등 다양한 분석지표들을 사용하고 있다. 이러한 특성들은 언어 네트워크 분석 방법의 기초적인 체계를 구성하는 데 활용할 수 있을 것이다.

Abstract

The purpose of this study is to perform content analysis of research articles using the language network analysis method in Korea and catch the basic point of the language network analysis method. Six analytical categories are used for content analysis: types of language text, methods of keyword selection, methods of forming co-occurrence relation, methods of constructing network, network analytic tools and indexes. From the results of content analysis, this study found out various features as follows. The major types of language text are research articles and interview texts. The keywords were selected from words which are extracted from text content. To form co-occurrence relation between keywords, there use the co-occurrence count. The constructed networks are multiple-type networks rather than single-type ones. The network analytic tools such as NetMiner, UCINET/NetDraw, NodeXL, Pajek are used. The major analytic indexes are including density, centralities, sub-networks, etc. These features can be used to form the basis of the language network analysis method.

7
남재우(중앙대학교) ; 남태우(중앙대학교) 2010, Vol.27, No.4, pp.153-168 https://doi.org/10.3743/KOSIM.2010.27.4.153
초록보기
초록

스마트폰의 이용증가에 따라 도서관의 정보서비스는 새로운 패러다임을 맞이하고 있다. 본 연구는 도서관 모바일 웹사이트에 나타난 콘텐츠를 분석하여 정보의 구성현황 및 특징을 알아보기 위한 연구이다. 이를 위해 국외 26개 도서관을 선별하여 해당기관의 모바일 웹사이트를 조사하였고 사이트에 포함된 콘텐츠를 분석하였다. 그 결과로 모바일 웹사이트의 정보구조 및 핵심 콘텐츠를 분석하여 제시하였으며, 모바일 웹사이트에서 가장 많이 제공되고 있는 콘텐츠의 유형을 분석하였다. 연구의 결과는 도서관의 모바일 웹사이트 구축을 위한 참고자료가 될 수 있을 것이다.

Abstract

The information service of library is getting into a new paradigm as the smart phone usage increases. This study analyzes the contents reflected on the library mobile website to figure out the structural condition and features of the information. For this study, 26 academic libraries in U.S. are selected for an examination of their mobile websites, and the contents on the sites were analyzed. This study analyzed the most frequent type of contents provided in the mobile website. As a result, this study suggested the information structure and core contents of the mobile website in detail. The outcome of this study is expected to be a reference for building the mobile website of library.

8
백우진(건국대학교) ; 이재준(인하대학교) ; 함은미(건국대학교) ; 신문선(안양대학교) ; 신민기(건국대학교) ; 안의건(연세대학교) 2007, Vol.24, No.3, pp.321-341 https://doi.org/10.3743/KOSIM.2007.24.3.321
초록보기
초록

산업재산권중 하나인 상표에 대한 효율적인 이미지 검색은 상표도용 및 이로 인한 분쟁을 방지할 수 있다. 이를 위해서 효율적인 내용기반 유사이미지 검색이 하나의 방안이 될 수 있다. 본 논문은 상표이미지로부터 회색조 히스토그램(gray histogram) 분석을 통하여 가시적인 자질을 추출하여 Self Organizing Map(SOM) 알고리즘을 적용한 내용기반 유사이미지 검색시스템을 이용하는 방법을 제안하였다. 또한 내용기반 유사이미지 검색시스템의 정량적인 성능평가 방안을 제시하여 본 연구에서 개발한 이미지 검색 시스템의 객관적인 성능평가를 수행하였다.

Abstract

It will be possible to prevent the infringement of the trademarks and the insueing disputes regarding the originality of the trademarks by using an efficient content-based trademark image retrieval system. In this paper, we describe a content-based image retrieval system using the Self Organizing Map(SOM) algorithm. The SOM algorithm utilizes the visual features, which were derived from the gray histogram representation of the images. In addition, we made the objective effectiveness evaluation possible by coming up with a quantitative measure to gauge the effectiveness of the content-based image retrieval system.

초록보기
초록

이 연구에서는 한 대학도서관의 신착 도서 리스트 중 사회 과학 분야 6,253권에 대해 목차 정보를 이용하여 자동 분류를 적용하였다. 분류기는 kNN 알고리즘을 사용하였으며 자동 분류의 범주로 도서관에서 도서에 부여한 DDC 300대 강목을 사용하였다. 분류 자질은 도서의 서명과 목차를 사용하였으며, 목차는 인터넷 서점으로부터 Open API를 통해 획득하였다. 자동 분류 실험 결과, 목차 자질은 분류 재현율과 분류 정확률 모두를 향상시키는 좋은 자질임을 알 수 있었다. 또한 목차는 풍부한 자질로 불균형인 데이터의 과적합 문제를 완화시키는 것으로 나타났다. 법학과 교육학은 사회 과학 분야에서 특정성이 높아 서명 자질만으로도 좋은 분류 성능을 가져오는 점도 파악할 수 있었다.

Abstract

This study applied automatic classification using table of contents (TOC) text for 6,253 social science books from a newly arrived list collected by a university library. The k-nearest neighbors (kNN) algorithm was used as a classifier, and the ten divisions on the second level of the DDC’s main class 300 given to books by the library were used as classes (labels). The features used in this study were keywords extracted from titles and TOCs of the books. The TOCs were obtained through the OpenAPI from an Internet bookstore. As a result, it was found that the TOC features were good for improving both classification recall and precision. The TOC was shown to reduce the overfitting problem of imbalanced data with its rich features. Law and education have high topic specificity in the field of social sciences, so the only title features can bring good classification performance in these fields.

초록보기
초록

본 연구에서는 방송자료에 대한 지적 접근점을 제공하기 위한 방편으로, 뉴스 및 시사보도 프로그램의 내용 기술을 위한 패싯 분석 기법의 적용을 시도하였다. 랑가나단의 PMEST 기본 패싯에 기반하여, 보도 장르에 적합한 기본 패싯-‘누가’, ‘무엇을’, ‘어떻게’, ‘어디서’, ‘언제’-을 생성하였으며, 보도 장르의 형식적 구조와 내용적 요소를 반영하여 패싯의 구성요소를 추출하였다. 이를 실제 방영한 시사보도 프로그램을 대상으로 적용해 본 결과, 본 연구에서 제안한 패싯이 보도 장르의 맥락적 요소를 잘 표현해주고 있었으며, 패싯의 적용은 특정 방송내용에 대한 식별을 증진시킬 것으로 기대되었다.

Abstract

This study aims to provide intellectual access to TV content using faceted classification. In order to describe the content of news and current affairs programs, a faceted approach was explored. Based on the Ranganathan’s PMEST formula, the basic facets - ‘who’, ‘what’, ‘how’, ‘where’, ‘when’ - and their sub-facets were created, specifically for describing the news genre. Additionally, the formal structure and the contextual features of the news genre were mainly considered for creating sub-facets. These created facets were applied to a news genre program. The result shows that these suggested facets are useful for representing well the contextual components of the news genre. The application of faceted classification is expected to improve the identification of the specific TV content.

정보관리학회지