바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: Hierarchical Structure, 검색결과: 9
1
윤소영(국사편찬위원회) ; 문성빈(연세대학교) 2006, Vol.23, No.1, pp.201-219 https://doi.org/10.3743/KOSIM.2006.23.1.201
초록보기
초록

이 연구에서는 가장 적합한 엘리먼트 기반 XML 문서검색 기법을 제시하기 위해 언어모델 검색 접근법으로 다이버전스 기법, 보정 기법 그리고 계층적 언어모델의 검색성능을 평가하는 실험을 수행하였다. 실험 결과, 가장 효율적인 검색 접근법으로 문서의 구조정보를 적용한 계층적 언어모델 검색을 제안하였다. 특히, 계층적 언어모델은 실제 검색에서 중요성을 가지는 검색순위 상위에서 뛰어난 성능을 보였다.

Abstract

This experimental study suggests an element-based XML document retrieval method that reveals highly relevant elements. The models investigated here for comparison are divergence and smoothing method, and hierarchical language model. In conclusion, the hierarchical language model proved to be most effective in element-based XML document retrieval with regard to the improved exhaustivity and harmed specificity.

2
송민선(성균관대학교 정보관리연구소) ; 고영만(성균관대학교) 2015, Vol.32, No.3, pp.221-236 https://doi.org/10.3743/KOSIM.2015.32.3.221
초록보기
초록

본 연구의 목적은 한국학 분야 국내 학술지 논문 데이터를 대상으로 계층적 군집 분석을 적용해 한국학 분야의 지식 구조를 구성하는 연구 영역을 분석하는 것이다. 이를 위해 KCI에서 탑재된 한국학 관련 학술지 중 2011년~2013년도 기준 3년치 평균 Impact Factor 값이 0.5 이상이며, 2004년부터 2013년까지의 10년치 누적 논문 데이터를 갖고 있는 14종의 학술지에 수록된 논문 중 한글 저자키워드 데이터가 포함되어 있는 3,800편을 분석하였다. 분석 결과, 중심 연구 분야는 대체로 성리학과 실학 중심의 유교 사상을 기반으로 한 정치와 사회에 관한 연구, 한반도의 분단 체제를 둘러싼 정치 관련 연구, 그리고 일제 강점기에서 근현대의 역사인 것으로 나타났다. 시기적으로는 고대나 현대 시점보다는 조선시대부터 근대 시기까지를 대상으로 하는 연구들이 많은 것으로 나타났다.

Abstract

The purpose of this study is to analyze the research fields constituting the knowledge structure of the Korean Studies by applying hierarchical clustering method to domestic journal papers in Korean Studies. We analyzed 3,800 papers containing Korean author keyword that were listed in 14 kinds of Korean Studies journals published in 2004-2013, which have average impact factor more than 0.5 in 2011-2013. The results of the analysis show that the central research fields are the subjects related to political & social problems based on Confucian ideas focusing on Neo-Confucianism(Seonglihak) and Realist School of Confucianism(Silhak), to the political situation associated with territorial division of the Korean peninsula, and to the history from the period of japanese colonialism to modern and contemporary. It has been also found that the temporal backgrounds of researches in domestic Korean Studies were related to the modern times and the Joseon Dynasty periods, rather than the time of the ancient and contemporary.

3
유영준(나사렛대학교) 2010, Vol.27, No.3, pp.207-225 https://doi.org/10.3743/KOSIM.2010.27.3.207
초록보기
초록

신학 시소러스의 개념 관계를 구축하기 위해서 용어를 영어 신학사전과 성경에서 주로 추출하였다. 추출한 용어들을 대상으로 시소러스의 가장 기본적인 관계 유형인 등가관계, 계층관계, 연관관계를 구축하였다. 등가 관계에서 특징적인 것은 히브리어, 그리스어, 라틴어 우선어가 포함되었으며, 계층관계에서는 속종관계, 사례관계, 전체-부분 관계, 다중계층 관계로 세분화되었다. 또한 신학 시소러스의 개념 관계의 유형에 있어서는 다른 주제 영역의 시소러스와 큰 차이를 보이지는 않았다. 이 논문에서는 성경 신학과 연관된 관계 유형의 실제 사례들을 주로 제시하였다. 그 이유는 성경 신학이 성경과 기독교 신학 전체를 포괄적인 관점에서 파악할 수 있는 장점이 있기 때문이다. 이와 관련해서 신학 시소러스의 개념 관계의 특징 중의 하나는 비유적 표현의 용어가 상당히 많았다는 점이다. 이러한 결과가 나온 주된 이유는 구약에서 예표된 내용이 신약에서 성취되는 성경의 핵심적 구조 때문이다.

Abstract

Terms collected from theological dictionaries in English and the Scripture are used in order to construct conceptual relationships of theological thesaurus. Using the terms, equivalence relationships, hierarchical relationships, and associative relationships as the basic relationships in thesaurus are constructed. In equivalence relationships, Hebrew, Greek, and Latin terms are included as descriptors and in hierarchical relationships, generic, instance, whole-part, and polyhierarchical relationships are constructed. Also, there is no big difference in the kinds of conceptual relationships between this theological thesaurus and the thesauri of other subjects. Examples of Biblical Theology are showed. Because Biblical Theology has a strong point to view the Scripture and Protestantism on comprehensive perspective. In this context, one of the main feature in the theological thesaurus is that there are a lot of the allegorical terms. Typology, which is the core structure causes this result.

초록보기
초록

패스파인더 네트워크를 사용하여 지적 구조의 분석과 규명을 시도한 여러 연구가 발표되었다. 패스파인더 네트워크는 다차원척도법에 비해서 여러 장점을 가지고 있지만 구축 알고리즘의 복잡도가 매우 높아서 실행 시간이 오래 걸리며, 전통적인 지적 구조 분석에 유용하게 사용되어온 군집분석을 함께 적용하기가 어려운 것이 단점이다. 이 연구에서는 이와 같은 패스파인더 네트워크의 약점을 보완할 수 있는 새로운 기법으로 병렬 최근접 이웃 클러스터링(PNNC) 기법을 제안하였다. PNNC 기법의 클러스터링 성능을 전통적인 계층적 병합식 클러스터링 기법들과 비교해본 결과 효과성과 효율성 양면에서 기존 기법보다 우세한 것으로 확인되었다.

Abstract

Recently there are many bibliometric studies attempting to utilize Pathfinder networks(PFNets) for examining and analyzing the intellectual structure of a scholarly field. Pathfinder network scaling has many advantages over traditional multidimensional scaling, including its ability to represent local details as well as global intellectual structure. However there are some limitations in PFNets including very high time complexity. And Pathfinder network scaling cannot be combined with cluster analysis, which has been combined well with traditional multidimensional scaling method. In this paper, a new method named as Parallel Nearest Neighbor Clustering (PNNC) are proposed for complementing those weak points of PFNets. Comparing the clustering performance with traditional hierarchical agglomerative clustering methods shows that PNNC is not only a complement to PFNets but also a fast and powerful clustering method for organizing informations.

5
서은경(한성대학교) ; 성혜은(한성대학교) 2007, Vol.24, No.2, pp.71-87 https://doi.org/10.3743/KOSIM.2007.24.2.071
초록보기
초록

인터넷 환경과 디지털자원의 활용환경이 빠르게 변화됨에 따라 탐색과 브라우징을 제공해주는 정보시스템의 인터페이스 또한 새롭게 변해가고 있다. 특히 최근에 검색 인터페이스에서 많이 사용되고 있는 긴 리스트의 메뉴항목을 이용자가 보다 쉽게 브라우징하고 선택할 수 있도록 하기 위하여 시각화기법을 이용하여 디스플레이하고 있다. 본 연구는 이용자와 데이터 특성에 맞는 긴 메뉴항목 시각화 기법을 제안하기 위하여 긴 리스트의 메뉴항목을 시각화하기 위하여 많이 사용되고 있는 기법 즉 트리구조 메뉴, 목차방식 메뉴, 롤-오버방식 메뉴, 클릭방식 메뉴, 어안렌즈방식 메뉴를 비교하였다 그 결과 계층구조 메뉴 중에서는 전문가는 목차방식 메뉴를, 초보자는 트리구조 메뉴를 선호하고, 또 순차적 구조 메뉴 중에서는 전문가와 초보자 모두 롤-오보방식 메뉴를 선호하고 있음을 알 수 있었다.

Abstract

With the rapid change of the Web and E-transaction application, the search interface is providing more powerful search and visualization methods, while offering smoother integration of technology with task. Especially, visualization techniques for long menu-lists are applied in retrieval system with the goal of improving performance in users ability to select one item from a long list. In order to review visualization techniques appropriate to the types of users and data set, this study compared the five visualization browsers such as the Tree-structured menu, the Table-of-contents menu, the Roll-over menu, the Click menu, and Fisheye menu. The result of general analyses shows that among the hierarchical methods, the experienced group prefers the Table-of-contents method menu, whereas the novices group prefers the Tree-structure method menu. Among the linear methods, the two groups prefer the Roll-over menu. The Roll-over menu is most preferred among the five browsers by the two groups.

초록보기
초록

기본의미등록기(BSR)는 전자상거래 및 EDI 관련 시스템 사이의 상호연동을 가능하게 하기 위한 등록기이다. XML 기반 BSR 등록개체들의 구조정보나 다양한 관계의 자동추출은 현재 불가능하다. 이 연구에서는 BSR에 등록되는 정보를 자원기술-프레임웍(RDF)과 웹온톨로지언어(OWL)에 기반하는 기계가독형으로 정의한 대표적인 예를 제시하고 결론적으로 5개의 기본 권고안을 도출하였다. 즉 BSR 컴포넌트 소속의 클래스 정의에서 동의어의 표현에는 OWL의 'sameAs', 유사어 표현에는 OWL의 'equivalenlClass', BSR 개념들 간의 상.하 관계 표현은 RDF 스키마의 'subClassOF', BSR의 의미단위(BSU)에 관한 정의는 RDF 스키마의 'label', 인스턴스 용례에 관한 설명은 RDF 스키마의 'comment', 각 BSU의 클래스 소속에 관한 정의는 RDF 스키마의 'domain', BSU가 취할 수 있는 데이터유형에 대한 정의는 RDF 스키마의 'range'등을 적용하며, 나아가 BSR 데이터요소의 정의에 XML 스키마의 데이터 유형을 접목시키고 BSU들 간의 상.하 관계 표현에 RDF 스키마의 'subPropertyOF'를 적용할 것을 추천하였다.

Abstract

The Basic Semantic Register(BSR) is and official ISO register designed for interoperability among eBusiness and EDI systems. The entities registered in the current BSR are not defined in a machine-understandable way, which renders automatic extraction of structural and relationship information from the register impossible. The purpose of this study is to offer a framework for designing an ontology that can provide semantic interoperability among BSR-based systems by defining data structures and relationships with RDF and OWL, similar meaning by the 'equivalentClass' construct in OWL, the hierachical relationships among classes by the 'subClassOf' construct in RDF schema, definition of any entities in BSR by the 'label' construct in RDF schema, specification of usage guidelines by the 'comment' construct in RDF schema, assignment of classes to BSU's by the 'domain' construct in RDF schema, specification of data types of BSU's by the 'range' construct in RDF schema. Hierarchical relationships among properties in BSR can be expressed using the 'subPropertyOf' in RDF schema. Progress in semantic interoperability can be expected among BSR-based systems through applications of semantic web technology suggested in this study.

7
이지숙(NHN㈜) ; 정영미(연세대학교) 2007, Vol.24, No.3, pp.201-218 https://doi.org/10.3743/KOSIM.2007.24.3.201
초록보기
초록

이 연구에서는 TREC이 제시한 토픽 검색의 정의에 따라 질의에 적합한 웹 사이트를 검색하는 효과적인 토픽 검색 알고리즘을 제안하고 실험을 통해 그 성능을 평가하였다. 이 연구의 토픽 검색 알고리즘은 먼저 질의에 대한 웹 페이지 검색 결과로부터 적합한 웹 사이트를 선정한 다음, 선정된 사이트의 구조를 이용하여 질의에 대한 적합성 점수를 산출한다. TREC의 .GOV 실험 문헌 집단과 TREC-2004 실험의 질의 및 적합문헌 리스트를 이용한 검색 실험 결과 이 토픽 검색 알고리즘은 상위 10위 안에 최소 2개 이상의 적합 사이트를 검색하여 비교적 높은 수준의 성능을 보였다. 또한 TREC-2004의 적합문헌 리스트 분석을 통해 적합문헌 선정에 토픽 검색의 정의가 엄격하게 적용되지 않은 경우가 있음을 확인하고, 수정된 적합문헌 리스트를 이용하여 토픽 검색 성능을 재평가한 결과 이 연구에서 제안한 토픽 검색 알고리즘의 성능이 월등히 향상되었다.

Abstract

This study proposes a topic distillation algorithm that ranks the relevant sites selected from retrieved web pages, and evaluates the performance of the algorithm. The algorithm calculates the topic score of a site using its hierarchical structure. The TREC .GOV test collection and a set of TREC-2004 queries for topic distillation task are used for the experiment. The experimental results showed the algorithm returned at least 2 relevant sites in top ten retrieval results. We performed an in-depth analysis of the relevant sites list provided by TREC-2004 to find out that the definition of topic distillation was not strictly applied in selecting relevant sites. When we re-evaluated the retrieved sites/sub-sites using the revised list of relevant sites, the performance of the proposed algorithm was improved significantly.

초록보기
초록

본 연구는 OPAC에서 계층 클러스터링을 응용하여 소장자료를 계층구조로 분류하여 열람하는데 사용될 수 있는 최적의 계층 클러스터링 모형을 찾기 위한 목적으로 수행되었다. 문헌정보학 분야 단행본과 학위논문으로 실험집단을 구축하여 다양한 색인기법(서명단어 자동색인과 통제어 통합색인)과 용어가중치 기법(절대빈도와 이진빈도), 유사도 계수(다이스, 자카드, 피어슨, 코싸인, 제곱 유클리드), 클러스터링 기법(집단간 평균연결, 집단내 평균연결, 완전연결)을 변수로 실험하였다. 연구결과 집단간 평균연결법과 제곱 유클리드 유사도를 제외하고 나머지 유사도 계수와 클러스터링 기법은 비교적 우수한 클러스터를 생성하였으나, 통제어 통합색인을 이진빈도로 가중치를 부여하여 완전연결법과 집단간 평균연결법으로 클러스터링 하였을 때 가장 좋은 클러스터가 생성되었다. 그러나 자카드 유사도 계수를 사용한 집단간 평균연결법이 십진구조와 더 유사하였다.

Abstract

This study is to develop a hiararchic clustering model for document classification and browsing in OPAC systems. Two automatic indexing techniques (with and without controlled terms), two term weighting methods (based on term frequency and binary weight), five similarity coefficients (Dice, Jaccard, Pearson, Cosine, and Squared Euclidean), and three hierarchic clustering algorithms (Between Average Linkage, Within Average Linkage, and Complete Linkage method) were tested on the document collection of 175 books and theses on library and information science. The best document clusters resulted from the Between Average Linkage or Complete Linkage method with Jaccard or Dice coefficient on the automatic indexing with controlled terms in binary vector. The clusters from Between Average Linkage with Jaccard has more likely decimal classification structure.

9
이혜경(경북대학교 문헌정보학과) ; 이용구(경북대학교) 2023, Vol.40, No.2, pp.157-182 https://doi.org/10.3743/KOSIM.2023.40.2.157
초록보기
초록

이 연구는 국립중앙도서관에서 개발한 주제명표목표의 구성 현황과 2003년부터 2022년까지 국가서지 1,218,867건에 부여된 주제명의 현황을 분석하였다. 그 결과 첫째, 주제명표목표의 전체 주제명 중 우선어는 257,103개로 전체 용어의 50.2% 이상이었으며, 외국어가 169,466개(33.1%), 비우선어가 61,442개(12.0%) 등으로 구성되었다. 우선어 중에 활용된 주제명은 57,312종으로 22.3%에 해당하며 이 중 54.7%인 31,351종의 주제명은 부여횟수 5회 미만으로, 전체 중에서 적은 수의 주제명만을 활용하고 있음을 파악하였다. 둘째, 관계지시기호의 빈도는 RT, BT, NT 순으로 나타났으며, 최상위 주제명은 12,602종, 최하위 주제명은 143,704종이었고 최대 심도는 17수준이었다. 셋째, 서지 당 평균 1.72회의 주제명이 부여되었으며, 자료의 내용이 특정적일수록 주제명 부여 횟수가 많아지고 심도도 깊어지는 경향을 보였다. 그리고 최근에 입력한 서지일수록 부여된 주제명 수가 증가하였고 심도도 깊어졌으나, KDC 주류에 따라 서지 당 부여된 주제명 수는 편차가 있는 것으로 나타났다. 현황 분석을 통해 결과적으로 주제명표목표가 수록한 용어의 범위에 대한 평가와 주제명의 계층 관계 및 심도의 재정비가 요구되며, 주제명표목표의 세목 개발을 통한 개선이 필요한 것으로 판단하였다.

Abstract

This study analyzed the structure and utilization of subject headings in the National Library of Korea Subject Headings List (NLSH) based on an analysis of subject headings assigned to 1,218,867 national bibliographies from 2003 to 2022. The findings of the study are as follows: Firstly, among all subject headings in the NLSH, there were 257,103 preferred terms, accounting for 50.2% of the total terms. Foreign language terms constituted 33% (169,466), while non-preferred terms comprised 12% (61,442). Among the preferred terms, 57,312 subject headings were used, accounting for 22.3%. However, it was observed that 54.7% (31,351) of these subject headings were assigned less than 5 times, indicating that only a small number of subject headings were frequently utilized. Secondly, the frequency of relationship indicators appeared in the order of RT, BT, and NT. The NLSH consisted of 12,602 top-level subject headings and 143,704 lowest-level subject headings, with a maximum depth of 17 levels. Thirdly, on average, 1.72 subject headings were assigned per bibliographic record. The number of subject headings assigned and the depth of the hierarchy increased for materials with more specific contents. Recent bibliographic records have been assigned more subject headings and deeper into the hierarchy of the NLSH. It was also found that the number of subject headings assigned per bibliography varied depending on the main class of KDC. Based on the findings, it is recommended to evaluate the coverage of terms in the NLSH, reorganize hierarchical relationships and depth of subject headings, and enhance the development of subdivisions within the NLSH.

정보관리학회지