바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: information problem, 검색결과: 74
51
이현실(원광대학교) ; 한성국(원광대학교) 2004, Vol.21, No.2, pp.249-267 https://doi.org/10.3743/KOSIM.2004.21.2.249
초록보기
초록

MARC는 목록 데이터를 상세하게 정의할 수 있는 장점이 있지만, 개념요소가 구조화 되어 있지 않고 표현체계가 복잡하기 때문에 단순 계층구조의 의미 어휘 체계를 지원하는 XML DTD나 RDF/S로는 그 구조를 모델화하기가 어렵다. 본 연구에서는 MARC의 데이터 요소를 추상화하여 목록 데이터의 개념 구조를 표현하는 서지 온톨로지를 구축하였으며, 개념간의 논리 관계와 프로퍼티의 카디널리티 및 프로퍼티 값에 대한 논리적 제한을 부가할 수 있는 OWL을 이용하여 MRAC 필드의 복합 구조를 모델링하여 구축한 목록 온톨로지를 구현하였다. 온톨로지 언어를 이용한 MARC 데이터를 기술 방법은 목록 데이터에 대한 메타데이터 구성과 목록의 호환성 문제를 해결할 수 있는 기초적 방안이 되며, 시맨틱 웹 서비스를 기반으로 하는 차세대 문헌 정보서비스 시스템 구현의 토대가 될 것이다.

Abstract

Although MARC can define the detail cataloguing data, it has complex structures and frameworks to represent bibliographic information. On account of these idiosyncratic features of MARC, XML DTD or RDF/S that supports simple hierarchy of conceptual vocabularies cannot capture MARC formalism effectively. This study implements bibliographic ontology by means of abstracting conceptual relationships between bibliographic vocabularies of MARC. The bibliographic ontology is formalized with OWL that can represent the logical relations between conceptual elements and specify cardinality and property value restrictions. The bibliographic ontology in this study will provide metadata for cataloguing data and resolve compatibility problems between cataloguing systems. And it can also contribute the development of next generation bibliographic information system using semantic Web services.

초록보기
초록

우리나라 대학도서관에서는 디지털 패러다임에 적합한 디지털 정보자원을 구축하여 서비스를 제공하고 있으며 이를 위하여 디지털 보존에 힘써왔지만, 아직까지 본격적으로 연구되고 논의되지 않고 있다. 디지털 보존은 인쇄매체 보존 방법과 상이하게 다르므로 디지털 정보자원의 안정성과 기능성을 최대한 확보, 유지할 수 있도록 보존전략을 강구해야 할 필요가 있다. 본 연구는 대표적인 디지털 정보자원의 보존기술인 매체재생, 매체변환, 포맷변환, 정보전환, 에뮬레이션 기술의 대학도서관에서의 사용정도와 대학도서관의 디지털 정보관리 담당자들이 생각하는 각각의 보존 기술에 대한 위험가능성과 위험영향력을 조사하여 위험관리 분석을 하였다. 그 결과, 가장 빈번히 사용하되 있는 기법은 포맷변환이고 전혀 사용하지 않고 있는 기법은 에뮬레이션임을 알 수 있었다. 또한 위험이 발생할 확률과 데이터 손실 영향력이 가장 낮은 방법은 매체재생인 것으로 판명되었고 가장 높은 것은 에뮬레이션 기법과 정보전환으로 나타났고 사서들은 디지털 보존활동을 전문적으로 수행할 전담 담당자가 없는 경우 위험발생 확률이 제일 높을 것으로 보았다.

Abstract

University libraries have developed digital information resources for digital services and have tried to preserve valuable digital information. Because digital preservation raises challenges of a fundamentally different nature which we added to the problems to preserving traditional format materials, it is necessary that preserving digital resources must be discussed and researched actively. This study conducts risk management for exploring preserving technologies and assessing tools. It is found that most university libraries have used format conversion frequently and do not use the emulation technology. It is also found that medium refreshing has the lowest risk probability and isk impact, but information migration and emulation technology have the highest in the risk probability and in the risk impact individually and the absence of full-time professional staff causes high risk.

초록보기
초록

본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.

Abstract

This study compared and analyzed 15 CBMR (Content-based Music Retrieval) systems accessible on the web in terms of DB size and type, query type, access point, input and output type, and search functions, with reviewing features of music information and techniques used for transforming or transcribing of music sources, extracting and segmenting melodies, extracting and indexing features of music, and matching algorithms for CBMR systems. Application of text information retrieval techniques such as inverted indexing, N-gram indexing, Boolean search, truncation, keyword and phrase search, normalization, filtering, browsing, exact matching, similarity measure using edit distance, sorting, etc. to enhancing the CBMR; effort for increasing DB size and usability; and problems in extracting melodies, deleting stop notes in queries, and using solfege as pitch information were found as the results of analysis.

54
강윤아(전북대학교) ; 조영준(㈜ 아이와즈, 솔루션개발팀) ; 김민정(국가기록원 기록서비스부 서비스정책과) ; 오효정(전북대학교) 2022, Vol.39, No.4, pp.99-125 https://doi.org/10.3743/KOSIM.2022.39.4.099
초록보기
초록

하나의 기록을 이해하기 위해서는 기록의 내용뿐 아니라 그 기록의 생산배경과 업무 맥락을 함께 파악해야 한다. 또한 다양한 부서와 기관에 흩어져 있는 관련 기록들을 쉽게 찾을 수 있는 기능도 필요하다. 따라서 기록 검색서비스에서 정보 간의 ‘연계’는 갈수록 중요해지고 있다. 국가기록원 역시 영구기록관리시스템의 검색서비스 기능으로 ‘연계’를 강조하고 있지만, 정작 국가기록포털을 살펴보면 전거정보의 연계 부족, 독립적으로 존재하는 내부 서비스와 콘텐츠, 유관 기관과의 연계 부재 등의 문제가 확인된다. 본 연구는 이와 같은 국가기록포털의 한계를 해결하고자, 이상적인 연계서비스를 구축한 기록관리 선진기관을 선정하여 이들 기관의 연계구조를 전반적으로 확인하고, 연계구조 중 타 기록관리 기관에서 볼 수 없었던 특이점과 국가기록포털에서 차용 가능한 요소를 도출하였다. 다음으로, 국가기록포털 연계구조의 현황을 분석하여 연계가 이루어지지 않은 부분을 비롯해 연계방식을 개선해야 할 항목 등을 규명, 이를 해결하기 위한 구체적인 개선방안을 제시하였다. 본 연구의 목적은 국가기록포털의 개선된 연계 서비스를 통해 이용자의 검색 만족도를 높이고, 소장기록 및 기 구축된 내부 서비스와 콘텐츠의 접근성 및 활용성을 향상시키는 데에 있다.

Abstract

In order to understand a record, not only the contents of the record but also the production background and work context of the record must be grasped. It also requires a function that makes it easy to find related records scattered across various departments and agencies. Accordingly, the ‘linkage’ of information in archival information services is becoming more important. NAK also emphasizes ‘linkage’ as a search service function of the archives management system, but some problems were identified at the National Archives Portal Service (NAPS) such as a lack of linkage with authority data, disruption of internal service, and absence of linkage with other related organizations. To solve the limitations of the NAPS, we selected and analyzed advanced record management institutions that have built an ideal linkage service; checked the overall linkage structure of these institutions; and identified characteristics that could not be seen by other institutions. Also, elements that can be adopted from the NAPS were derived. Next, the current status of the NAPS linkage structure was analyzed to identify the parts that were not linked and the items that need to be improved in the linkage method, and specific advancement plans were suggested to solve these problems. The purpose of this study is to increase users’ satisfaction with search and to advance the accessibility and utilization of records and internal services through improved linkage services of NAPS.

초록보기
초록

학술 문헌 원문에서 발견되는 인용문은 인용에 기초한 학술문헌 자동 요약, 리뷰 논문 자동 생성, 인용문 감성 분석, 인용문 기반 문헌 검색 등 다양한 학술 정보 서비스의 창출을 가능케 한다. 이러한 서비스가 가능하기 위해서는 원문 텍스트로부터 인용문의 자동 인식이 선행되어야 한다. 그러나 인용문의 인식은 인용 표지가 부착되지 않은 암묵 인용문의 존재로 인해 그 처리가 용이하지 않다. 영어의 경우 최근 이에 대한 연구가 집중되고 있으나 한국어 학술 문헌 내 인용문의 자동 인식 연구는 찾기 힘들다. 이 논문은 한국어 인용문을 자동 인식하는 규칙 기반의 방법을 제시하고 다양한 베이스라인 기법들과 인용문 인식 성능을 비교하였다. 제안된 방법은 테스트 셋 내 전체 암묵 인용문의 30%를 약 70%의 정확률로 인식할 수 있었다.

Abstract

Identifying citing sentences from article full-text is a prerequisite for creating a variety of future academic information services such as citation-based automatic summarization, automatic generation of review articles, sentiment analysis of citing statements, information retrieval based on citation contexts, etc. However, finding citing sentences is not easy due to the existence of implicit citing sentences which do not have explicit citation markers. While several methods have been proposed to attack this problem for English, it is difficult to find such automatic methods for Korean academic literature. This article presents a rule-based approach to identifying Korean citing sentences. Experiments show that the proposed method could find 30% of implicit citing sentences in our test data in nearly 70% precision.

56
김성욱(전북대학교 문헌정보학과 석사과정) ; 김선태(전북대학교 문헌정보학과) 2020, Vol.37, No.3, pp.77-106 https://doi.org/10.3743/KOSIM.2020.37.3.077
초록보기
초록

본 연구에서는 학제 간 연구가 가장 활발하고 응용가능성이 가장 높은 응집물질물리분야의 연구데이터를 체계적으로 관리하기 위한 개선방안을 제안하였다. 이를 위해 연구데이터 관리 도구인 Data Asset Framework (DAF)와 데이터 공유 및 재사용을 위한 FAIR원칙을 바탕으로 설문 내용을 구성하여 14명의 연구자를 대상으로 응집물질물리분야의 연구데이터 관리 현황을 수집하였다. 수집된 데이터는 설문에 응답한 연구자의 특성 및 기초정보, 데이터 보존 및 관리, 데이터 공유 및 접근에 관한 데이터로 구성되었다. 수집된 설문결과를 분석하여 응집물질물리분야의 연구데이터 특징과 데이터 수집과 생산, 데이터 보존과 관리, 데이터 공유 및 접근에 대한 9가지 문제점을 도출하였으며, 각 측면에서 도출된 문제점에 대한 개선방안을 제언하였다.

Abstract

In this study, we proposed a method to systematically manage research data in the field of condensed matter physics, which is the most active and interdisciplinary field. In the course of the research, a questionnaire was conducted for researchers in the field of condensed matter physics. The questionnaire was constructed based on the research data management tool Data Asset Framework (DAF) and the FAIR principle for data sharing and reuse. The current status of research data management in the field of aggregated material physics was collected from 14 researchers. The collected data consisted of data on the characteristics and basic information of researchers who answered the questionnaire, data preservation and management, and data sharing and access. By analyzing the collected questionnaire results, nine problems were drawn about the characteristics of research data in the field of aggregate material physics, data collection and production, data preservation and management, data sharing and access. In this study, suggestions were made to improve the problems derived from each aspect.

초록보기
초록

서지레코드의 기술에 있어서 책임표시는 저작의 지적 책임 소재를 밝혀 주고 접근점을 구성하는 바탕이 된다. 그런데 목록규칙에서는 책임표시를 주된 역할과 부차적 역할로 나누고, 이에 따라 기술방법을 달리 하는데 치중하는 문제점이 있다. 역할의 중요도를 판단하여 순서를 매기기보다는 역할 자체를 구조화시키는 것이 우선이기 때문이다. 또한 목록에서 주저자를 선정한 것은 책임성에 따른 것보다는 저록의 작성이나 배열과 관련된 실무적 결정이었다. 이에 본 연구에서는 역할 자체를 구조화함으로써 책임표시 기술방식을 개선하고자 하였다. 즉, 역할어를 체계적으로 기술하여 서지레코드에서 분산되거나 접근점에서 제외된 책임표시를 집중시키는 것이다. 나아가 이를 통해 책임표시 정보의 품질을 제고하고, 역할어를 검색의 패싯이나 전거레코드의 추가적인 식별 정보로도 활용할 수 있음을 제안하였다.

Abstract

Statement of responsibility in bibliographical records plays a key role in clarifying intellectual responsibility of the work, and it also plays a role in making up access points. However, cataloging rules for the statement of responsibility mostly deal with the distinction between the principal role and minor roles. This becomes a problem because the responsibility type itself is more important than the order of the types. For this reason, in this paper I will explore improvements of the description methods of statement of responsibility by organizing the role indicators. Namely, using the role indicators more effectively than the current description methods do, we can collocate the dispersed statements of responsibilities. The role indicators can also be used for an author facet in information retrieval and can provide additional information for authority control.

58
김정현(전남대학교) ; 배주연(전남대학교) 2005, Vol.22, No.4, pp.5-22 https://doi.org/10.3743/KOSIM.2005.22.4.005
초록보기
초록

광고산업과 미디어의 발전에 따라 광고물의 증가뿐만 아니라 광고와 관련한 많은 연구가 이루어지고 있으며, 그 결과 광고 관련 자료가 꾸준히 증가하고 있는 추세이다. 그런데 KDC 광고분야의 분류체계를 살펴보면 광고관련 분류항목이 너무나 미비하며, 더욱이 주류 배치에 있어 관련 학문과의 연관성을 고려하지 않아 사서나 이용자 모두에게 혼란을 초래하고 있다. 이러한 점을 감안하여 본 연구에서는 광고의 유형 및 학문적 특성에 대해 고찰하고, KDC를 비롯한 NDC, DDC, LCC와 같은 문헌분류법 및 광고 전문도서관, 그리고 인터넷 포털사이트와 인터넷서점 등의 분류체계를 분석함으로써 KDC 광고분야의 분류체계에 대한 문제점을 알아보고 이에 대한 개선방안을 제시하였다.

Abstract

As the development of advertising industry and media the research about an advertisement get accomplished. As the result information resources called on the advertising materials are on an increasing trend. However, it looks into the classification system in advertising field of KDC, the problems are as the follows: ① the classification items are too incomplete, ② the main class is badly arranged. The reason have no regard for the correlation with a science. So, it gives rise to confusion to the librarian and user. The purpose of the study is to present the improvement plan on the classification system in advertising field of KDC. In order to build the improvement plan, the four steps are utilized. The first step is to investigate the characteristic of sciences on advertising and a type. The second one is to survey the current status of the library classification as KDC, NDC, DDC, and LCC. The third one is to analyse the classification system of library and web site on the advertising. The forth one is to grasp the problems on the classification system in advertising field of KDC.

59
명순희(용인송담대학) ; 김인철(경기대학교) 2002, Vol.19, No.4, pp.35-51 https://doi.org/10.3743/KOSIM.2002.19.4.035
초록보기
초록

본 논문에서는 다중 모델 기계학습 기법을 이용하여 자동 문서 분류의 성능과 신뢰도를 향상시킬 수 있는 연구와 실험 결과를 기술하였다. 기존의 다중 모델 기계 학습법들이 훈련 데이터 또는 학습 알고리즘의 편향에 의한 오류를 극복하고자 한 것인데 비해 본 논문에서 제안한 메타 학습을 이용한 하이브리드 다중 모델 방식은 이 두 가지의 오류 원인을 동시에 해소하고자 하였다. 다양한 문서 집합에 대한 실험 결과. 본 논문에서 제안한 하이브리드 다중 모델 학습법이 전반적으로 기존의 일반 다중모델 학습법들에 비해 높은 성능을 보였으며, 다중 모델의 결합 방식으로서 메타 학습이 투표 방식에 비해 효율적인 것으로 나타났다.

Abstract

Inductive learning and classification techniques have been employed in various research and applications that organize textual data to solve the problem of information access. In this study, we develop hybrid model combination methods which incorporate the concepts and techniques for multiple modeling algorithms to improve the accuracy of text classification, and conduct experiments to evaluate the performances of proposed schemes. Boosted stacking, one of the extended stacking schemes proposed in this study yields higher accuracy relative to the conventional model combination methods and single classifiers.

초록보기
초록

최근 문화콘텐츠 관련 기관들은 분산 네트워크를 통해 이용자에게 문화콘텐츠의 접근을 점차 확대시키고 있다. 그러나 문화콘텐츠의 특성상 일반 콘텐츠와 달라서 많은 문화콘텐츠 객체는 정보의 조직과 검색에 사용할 수 있는 단어를 거의 포함하고 있지 못하다. 이러한 문화콘텐츠 시스템이 서비스 될 경우, 효율적으로 자원을 식별하고 검색할 수 없게 될 뿐 아니라 다양한 문화콘텐츠 메타데이터 요소간의 명칭, 표현, 의미가 상이하여 시스템간 연동이나 정보공유가 어렵게 된다. 이러한 문제를 해결하기 위해 문화콘텐츠의 속성에 적합한 표준화된 메타데이터의 조직과 관리가 필요하다. 본 연구는 문화콘텐츠 분야에서 다야하게 접근되고 있는 메타데이터 포맷인 Dublin Core, EAD, VRA, CDWA, CIMI. Object ID를 중심으로 각 포맷의 데이터 요소를 비교 분석함으로써 상이한 메타데이터 포맷의 상호운용성 확보를 통하여 문화콘텐츠 통합을 위한 기초 자료를 제공하고자 하였다.

Abstract

Recently, the organizations related to cultural contens are gradually expanding access to cultural contents for general public through the distributed network. However, since cultural contents have different characteristics than general contents, the objects of cultural contents seldom contain the words generally used for organization and seach of information. If the cultural contents system is created without any consideration of such differences, we cannot effectively identify and search resources. Moreover, because the names, expressions and meanings are different between matadata elements of various cultural contents, it is very difficult to interconnect or share information between different systems. In order to solve these problems, proper organization and management of metadata is vital. In this study, we have comparatively analyzed the data elements of each format based on Dublin Core, EAD, VRA, CDWA, CIMI, and Object ID, the metadata formats approached from various aspects in the cultural contents area. Through this study, we tried to provide the basic materials for integration of cultural contents by securing interoperability of different meta formats.

정보관리학회지