바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 정보단위, 검색결과: 22
초록보기
초록

시맨틱 라이브러리는 의미사전을 구축함으로써 EDI 전자문서의 교환에 활용될 수 있다. 본 논문은 실무 개발자들이 메타데이터를 이용한 의미사전을 개발하는 과정에서 참고할 수 있는 시맨틱 라이브러리 설계정보를 기술한다. 시맨틱 라이브러리를 구성하는 요소로는 크게 시맨틱 요소(Semantic Element)와 시맨틱 단위(Semantic Unit), 매핑 테이블(Mapping Table) 등 3개로 구성된다. 본 논문에서는 이러한 구성요소들의 기본적인 특성과 개발 관련 설계 방법을 제안한다. 또한 이러한 구성요소와 제반 규칙을 준용하여 메타 데이터 간 의미적 교환을 위한 사전을 구축한 사례를 소개한다.

Abstract

Semantic libraries can be used for EDI messages to exchange by implementing the semantic dictionaries. This paper describes the design information of semantic libraries for the field engineers to implement the semantic dictionary using metadata. The components of semantic libraries are semantic elements, semantic units and mapping tables. The basic characteristics and design methods related implementing are proposed. Also the metadata semantic dictionaries including the components and rules are introduced.

12
심지영(연세대학교 대학도서관발전연구소) 2023, Vol.40, No.4, pp.279-306 https://doi.org/10.3743/KOSIM.2023.40.4.279
초록보기
초록

본 연구는 다양한 관점의 이용요구가 혼재되어있는 독서자료의 속성을 파악하기 위해, 도서의 동시이용(동시대출, 동시구매) 데이터에 기반하여 독서자료의 선택 및 이용과 관계된 서지적 속성을 분석하였다. KDC 주제, 독자대상, 이용자 연령 관련 26개 하위 속성 단위로 구분하여 서지적 속성 용어의 동시출현행렬을 생성하고 네트워크 분석을 수행한 결과, 독서자료의 서지적 속성의 세부 내용 및 두드러진 매개 역할을 파악하였다. 본 연구의 결과는 향후 도서관 OPAC을 비롯한 독서정보 시스템의 패싯 설계에 도움이 될 것이다.

Abstract

This study analyzed bibliographic attributes related to the selection and use of reading materials based on data on books borrowed or purchased together in order to understand the properties of reading materials that have complex user needs from various perspectives. As a result of creating co-occurrence matrices of bibliographic attribute terms by dividing them into 26 sub-attribute units related to KDC main class, target reader, and user age, and performing network analyses, the details and prominent mediating role of bibliographic attributes of reading materials were identified. The results of this study will be helpful in designing facets of reading information systems, including library OPAC, in the future.

13
오상훈(명지대학교) ; 최영선(한국디지털콘텐츠산업협회) 2008, Vol.25, No.4, pp.5-23 https://doi.org/10.3743/KOSIM.2008.25.4.005
초록보기
초록

국립중앙도서관에서 인쇄 출판물을 대상으로 운영 중인 납본체계와는 달리 웹 아카이빙인 OASIS (Online Archiving & Searching Internet Sources)는 웹 사이트, 웹 자원 등의 온라인 디지털 자원을 대상으로 자원 수집, 관리 및 보존하기 위한 과정이 필요하다. 이에 본 논문에서는 웹 아카이빙을 위한 디지털 자원 납본 프로세스를 개발하기 위해 디지털 자원 납본 주체와 대상을 정의하였고, 납본 프로세스를 위한 단계별 정의와 기능을 명시하였다. 또한 디지털 납본 시스템 구성을 위한 업무 흐름도와 단위 업무에 따른 기능 정의와 정보 흐름을 위한 구조를 제시하였다.

Abstract

The National Library of Korea is administering a legal deposit system for the printed- publications. Whereas, OASIS(Online Archiving & Searching Internet Sources) has to design a system to collect, manage and preserve web sites and web resources for Web Archiving. The purpose of this study is to develop a digital deposit process for digital resources. As a result, this study defines the subjects and objects for digital deposits, and describes the definitions and the functions according to digital deposit steps. Also, this study designs the data flow diagram and proposes the function definitions on unit works and the structure for the flow of information.

초록보기
초록

웹의 보도기사에 관한 자동요약시스템을 구축하기 위하여 담화구조와 지식기반 기법을 적용한 글구조 프레임과 제 규칙들을 작성하였다. 프레임에는 문단과 문장 및 절의 역할, 문단과 문장의 성질, 역할을 구분하는 판별규칙, 주요문장 발췌규칙, 그리고 요약문작성규칙 슬롯이 포함되었다. 문맥정의, 고유명사 등을 안내하는 ‘if-needed'와 변화된 슬롯 값을 알려주는 if-changed 패싯도 구비되었다. 슬롯이나 패싯의 실제 값들을 추출 표현하는 과정에서 문구의 수사적 역할과 단어 최상위 범주 및 줄거리 단위를 참조하였다. 의미흐름의 연결성을 유지하면서 요약 문장들을 통합, 분리, 합성하는 재구성은 유사도공식, 구문정보, 담화구조와 지식기반 방법에서 도출한 제 규칙 및 문맥정의를 이용하였고 비평과 같은 새로운 문장을 생성하였다.

Abstract

The writings frame and various rules based on discourse structure and knowledge-based methods were applied to construct the automatic Ext/Sums (extracts & summaries) system from the straight news in web. The frame contains the slot and facet represented by the role of paragraphs, sentences, and clauses in news and the rules determining the type of slot. Rearrangement like Unification, separation, and synthesis of the candidate sentences to summary, maintaining the coherence of meanings, were also used the rules derived from similar degree measurement, syntactic information, discourse structure, and knowledge-based methods and the context plots defined with the syntactic/semantic signature of noun and verb and category of verb suffix. The critic sentence were tried to insert into summary

초록보기
초록

기본의미등록기(BSR)는 전자상거래 및 EDI 관련 시스템 사이의 상호연동을 가능하게 하기 위한 등록기이다. XML 기반 BSR 등록개체들의 구조정보나 다양한 관계의 자동추출은 현재 불가능하다. 이 연구에서는 BSR에 등록되는 정보를 자원기술-프레임웍(RDF)과 웹온톨로지언어(OWL)에 기반하는 기계가독형으로 정의한 대표적인 예를 제시하고 결론적으로 5개의 기본 권고안을 도출하였다. 즉 BSR 컴포넌트 소속의 클래스 정의에서 동의어의 표현에는 OWL의 'sameAs', 유사어 표현에는 OWL의 'equivalenlClass', BSR 개념들 간의 상.하 관계 표현은 RDF 스키마의 'subClassOF', BSR의 의미단위(BSU)에 관한 정의는 RDF 스키마의 'label', 인스턴스 용례에 관한 설명은 RDF 스키마의 'comment', 각 BSU의 클래스 소속에 관한 정의는 RDF 스키마의 'domain', BSU가 취할 수 있는 데이터유형에 대한 정의는 RDF 스키마의 'range'등을 적용하며, 나아가 BSR 데이터요소의 정의에 XML 스키마의 데이터 유형을 접목시키고 BSU들 간의 상.하 관계 표현에 RDF 스키마의 'subPropertyOF'를 적용할 것을 추천하였다.

Abstract

The Basic Semantic Register(BSR) is and official ISO register designed for interoperability among eBusiness and EDI systems. The entities registered in the current BSR are not defined in a machine-understandable way, which renders automatic extraction of structural and relationship information from the register impossible. The purpose of this study is to offer a framework for designing an ontology that can provide semantic interoperability among BSR-based systems by defining data structures and relationships with RDF and OWL, similar meaning by the 'equivalentClass' construct in OWL, the hierachical relationships among classes by the 'subClassOf' construct in RDF schema, definition of any entities in BSR by the 'label' construct in RDF schema, specification of usage guidelines by the 'comment' construct in RDF schema, assignment of classes to BSU's by the 'domain' construct in RDF schema, specification of data types of BSU's by the 'range' construct in RDF schema. Hierarchical relationships among properties in BSR can be expressed using the 'subPropertyOf' in RDF schema. Progress in semantic interoperability can be expected among BSR-based systems through applications of semantic web technology suggested in this study.

16
김선우(경기대학교 문헌정보학과) ; 고건우(경기대학교 문헌정보학과) ; 최원준(한국과학기술정보연구원 콘텐츠 큐레이션센터) ; 정희석(한국과학기술정보연구원 콘텐츠 큐레이션센터) ; 윤화묵(한국과학기술정보연구원 콘텐츠큐레이션센터) ; 최성필(경기대학교) 2018, Vol.35, No.4, pp.141-164 https://doi.org/10.3743/KOSIM.2018.35.4.141
초록보기
초록

최근 학술문헌의 양이 급증하고, 융복합적인 연구가 활발히 이뤄지면서 연구자들은 선행 연구에 대한 동향 분석에 어려움을 겪고 있다. 이를 해결하기 위해 우선적으로 학술논문 단위의 분류 정보가 필요하지만 국내에는 이러한 정보가 제공되는 학술 데이터베이스가 존재하지 않는다. 이에 본 연구에서는 국내 학술문헌에 대해 다중 분류가 가능한 자동 분류 시스템을 제안한다. 먼저 한국어로 기술된 기술과학 분야의 학술문헌을 수집하고 K-Means 클러스터링 기법을 활용하여 DDC 600번 대의 중분류에 맞게 매핑하여 다중 분류가 가능한 학습집합을 구축하였다. 학습집합 구축 결과, 메타데이터가 존재하지 않는 값을 제외한 총 63,915건의 한국어 기술과학 분야의 자동 분류 학습집합이 구축되었다. 이를 활용하여 심층학습 기반의 학술문헌 자동 분류 엔진을 구현하고 학습하였다. 객관적인 검증을 위해 수작업 구축한 실험집합을 통한 실험 결과, 다중 분류에 대해 78.32%의 정확도와 72.45%의 F1 성능을 얻었다.

Abstract

Recently, as the amount of academic literature has increased rapidly and complex researches have been actively conducted, researchers have difficulty in analyzing trends in previous research. In order to solve this problem, it is necessary to classify information in units of academic papers. However, in Korea, there is no academic database in which such information is provided. In this paper, we propose an automatic classification system that can classify domestic academic literature into multiple classes. To this end, first, academic documents in the technical science field described in Korean were collected and mapped according to class 600 of the DDC by using K-Means clustering technique to construct a learning set capable of multiple classification. As a result of the construction of the training set, 63,915 documents in the Korean technical science field were established except for the values ​​in which metadata does not exist. Using this training set, we implemented and learned the automatic classification engine of academic documents based on deep learning. Experimental results obtained by hand-built experimental set-up showed 78.32% accuracy and 72.45% F1 performance for multiple classification.

17
김영범(전남대학교 대학원 기록관리학 석사) ; 장우권(전남대학교 문헌정보학과 교수) 2023, Vol.40, No.3, pp.99-118 https://doi.org/10.3743/KOSIM.2023.40.3.099
초록보기
초록

이 연구의 목적은 기록물의 맥락정보를 담고 있는 메타데이터를 활용하여 기록물 자동분류 과정에서의 성능요소를 파악하는데 있다. 연구를 위해 2022년 중앙행정기관 원문정보 약 97,064건을 수집하였다.수집한 데이터를 대상으로 다양한 분류 알고리즘과 데이터선정방법, 문헌표현기법을 적용하고 그 결과를 비교하여 기록물 자동 분류를 위한 최적의 성능요소를 파악하고자 하였다. 연구 결과 분류 알고리즘으로는 Random Forest가, 문헌표현기법으로는 TF 기법이 가장 높은 성능을 보였으며, 단위과제의 최소데이터 수량은 성능에 미치는 영향이 미미하였고 자질은 성능변화에 명확한 영향을 미친다는 것이 확인되었다.

Abstract

The objective of this study is to identify performance factors in the automatic classification of records by utilizing metadata that contains the contextual information of records. For this study, we collected 97,064 records of original textual information from Korean central administrative agencies in 2022. Various classification algorithms, data selection methods, and feature extraction techniques are applied and compared with the intent to discern the optimal performance-inducing technique. The study results demonstrated that among classification algorithms, Random Forest displayed higher performance, and among feature extraction techniques, the TF method proved to be the most effective. The minimum data quantity of unit tasks had a minimal influence on performance, and the addition of features positively affected performance, while their removal had a discernible negative impact.

18
최형욱(이화여자대학교 일반대학원 문헌정보학과) ; 최예진(이화여자대학교 일반대학원 문헌정보학과) ; 남소연(이화여자대학교 일반대학원 문헌정보학과) 2018, Vol.35, No.2, pp.89-114 https://doi.org/10.3743/KOSIM.2018.35.2.089
초록보기
초록

학문 분야의 연구 동향 변화에 대한 연구는 해당 분야의 세부 연구주제와 구조에 대한 파악뿐만 아니라 시간 흐름에 따른 변화 모습을 관찰할 수 있는 방법이다. 이에 본 연구에서는 국내 문헌정보학 분야의 연구 동향을 살펴보기 위하여 2003년부터 2017년까지 한국학술지인용색인(KCI)에 등재된 문헌정보학 분야 학술지 중 인용지수가 가장 높은 3종에 개제된 논문의 한국어 저자키워드를 대상으로 동시출현단어 분석을 수행하였다. 시계열 분석을 위해 15년의 연구 기간을 5년 단위로 누적하여 2003년~2007년, 2003년~2012년, 2003년~2017년으로 구분하였고, 기간별로 출현빈도 10회 이상의 저자키워드를 선정하여 분석하고 이를 시각화하였다. 분석 결과, 2003년~2007년 기간의 지적구조는 총 25개의 키워드로 구성된 8개의 영역이 확인되었으며, 2003년~2012년 기간의 지적구조에서는 총 76개의 키워드로 구성된 3영역 17 군집이 확인되었다. 또한, 2003년~2017년 기간의 지적구조는 총 132개의 키워드로 구성된 6영역 32군집으로 나타났다. 누적 기간별 종합 분석 결과, 한국의 문헌정보학 분야는 지난 15년간 기간별로 새로운 키워드가 포괄적으로 추가되었으며, 세부 주제 역시 세분화 되어 점차 세분화되고 확장되고 있음을 확인하였다.

Abstract

Research on changes in research trends in academic disciplines is a method that enables observation of not only the detailed research subject and structure of the field but also the state of change in the flow of time. Therefore, in this study, in order to observe the changes of research trend in library and information science field in Korea, co-word analysis was conducted with Korean author keywords from three types of journals which were listed in the Korea Citation Index(KCI) and have top citation impact factor were selected. For the time series analysis, the 15-year research period was accumulated in 5-years units, and divided into 2003~2007, 2003~2012, and 2003~2017. The keywords which limited to the frequency of appearance 10 or more, respectively, were analyzed and visualized. As a result of the analysis, during the period from 2003 to 2007, the intellectual structure composed with 25 keywords and 8 areas was confirmed, and during the period from 2003 to 2012, the structure composed by 3 areas 17 sub-areas with 76 keywords was confirmed. Also, the intellectual structure during the period from 2003 to 2017 was crowded into 6 areas 32 consisting of a total of 132 keywords. As a result of comprehensive period analysis, in the field of library and information science in Korea, over the past 15 years, new keywords have been added for each period, and detailed topics have also been subdivided and gradually segmented and expanded.

19
신유미(상명대학교 문헌정보학과) ; 박옥남(상명대학교) 2019, Vol.36, No.2, pp.105-131 https://doi.org/10.3743/KOSIM.2019.36.2.105
초록보기
초록

본 연구는 장서개발관리 분야의 최근 연구동향을 분석함으로써 핵심 연구주제를 파악하고 학문의 지적구조를 규명하고자 하였다. 2003년부터 2017년까지 15년간 문헌정보학 분야 4개 학회지에 등재된 논문 중 장서개발관리 분야의 키워드를 가진 연구논문을 선정하여 저자키워드를 추출하였다. 추출된 저자키워드를 가지고 NetMiner4 프로그램을 이용하여 키워드 네트워크를 구성한 뒤 빈도분석, 연결중심성 분석, 매개중심성 분석을 수행하였다. 분석은 시간의 흐름에 따른 연구 변화를 살펴보기 위하여 2003년부터 2017년까지 전 구간을 대상으로 한 분석과 5년 단위의 3구간으로 나누어 살펴보았다. 연구결과, ‘오픈액세스’, ‘기관 레포지터리’, ‘학술지’ 등의 장서개발관리 분야의 핵심키워드를 파악하고, ‘대학도서관’ 등의 계속 연구될 분야의 주제어를 파악하였다.

Abstract

The purpose of this study is to investigate the development direction of future scholarship by analyzing recent research trends in collection development and management field using keyword network analysis. Data was collected from four journals in library and information science field during period of 2003 to 2017. Related articles of Collection Development and Management field were retrieved, and author keywords were extracted from selected papers. Keyword network analysis using NetMiner4 program was performed based on frequency analysis, connection-centered analysis, and parametric analysis. The analysis covers all sections from 2003 to 2017 to look at the changes in research over time, and three sections on five-year basis. As a result, main keywords such as ‘open access’, ‘institutional repository’ and ‘academic journals’ were identified, and topics to be continuously researched were identified.

초록보기
초록

본 연구에서는 FRBR의 저작 단위로 태그(tag)가 부여되고 있는 LibraryThing에 나타난 태그를 활용하여, 소설(Fiction) 분야 태그들의 특성, 패턴의 형식적인 측면과 동시에 태그의 내용 분석을 시도하였다. 저작의 서지사항 기술 용어, LCSH 용어와 비교하여 관련 정도를 파악하였고, 이에 포함되지 않는 기타 태그의 출처는 어디인지, 저작의 어떤 측면을 표현하고 있는지, 저작과 연계하여 태그의 용어를 살펴보았다. 특히 소설이란 한 분야로 한정함으로써, 소설만이 가지는 특성인 소설의 3요소(주제, 구성, 문체), 소설 구성의 3요소(인물, 사건, 배경)를 반영한 태그를 파악하여, 향후 소설 정보의 조직 및 검색 요소로서 활용할 수 있는 가능성을 보여주었다. 이를 통해 기존의 색인어를 보완하는 폭소노미 태그의 역할을 규명하고 태깅시스템이 나아갈 새로운 방향을 제시하였다.

Abstract

This study aims to analyze the properties of the tags used in the fiction genre, the structural aspect of the patterns and the contents of the tags by utilizing LibraryThing, where the tags are assigned in work units of FRBR. A comparative analysis was conducted in terms of the level of association between the descriptive terms in bibliography and LCSH terms. The study also examined the sources of the tags not included in the bibliographic descriptions or LCSHs, what aspects of work they represented, and the terms used as tags in relation to the work. By restricting the study to a single genre, a number of tags that reflected the characteristics of fiction (three elements of the fiction which are theme, plot, style and three elements of the fiction composition which are character, event, setting) were extracted. This study finds out the role of the tag making up the taxonomy and proposes a new direction for the tagging system by demonstrating the possibility of using tags as facets in information organization and retrieval.

정보관리학회지