바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: metadata, 검색결과: 82
11
김영범(전남대학교 대학원 기록관리학 석사) ; 장우권(전남대학교 문헌정보학과 교수) 2023, Vol.40, No.3, pp.99-118 https://doi.org/10.3743/KOSIM.2023.40.3.099
초록보기
초록

이 연구의 목적은 기록물의 맥락정보를 담고 있는 메타데이터를 활용하여 기록물 자동분류 과정에서의 성능요소를 파악하는데 있다. 연구를 위해 2022년 중앙행정기관 원문정보 약 97,064건을 수집하였다.수집한 데이터를 대상으로 다양한 분류 알고리즘과 데이터선정방법, 문헌표현기법을 적용하고 그 결과를 비교하여 기록물 자동 분류를 위한 최적의 성능요소를 파악하고자 하였다. 연구 결과 분류 알고리즘으로는 Random Forest가, 문헌표현기법으로는 TF 기법이 가장 높은 성능을 보였으며, 단위과제의 최소데이터 수량은 성능에 미치는 영향이 미미하였고 자질은 성능변화에 명확한 영향을 미친다는 것이 확인되었다.

Abstract

The objective of this study is to identify performance factors in the automatic classification of records by utilizing metadata that contains the contextual information of records. For this study, we collected 97,064 records of original textual information from Korean central administrative agencies in 2022. Various classification algorithms, data selection methods, and feature extraction techniques are applied and compared with the intent to discern the optimal performance-inducing technique. The study results demonstrated that among classification algorithms, Random Forest displayed higher performance, and among feature extraction techniques, the TF method proved to be the most effective. The minimum data quantity of unit tasks had a minimal influence on performance, and the addition of features positively affected performance, while their removal had a discernible negative impact.

초록보기
초록

디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다.일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, HYPERLINK "http://www.bls.gov/" http://www.bls.gov/) 및 the Energy Information Administration (EIA, HYPERLINK "http://www.eia.doe.gov/" http://www.eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어,이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

Abstract

As increasingly diverse kinds of information materials are available on the Internet, it becomes a challenge to define an adequate level of metadata provision for each different type of material in the context of digital libraries. This study explores issues of metadata provision for a particular type of material, statistical tables. Statistical data always involves numbers and numeric values which should be interpreted with an understanding of underlying concepts and constructs. Because of the unique data characteristics, metadata in the statistical domain is essential not only for finding and discovering relevant data, but also for understanding and using the data found. However, in statistical metadata research, more emphasis has been put on the question of what metadata is necessary for processing the data and less on what metadata should be presented to users.In this study, a case study was conducted to gauge the status of metadata provision for statistical tables on the Internet. The websites of two federal statistical agencies in the United States were selected and a content analysis method was used for that purpose. The result showing insufficient and inconsistent provision of metadata demonstrate the need for more discussions on statistical metadata from the ordinary web users’ perspective.

초록보기
초록

디지털 정보의 보존을 위해서는 보존활동과 관련된 메타데이터 구축이 필수적이다. 하지만, 현재 디지털 아카이빙에서는 디지털 객체의 보존을 위한 최적화 된 메타데이터 구조가 마련되어 있지 않은 실정이다. 이에 본 연구에서는 디지털 아카이빙의 핵심적인 프로세스를 중심으로 디지털 객체의 기술 및 보존을 지원할 수 있는 메타데이터 패키지를 구축하였다. 본 연구에서 제안한 메타데이터 패키지는 총 4개의 상위요소 및 25개의 세부적인 요소로 구성되어 있으며, 디지털 객체를 보존하는데 필요한 기술사항을 디지털 아카이빙의 핵심적인 단계에 따라 최적화 된 방식으로 제공해 줄 수 있다. 이는 디지털 객체의 보존에 있어 기존의 정보 패키지에 비해 보다 효율적이고 실제적인 기술방식으로 적용될 수 있을 것으로 기대된다.

Abstract

The construction of preservation metadata is a prerequisite for the preservation of digital information. In the current approaches to digital archiving, however, there is no metadata structure optimized to describe preserved digital objects. This research proposed metadata packages that can support the description of digital objects from the perspective of the core processes of digital archiving. The proposed metadata packages consist of 4 wrapper elements and 25 sub-elements. They can provide detailed descriptions required to preserve digital objects in accordance with the core processes of digital archiving. Therefore, the proposed metadata package can be applied to digital archiving as a better approach to the description of digital objects compared to the approaches to information package.

14
이지원(대구가톨릭대학교) 2011, Vol.28, No.1, pp.221-235 https://doi.org/10.3743/KOSIM.2011.28.1.221
초록보기
초록

본 연구는 국내 대학도서관의 전자자원 메타데이터와 관련된 현황을 살펴보고, 정보조직 패러다임 및 목록 환경의 변화에 대응하기 위한 방향성을 제시하기 위함이다. 국내 대학도서관의 전자자원 도입 및 조직과 최근 정보자원 조직의 동향을 살펴보았고, 디지털콘텐츠 구축 건수 상위 30개 대학도서관의 홈페이지를 방문하여 현황과 문제점을 조사하였다. 앞으로 전자자원을 포함한 다양한 유형의 정보자원을 통합적으로 관리하고, 접근성을 강화하여 이용자들에게 확장된 목록의 기능을 제공하여야 할 것이다.

Abstract

This study attempts to investigate the current practice of electronic resources in the academic libraries and to explore the changes of paradigm in the organization of information. It reviewed how academic libraries have acquired and organized electronic resources. It also investigated the library home pages of 30 academic libraries in order to identify the category of electronic resources, metadata, and linkage methods with various material types such as printed resources and theses. To perform extended functions of library catalogs, it is essential for academic libraries to manage the metadata of various resources together and provide enhanced access and linkage of related resources.

15
고영만(성균관대학교) ; 서태설(한국과학기술정보연구원) 2005, Vol.22, No.4, pp.97-109 https://doi.org/10.3743/KOSIM.2005.22.4.097
초록보기
초록

본 연구에서는 정보자원의 메타데이터 작성시 메타데이터 간 의미의 일관성을 유지하기 위한 메타데이터 명명 방법론과 이를 실제 분야에 적용할 수 있는 메타데이터 명명 규칙의 실험적 모형을 제시하였다. 이를 위해 우선적으로 ISO/IEC 11179에서 제시하고 있는 메타데이터 레지스트리 메타모형과 데이터의 기본 속성 및 개념을 논의하였으며, 이러한 논의를 토대로 객체용어(object term)와 속성용어(property term) 및 표현(presentation)에 관한 명명 규칙의 실제 적용 사례를 제시하였다. 객체용어의 생성은 자료유형의 엔터티-관계(E-R) 모형에 근거한 휴리스틱 분석을 통해 이루어졌으며, 속성용어의 명명은 더블린코어의 메타데이터 셋을 기반으로, 표현은 SHOE 1.0 버전을 기반으로 하였다.

Abstract

To build the consistency among different metadata systems and to increase the interoperability of that systems even among different domains, naming rules and glossaries for the data elements are necessary. This study provides discussion of naming and identification of the data element concept, data element, conceptual domain, value domain, and its meta model. This study also describes example naming conventions based on ontology derived from the combination with object, properties, and representation of data elements. The naming principles and rules described in this study use E-R analysis, DC metadata set, and SHOE 1.0 as an example of the scientific documents. This study would be a guideline to build the naming rules of metadata based on ontology in various domains.

16
감미아(연세대학교 문헌정보학과) ; 이지연(연세대학교 문헌정보학과) 2023, Vol.40, No.1, pp.121-148 https://doi.org/10.3743/KOSIM.2023.40.1.121
초록보기
초록

본 연구는 ‘우수한 성능의 메타데이터 속성 유사도 기반의 학술 문헌추천시스템’을 제안하는 데에 목적을 두고 있다. 본 연구에서는 정보조직에서 다루는 메타데이터의 활용과 계량정보학에서 다루고 있는 동시인용, 저자-서지결합법, 동시출현 빈도, 코사인 유사도의 개념을 활용한 문헌정보학 기반의 학술 문헌 추천기법을 제안하고자 하였다. 실험을 위해 수집한 ‘불평등’, ‘격차’ 관련 총 9,643개의 논문 메타데이터를 정제하여 코사인 유사도를 활용한 저자, 키워드, 제목 속성 간의 상대적 좌표 수치를 도출하였고, 성능 좋은 가중치 조건 및 차원의 수를 선정하기 위해 실험을 수행하였다. 실험 결과를 제시하여 이용자의 평가를 거쳤으며, 이를 이용해 기준노드와 추천조합 특성 분석 및 컨조인트 분석, 결과 비교 분석을 수행하여 연구질문 중심의 논의를 수행하였다. 그 결과 전반적으로는 저자 관련 속성을 제한 조합 혹은 제목 관련 속성만 사용하는 경우 성능이 뛰어난 것으로 나타났다. 본 연구에서 제시한 기법을 활용하고 광범위한 표본의 확보를 이룬다면, 향후 정보서비스의 문헌 추천 분야뿐 아니라 사회의 다양한 분야에 대한 추천기법 성능 향상에 도움을 줄 수 있을 것이다.

Abstract

The purpose of this study is to propose a scholarly paper recommendation system based on metadata attribute similarity with excellent performance. This study suggests a scholarly paper recommendation method that combines techniques from two sub-fields of Library and Information Science, namely metadata use in Information Organization and co-citation analysis, author bibliographic coupling, co-occurrence frequency, and cosine similarity in Bibliometrics. To conduct experiments, a total of 9,643 paper metadata related to “inequality” and “divide” were collected and refined to derive relative coordinate values between author, keyword, and title attributes using cosine similarity. The study then conducted experiments to select weight conditions and dimension numbers that resulted in a good performance. The results were presented and evaluated by users, and based on this, the study conducted discussions centered on the research questions through reference node and recommendation combination characteristic analysis, conjoint analysis, and results from comparative analysis. Overall, the study showed that the performance was excellent when author-related attributes were used alone or in combination with title-related attributes. If the technique proposed in this study is utilized and a wide range of samples are secured, it could help improve the performance of recommendation techniques not only in the field of literature recommendation in information services but also in various other fields in society.

초록보기
초록

시맨틱 라이브러리는 의미사전을 구축함으로써 EDI 전자문서의 교환에 활용될 수 있다. 본 논문은 실무 개발자들이 메타데이터를 이용한 의미사전을 개발하는 과정에서 참고할 수 있는 시맨틱 라이브러리 설계정보를 기술한다. 시맨틱 라이브러리를 구성하는 요소로는 크게 시맨틱 요소(Semantic Element)와 시맨틱 단위(Semantic Unit), 매핑 테이블(Mapping Table) 등 3개로 구성된다. 본 논문에서는 이러한 구성요소들의 기본적인 특성과 개발 관련 설계 방법을 제안한다. 또한 이러한 구성요소와 제반 규칙을 준용하여 메타 데이터 간 의미적 교환을 위한 사전을 구축한 사례를 소개한다.

Abstract

Semantic libraries can be used for EDI messages to exchange by implementing the semantic dictionaries. This paper describes the design information of semantic libraries for the field engineers to implement the semantic dictionary using metadata. The components of semantic libraries are semantic elements, semantic units and mapping tables. The basic characteristics and design methods related implementing are proposed. Also the metadata semantic dictionaries including the components and rules are introduced.

18
이유진((주) 아이네크) ; 양성권(서울대학교 치과대학 의생명 지식공학연구실) ; 송민아(서울대학교 치과대학 의생명 지식공학연구실) ; 김홍기(서울대학교) 2009, Vol.26, No.1, pp.215-230 https://doi.org/10.3743/KOSIM.2009.26.1.215
초록보기
초록

MARC, DC, MODS, MarcOnt 등의 서지 메타데이터 모델과 소셜 시맨틱 디지털도서관 사례인 JeromeDL의 메타데이터 모델 및 서지적 개념모델인 FRBR모델 등의 분석을 통해 국내 디지털도서관의 서지메타데이터에 적용 가능한 온톨로지 모델을 제안하고자 한다. 이는 디지털도서관의 다양한 자원형식과 특성을 고려하고, 기존의 서지메타데이터들을 내포시켜 발전시킴으로써 서지자원에 대한 범용성과 상호운용성이 높은 서지 온톨로지를 구축하여 의미적인 검색과 서비스를 확보하고자 하였다.

Abstract

We propose semantic model that is possible to apply for the bibliographic metadata of domestic digital library by analysing bibliographic metadata models like MARC, DC, MODS, JeromeDL's metadata model MarcOnt as the representative case of semantic digital library and FRBR model as the conceptual model.

초록보기
초록

이 연구는 데이터세트를 관리, 보존, 서비스하기 위해 DDI 메타데이터를 기반으로 METS를 활용하는 방안을 제시하였다. DDI는 통계 데이터 처리를 위한 표준으로 현재 DDI Codebook(DDI-C)과 DDI Lifecycle(DDI-L) 두 가지 버전이 존재한다. 본 연구에서는 DDI-C의 주요 요소를 주로 하였다. 이를 위해 우선 METS와 DDI-C의 구조와 요소를 분석하였다. 그리고 METS와 DDI-C의 주요 요소들에 대한 매핑작업을 수행하였다. 여기서 기준은 최종적으로 이를 표현할 형식인 METS로 삼았다. METS와 DDI-C가 완벽하게 1:1의 매핑을 보이지 않기 때문에 기준인 METS의 각 요소들에 가장 적합하게 부합하는 DDI-C 요소를 선택하였다. 그 결과 DDI-C 메타데이터요소를 활용한 새로운 데이터세트 관리전송 표준 METS를 설계하여 제시하였다.

Abstract

This study suggested a method of utilizing METS based on DDI metadata to manage, preserve, and service datasets. DDI is a standard for statistical data processing, and there are currently two versions of DDI Codebook (DDI-C) and DDI Lifecycle (DDI-L). In this study, the main elements of DDI-C were mainly used. First the structures and elements of METS and DDI-C were first analyzed. And the mapping of the major elements of METS and DDI-C. The standard was finally taken as METS, the format to express it. Since METS and DDI-C do not show a perfect 1:1 mapping, the DDI-C element that best matches each element of the standard METS was selected. As a result, a new dataset management transmission standard METS using DDI-C metadata elements was designed and presented.

초록보기
초록

Abstract

In the current information environment, metadata interoperability has become the predominant way of organizing and managing resources. However, current approaches to metadata interoperability focus on the superficial mapping between labels of metadata elements without considering semantics of each element. This research applied facet analysis to address these difficulties in achieving metadata interoperability. By categorizing metadata elements according to these semantic and functional similarities, this research identified different types of facets: basic, conceptual, and relational. Through these different facets, a faceted framework was constructed to mediate semantic, syntactical, and structural differences across heterogeneous metadata standards.

정보관리학회지