바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 데이터 기반, 검색결과: 115
61
오삼균(성균관대학교) 2002, Vol.19, No.4, pp.298-319 https://doi.org/10.3743/KOSIM.2002.19.4.298
초록보기
초록

시맨틱웹은 기계가독형 정의에 기반한 정보의 연계를 통해 웹 자원을 지식화함으로써 정보의 효율적 검색, 통합, 재사용을 도모하는 새로운 기술이다. 시맨틱웹의 구축은 자원에 불변 고유식별자를 부과하는 URI 체제, 각 정보기관에서 생성되는 요소와 속성의 의미 충돌을 방지하는 XML 네임스페이스, 메타데이터 스키마를 활용한 호환적 자원기술을 가능하게 하는 RDF, 메타 데이터 요소 및 이와 연관된 클래스와 속성 관계 정의의 기반이 되는 RDF 스키마, 그리고 RDF 스키마 위에 논리적 추론과 표현력을 강화한 웹 온톨로지 언어 DAML+OIL 및 그 건조자 (constructors)를 삭제 또는 수정 보완한 OWL (Web Ontology Language) 등의 여러 핵심 개념과 기술을 필요로 하는 작업이다. 이 논문은 이러한 개념과 기술의 점진적 발전 양상을 개괄 설명하고, XML/RDF 스키마를 기반으로 메타데이터 요소들을 정의할 경우 도출할 수 있는 상호운용성과 온톨로지의 다양한 활용 방안 등을 고찰한다.

Abstract

The Semantic Web is a new technology that attempts to achieve effective retrieval, automation, integration, and reuse of web resources by constructing knowledge bases that are composed of machine-readable definitions and associations of resources that express the relationships among them. To have this kind of Semantic Web in place, it is necessary to have the following infrastructures: capability to assign unchangeable and unique identifier (URI) to each resource, adoption of XML namespace concept to prevent collision of element and attribute names defined by various institutions, widespread use of RDF to describe resources so that diverse metadata can be interoperable, use of RDF schema to define the meaning of metadata elements and the relationships among them, adoption of DAML+OIL that is built upon RDF(S) to increase reasoning capability and expressive power, and finally adoption of OWL that is built upon DAML+OIL by removing unnecessary constructors and adding new ones based on experience of using DAML+OIL. The purpose of this study is to describe the central concepts and technologies related to the Semantic Web and to discuss the benefits of metadata interoperability based on XML/RDF schemas and the potential applications of diverse ontologies.

62
이고은(연세대학교 대학원 문헌정보학과) ; 김기영(연세대학교 문헌정보학과) 2021, Vol.38, No.1, pp.87-112 https://doi.org/10.3743/KOSIM.2021.38.1.087
초록보기
초록

현재 공공도서관의 자원봉사자는 주로 내부 인력보충의 측면으로 관리되고 자원봉사자 관점에서의 고려가 부족하여 참여의 지속성과 경영효과가 제한적이다. 본 연구는 공공도서관 자원봉사자의 참여 동기와 지속 요인들을 검토하고 이 요인들이 자원봉사자의 만족도와 마케팅 의도에 미치는 영향을 파악하는 것을 목적으로 한다. 이를 위해 자원봉사자, 만족도, 동기요인에 대한 이론적 개념을 기반으로 각 변수에 대한 개념 및 측정요인을 확인하였으며, 자원봉사자 5명의 심층면담을 통해 연구가능성 및 고려요인을 검토하였다. 이를 바탕으로 개발된 설문지로 설문조사를 진행하여 수집된 데이터를 기반으로 통계분석을 실시하였다. 분석 결과, 자원봉사자의 참여동기와 지속 요인은 보수 등의 관리적 요인보다 정서적·심리적 요인들이 자원봉사자 만족도와 마케팅 의도에 영향을 미쳤다. 이러한 결과는 관계 중심적 관리 방식으로의 변화의 필요성을 나타내며 자원봉사자를 인력 충원의 관점으로 인식했던 것에서 더 나아가 자원봉사자의 만족을 기반으로 한 공공도서관의 마케팅 자원으로서 활용가치를 높였다는 점에서 의의가 있다.

Abstract

Volunteers in public libraries are recognized only as internal manpower, so their sustainability and effectiveness are limited because the motivation for volunteering is hardly considered. This study aims to explore the motivation for volunteering in public libraries and the factors to continuation of the volunteering, and to analyze how these factors affect volunteer satisfaction and marketing intentions. To this end, the variables in this studies including satisfaction and motivation was defined operationally based on the related research and a pilot study with several in-depth interviews. A questionnaire survey was executed with the defined variables and the survey data were analyzed statistically. The results showed that the factors of emotional and psychological motivation influenced the satisfaction and marketing intention rather than the managerial factors such as remuneration. The results indicate the need for a change in volunteer management to a relationship-oriented management method. This study is meaningful in that it expands the value of volunteers in public libraries from as managerial to as marketing resources for public libraries.

63
오삼균(성균관대학교 문헌정보학과) ; 한상은(성균관대학교 문헌정보학과) ; 손태익(성균관대학교 학술정보관) ; 김성훈(성균관대학교 문헌정보학과) 2018, Vol.35, No.3, pp.165-187 https://doi.org/10.3743/KOSIM.2018.35.3.165
초록보기
초록

전거데이터 공동구축을 목표로 하는 많은 국내 연구가 시행되었음에도 불구하고 국가전거구축의 협업 환경은 표준 전거의 제정, 표준 전거 구축원칙의 제정, 기존 전거구축 기관의 업무 개편, 공동구축 업무의 핵심기관 선정 등과 같은 전제 조건의 미비로 인해 그 실질적 조성이 막혀 있다. 국가전거를 공동으로 구축하고 원활하게 활용하기 위해서는 기존 전거구축기관의 업무에 지장을 초래하지 않는 현실적 협업 방안과 지속적 추진력을 보유한 국가기관의 참여와 아울러 다수 기관의 데이터 병합을 가능케 하는 표준식별체계가 요구된다. 본 연구의 목적은 국가전거의 공동 구축을 위한 여건 조성에 있어서 필수사항이 무엇인가를 문헌조사로 밝히고, 시맨틱웹 기반으로 구축되어 상호운용성이 우수한 VIVO 온톨로지 모델의 활용을 통해 구현 가능한 국가전거 구축모델을 제시하는 것이다.

Abstract

Despite repeated efforts to develop a methodological foundation for assembling collaborative authority data in South Korea, issues such as the establishment of a standard authority model and standard authority construction as well as the reconfiguration of existing entities in authority building have prevented such research from generating a cooperative push for nation-wide authority data and progressing toward concrete implementation. The formulation of a collaborative and well-utilized collection of national authority data accordingly calls for 1) a practical approach to supporting both established authority data contributors and newly organized avenues of mutual participation in authority building, 2) committed involvement on the part of national institutions capable of providing the project with sustained assistance, and 3) a standard identification system which allows multiple organizations to merge their data. This study addresses the challenges of the current environment by taking stock of the key components necessary for the creation of collaborative authority data and using a Semantic Web-based interoperable VIVO ontology model to propose a viable national authority data framework.

초록보기
초록

역사에 관심 있는 대한민국 국민 누구나 우리 역사에 쉽게 접근하여 재미있게 배울 수 있으며 정확하고 신뢰도 높은 역사정보를 제공하기 위한 콘텐츠 서비스 구축에 관심이 높아지고 있다. 또한 시맨틱 웹 구축을 통해 정보의 공유 및 재활용에 대한 수요가 증가하고 있으며 이는 링크드 데이터를 통해 구체화되고 있다. 기존의 전문연구자 중심의 원문 DB구축에서 탈피하여 일반인도 쉽게 이해하고 이용할 수 있는 대중적 콘텐츠 구축은 여러 기관, 포털, 그리고 일부 개인을 중심으로 구축되고 있으나 정보 공유 및 활용성 측면에 대한 고려 없이 개별적으로 중복 구축되고 있다. 본 연구에서는 원문사료에 대한 접근성을 높이고 정보공유 및 연결을 통한 정보유통 체계를 확보하여 웹상의 다양한 데이터와의 연결로 풍부한 정보제공 환경을 구축하기 위한 방안으로 LOD 기반 한국사 콘텐츠 서비스 시스템 구축을 제안하였다.

Abstract

Anyone curious to easily access and learn Korean history has become interested in Korean history data bases, which will provide accurate and reliable historical information. Furthermore, user demands for information sharing and reusability, available through setting up a semantic web, have been increased, which have taken the shape of linked data. Efforts have been made to construct public data bases containing readily usable contents a user can understand and utilize with ease. They have been produced by several organizations, portal sites, and individuals, trying to deviate from existing mainstreams - expert-based text data bases. A problem with those data bases is that they have not considered such vital factors as the sharing and utilizing of information as a whole. This study suggests a LOD-based Korean history contents implementation system, providing rich information environment by way of multi-dimensional web-data connections. In doing so, this system has tried a historic information circulation service system which is based on information sharing and connecting.

초록보기
초록

본 연구는 공공도서관에서 운영하는 프로그램의 성과를 로직모델을 기반으로 개발된 평가 프레임워크를 적용하여 측정하고자 하였다. 성과 측정을 위해 서울 소재 한 공공도서관에서 운영하는 여러 프로그램 중 어린이 독서 프로그램을 선정하였다. 성과 측정 과정은 어린이 독서 프로그램의 계획, 진행, 평가 등의 업무 과정 일체를 분석하여 로직 모델을 구현하였으며 이에 의거하여 예상되는 성과를 측정하였다. 데이터는 KOLAS를 통해 회원정보, 서지정보, 대출정보 등을 수집하였고, 프로그램 운영 현황에 대한 데이터는 프로그램 진행 후 작성된 보고서에서 추출하였다. 측정 결과 어린이 독서 프로그램에 참여한 회원들의 대출빈도가 상승하였고, 프로그램의 주제에 따라 대출 장서의 주제가 변화하는 것을 볼 수 있었다. 본 연구를 통해 독서 프로그램이 갖는 효과와 의미를 확인할 수 있었으며, 성과평가가 도서관에서 운영하는 타 프로그램 및 도서관 업무 등의 효과성을 측정하는데 유용한 도구가 될 수 있음을 보여주었다.

Abstract

The purpose of this study is to measure the outcomes of a program provided by a public library using the evaluation framework based on Logic Model. A reading program for children which was operated by a public library in Seoul was selected. The outcome evaluation was started with the analysis of the reading program process including planning, operation, and evaluation. Based on the analysis, a logic model framework for outcome evaluation was developed. For evaluation, user, bibliography, and circulation data were collected from the library KOLAS system. Additionally, the participant information were extracted from the final report drafted after the program. The research results show that the number of circulation of program participants was increased after the program. In addition, the range of reading topic was expanded. These findings indicate that the reading program is an effective program for promoting children’s reading habit and that outcome evaluation might be a valid tool to measure the effectiveness of public library programs.

66
송성전(독립연구자) ; 심지영(연세대학교 대학도서관발전연구소) 2022, Vol.39, No.3, pp.311-336 https://doi.org/10.3743/KOSIM.2022.39.3.311
초록보기
초록

본 연구는 도서관 정보서비스 환경에서 도서 이용자의 도서추천에 영향을 미치는 선호요인을 파악하기 위해 전 세계 도서 이용자의 참여로 이루어지는 사회적 목록 서비스인 Goodreads 리뷰 데이터를 대상으로 내용분석하였다. 이용자 선호의 내용을 보다 세부적인 관점에서 파악하기 위해 샘플 선정 과정에서 평점 그룹별, 도서별, 이용자별 하위 데이터 집합을 구성하였으며, 다양한 토픽을 고루 반영하기 위해 리뷰 텍스트의 토픽모델링 결과에 기반하여 층화 샘플링을 수행하였다. 그 결과, ‘내용’, ‘캐릭터’, ‘글쓰기’, ‘읽기’, ‘작가’, ‘스토리’, ‘형식’의 7개 범주에 속하는 총 90개 선호요인 관련 개념을 식별하는 한편, 평점에 따라 드러나는 일반적인 선호요인은 물론 호불호가 분명한 도서와 이용자에서 드러나는 선호요인의 양상을 파악하였다. 본 연구의 결과는 이용자 선호요인의 구체적 양상을 파악하여 향후 추천시스템 등에서 보다 정교한 추천에 기여할 수 있을 것으로 보인다.

Abstract

This study analyzed the contents of Goodreads review data, which is a social cataloging service with the participation of book users around the world, to identify the preference factors that affect book users’ book recommendations in the library information service environment. To understand user preferences from a more detailed point of view, sub-datasets for each rating group, each book, and each user were constructed in the sample selection process. Stratified sampling was also performed based on the result of topic modeling of review text data to include various topics. As a result, a total of 90 preference factors belonging to 7 categories(‘Content’, ‘Character’, ‘Writing’, ‘Reading’, ‘Author’, ‘Story’, ‘Form’) were identified. Also, the general preference factors revealed according to the ratings, as well as the patterns of preference factors revealed in books and users with clear likes and dislikes were identified. The results of this study are expected to contribute to more sophisticated recommendations in future recommendation systems by identifying specific aspects of user preference factors.

초록보기
초록

본 연구에서는 커뮤니티 기반 질의응답 서비스에서의 질의할당을 위하여, 해당 커뮤니티에 축적된 질의응답 데이터 세트를 이용하여 해당 카테고리내의 토픽을 분석하고 이를 바탕으로 해당 토픽에 관심을 가지는 이용자의 관심 토픽을 분석하고자 하였다. 특정 카테고리 내의 토픽을 분석하기 위해서 LDA기법을 사용하였고 이를 이용하여 이용자의 관심 토픽을 모델링하였다. 나아가, 커뮤니티에 새롭게 유입되는 질의에 대한 토픽을 분석한 후, 이를 바탕으로 해당 토픽에 대해 관심을 가지고 있는 이용자를 추천하기 위한 일련의 방법들을 실험하였다.

Abstract

The main goal of this study is to investigate how to route a question to some relevant users who have interest in the topic of the question based on users’ topic interest. In order to assess users’ topic interest, archived question-answer pairs in the community were used to identify latent topics in the chosen categories using LDA. Then, these topic models were used to identify users’ topic interest. Furthermore, the topics of newly submitted questions were analyzed using the topic models in order to recommend relevant answerers to the question. This study introduces the process of topic modeling to investigate relevant users based on their topic interest.

68
박민정(중앙대학교 일반대학원 문헌정보학과) ; 이승민(중앙대학교 문헌정보학과 교수) 2023, Vol.40, No.3, pp.197-219 https://doi.org/10.3743/KOSIM.2023.40.3.197
초록보기
초록

자료를 기술하기 위해 일반적으로 활용하는 AACR 계열의 목록규칙과 서지구조는 한국의 고문헌만이 지니고 있는 서지적 특성을 구체적으로 반영하는 것에 한계를 보이고 있다. 이에 본 연구에서는 고문헌의 서지적 측면을 분석하고 FRBR LRM 개념적 모형을 기반으로 기술항목 사이의 관계를 형성하여 고문헌의 고유한 특성에 최적화된 서지구조를 제안하였다. 이때 관계의 설정은 관련된 고문헌을 서지적으로 연결시켜 줄 수 있는 방향으로 이루어져야 하며, 이를 위해서는 고문헌, 특히 우리나라의 고문헌이 지닌 서지적 특성과 형태적, 내용적 변형을 충분하게 반영할 수 있는 관계의 형성이 설정되어야 한다. 단위저록 형태의 단편적인 서지레코드만을 생성하는 기존의 서지 환경에서 벗어나 LRM 구조를 적용함으로써 서지데이터 단위로 기술항목을 분리 및 통합하는 것이 가능해진다. 이를 통해 새로운 서지적 환경을 마련함으로써 고문헌의 조직, 관리, 활용을 보다 효율적으로 할 수 있게 되며, 향후 BIBFRAME 형식의 서지데이터 생성 기반을 마련할 수 있다.

Abstract

The cataloging rules of AACR families and bibliographic structure, which are broadly used in describing resources, show limitations in reflecting the unique bibliographic characteristics of Korean old materials. Thus this research proposed a bibliographic structure optimized to the unique bibliographic characteristics of Korean old materials by establishing bibliographic relationships between bibliographic entities based on the FRBR LRM conceptual model. The bibliographic relationships should be established in the way of connecting related materials in the bibliographic structure. These relationships should sufficiently reflect the bibliographic characteristics of the materials, physical variations, and content variations. Through this structure, the bibliographic description can be separated and integrated into the bibliograhpic unit by applying LRM conceptual model. By using the proposed structure, the organization, management, and utilization of Korean old materials can be more efficient. Also, it can provide a new bibliographic environment that can be the foundation of creating BIBFRAME records for Korean old materials.

초록보기
초록

정보통신기술의 발달로 학술 정보의 양이 기하급수적으로 증가하였고 방대한 양의 텍스트 데이터를 처리하기 위한 자동화된 텍스트 처리의 필요성이 대두되었다. 생의학 문헌에서 생물학적 의미와 치료 효과 등에 대한 정보를 발견해내는 바이오 텍스트 마이닝은 문헌 내의 각 개념들 간의 유의미한 연관성을 발견하여 의학 영역에서 상당한 시간과 비용을 줄여준다. 문헌 기반 발견 연구로 새로운 생의학적 가설들이 발견되었지만 기존의 연구들은 반자동화된 기법으로 전문가의 개입이 필수적이며 원인과 결과의 한가지의 관계만을 밝히는 제한점이 있다. 따라서 본 연구에서는 중간 개념인 B를 다수준으로 확장하여 다양한 관계성을 동시출현 개체와 동사 추출을 통해 확인한다. 그래프 기반의 경로 추론을 통해 각 노드 사이의 관계성을 체계적으로 분석하여 규명할 수 있었으며 새로운 방법론적 시도를 통해 기존에 밝혀지지 않았던 새로운 가설 제시의 가능성을 기대할 수 있다.

Abstract

Due to the recent development of Information and Communication Technologies (ICT), the amount of research publications has increased exponentially. In response to this rapid growth, the demand of automated text processing methods has risen to deal with massive amount of text data. Biomedical text mining discovering hidden biological meanings and treatments from biomedical literatures becomes a pivotal methodology and it helps medical disciplines reduce the time and cost. Many researchers have conducted literature-based discovery studies to generate new hypotheses. However, existing approaches either require intensive manual process of during the procedures or a semi-automatic procedure to find and select biomedical entities. In addition, they had limitations of showing one dimension that is, the cause-and-effect relationship between two concepts. Thus, this study proposed a novel approach to discover various relationships among source and target concepts and their intermediate concepts by expanding intermediate concepts to multi-levels. This study provided distinct perspectives for literature-based discovery by not only discovering the meaningful relationship among concepts in biomedical literature through graph-based path interference but also being able to generate feasible new hypotheses.

70
최윤수(한국과학기술정보연구원) ; 정창후(한국과학기술정보연구원) ; 조현양(경기대학교) 2011, Vol.28, No.1, pp.89-104 https://doi.org/10.3743/KOSIM.2011.28.1.089
초록보기
초록

대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

Abstract

Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In order to extract these entities automatically from scientific documents at once, we developed a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer and terminology extractor.

정보관리학회지