바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 데이터 기반, 검색결과: 115
101
김아현(중앙대학교 일반대학원 문헌정보학과 석사과정) ; 이승민(중앙대학교 사회과학대학 문헌정보학과 교수) 2023, Vol.40, No.3, pp.55-76 https://doi.org/10.3743/KOSIM.2023.40.3.055
초록보기
초록

본 연구는 대학도서관의 주제가이드 개발 및 개선을 위한 고려사항을 도출하기 위해 대학도서관의 주 이용자인 대학생을 중심으로 학술정보 탐색행태를 분석하였다. 분석 결과, 대학생들은 자신의 주관적 정보탐색능력 수준을 높게 평가하고 있었으나, 구체적인 검색어의 설정을 어려워하는 것으로 나타났다. 학술정보 이용 목적은 구체적이며, 하나의 데이터베이스에서 모든 정보탐색행위를 수행하고자 하는 경향을 보이고 있다. 또한 정보자원 선택 시 신뢰성, 적합성, 최신성을 주로 고려하고 있으며, 대학도서관 및 주제가이드에 대한 인식은 전반적으로 낮게 나타났으나 이에 대한 신뢰성은 높은 것으로 분석되었다. 이를 기반으로 향후 대학도서관에서 주제가이드를 개발하거나 개선할 때는 구체적인 정보탐색 목적에 따른 정보원 분류, 정보자원의 유형별 구성, 정보자원 선택 기준 관련 설명 요소 기술, 종합 데이터베이스에 대한 안내, 주제 키워드 추천, 도서관 마케팅 및 내부 기관과의 긴밀한 협업 관계를 고려하는 것이 필요하다.

Abstract

This study analyzed academic information seeking behavior, focusing on university students, the main users of the university library, to derive considerations for the development and improvement of the subject guide of the university library. As a result of the analysis, university students highly evaluated their subjective information seeking ability, but it was found that it was difficult to set specific search terms. The purpose of using academic information is specific, and it has been shown that there is a tendency to perform all information search activities in one database. In addition, when selecting information resources, reliability, suitability, and recency are primarily taken into consideration. Awareness of university libraries and subject guides was generally low, but their reliability was found to be high. Based on this, it is necessary to consider the classification of information sources according to specific information seeking purposes, the composition of information resources, explanatory element technology related to information resource selection criteria, comprehensive database, topic keyword recommendation, library marketing, and close cooperation with internal institutions.

102
안세진(김포시 행정과) ; 황현호(㈜악어디지털) ; 임진희(이화여자대학교 정책과학과) 2022, Vol.39, No.3, pp.165-193 https://doi.org/10.3743/KOSIM.2022.39.3.165
초록보기
초록

현대 업무환경 변화의 중심은 디지털 기술이라고 할 수 있다. 특히 업무관리시스템 및 문서생산시스템에서 생산한 기록으로 업무를 증명하는 일반적인 공공기관에서 기록관리체계는 업무환경 그 자체이기도 하다. 김포시는 제4차 산업혁명기술 시대에 선제적으로 대응하고 업무환경 혁신을 이루기 위해 한국지능정보사회진흥원(NIA)의 2021년 공공부문 클라우드 선도 프로젝트 사업에 지원하였고 선도 기관으로 확정되어 3억 3천의 지원을 받아 공공 클라우드 기반의 AI-OCR을 통한 기록물 검색 및 활용기능 강화 프로젝트를 진행하였다. 이를 통해 규격화된 색인 값에 의존한 검색과 이미지 열람에 그치던 비전자기록의 한계를 넘어 데이터화 하였고 AI-OCR이라는 신기술 적용으로 98%의 인식률을 구현하였다. 공공기관에 디지털 기술을 사용하여 업무 효율화, 생산성 향상, 개발비용 절감, 내․외부 이용자들의 기록관리 서비스 수준의 제고를 이루었기에 신기술과 기록물관리의 결합 사례연구를 통해 기록관리 분야 본연의 전문성을 높이는 방향과 업무환경 혁신 구현 사례를 공유하고자 한다.

Abstract

It can be said that digital technology is at the center of the change in the modern work environment. In particular, in general public institutions that prove their work with records produced by business management systems and document production systems, the record management system is also the work environment itself. Gimpo City applied for the 2021 public cloud leading project of the National Information Society Agency (NIA) to proactively respond to the 4th industrial revolution technology era and implemented a public cloud-based AI-OCR technology enhancement project with 330 million won in support of 330 million won. Through this, it was converted into data beyond the limitations of non-electronic records limited to search and image viewing that depend on standardized index values. In addition, a 98% recognition rate was realized by applying a new technology called AI-OCR. Since digital technology has been used to improve work efficiency, productivity, development cost, and record management service levels of internal and external users, we would like to share the direction of enhancing expertise in the record management and implementation of work environment innovation.

103
김선욱(경북대학교 사회과학대학 문헌정보학과) ; 양기덕(영남고문헌아카이브센터) 2022, Vol.39, No.3, pp.99-132 https://doi.org/10.3743/KOSIM.2022.39.3.099
초록보기
초록

본 연구의 목적은 LDA 토픽모델링 결과와 BERTopic 토픽모델링 결과를 합성하는 방법론인 Augmented and Extended Topics(AET)를 제안하고, 이를 사용해 문헌정보학 분야의 연구주제를 분석하는 데 있다. AET의 실제 적용결과를 확인하기 위해 2001년 1월부터 2021년 10월까지의 Web of Science 내 문헌정보학 학술지 85종에 게재된 학술논문 서지 데이터 55,442건을 분석하였다. AET는 서로 다른 토픽모델링 결과의 관계를 WORD2VEC 기반 코사인 유사도 매트릭스로 구축하고, 매트릭스 내 의미적 관계가 유효한 범위 내에서 매트릭스 재정렬 및 분할 과정을 반복해 증강토픽(Augmented Topics, 이하 AT)을 추출한 뒤, 나머지 영역에서 코사인 유사도 평균값 순위와 BERTopic 토픽 규모 순위에 대한 조화평균을 통해 확장토픽(Extended Topics, 이하 ET)을 결정한다. 최적 표준으로 도출된 LDA 토픽모델링 결과와 AET 결과를 비교한 결과, AT는 LDA 토픽모델링 토픽을 한층 더 구체화하고 세분화하였으며 ET는 유효한 토픽을 발견하였다. AT(Augmented Topics)의 성능은 LDA 이상이었으며 ET(Extended Topics)는 일부 경우를 제외하고 대부분 LDA와 유사한 수준의 성능을 나타내었다.

Abstract

The purpose of this study is to propose AET (Augmented and Extended Topics), a novel method of synthesizing both LDA and BERTopic results, and to analyze the recently published LIS articles as an experimental approach. To achieve the purpose of this study, 55,442 abstracts from 85 LIS journals within the WoS database, which spans from January 2001 to October 2021, were analyzed. AET first constructs a WORD2VEC-based cosine similarity matrix between LDA and BERTopic results, extracts AT (Augmented Topics) by repeating the matrix reordering and segmentation procedures as long as their semantic relations are still valid, and finally determines ET (Extended Topics) by removing any LDA related residual subtopics from the matrix and ordering the rest of them by (BERTopic topic size rank, Inverse cosine similarity rank). AET, by comparing with the baseline LDA result, shows that AT has effectively concretized the original LDA topic model and ET has discovered new meaningful topics that LDA didn’t. When it comes to the qualitative performance evaluation, AT performs better than LDA while ET shows similar performances except in a few cases.

초록보기
초록

정보기술의 발전과 더불어 국가경쟁력 및 대국민 서비스 강화를 위한 공공정보시스템의 구축이 확산되고 있다. 또한 막대한 공공재원이 투자되는 공공정보시스템은 효율성에 대한 정기적인 평가를 통한 존재가치의 입증 및 문제점 진단을 통한 성능개선의 요구도 증대되고 있다. 따라서 본 연구는 국내의 대표적인 웹 기반 공공고용정보시스템 워크넷(Work-Net)의 데이터 및 서비스 품질을 102명의 이용자를 대상으로 평가하였다. 측정도구는 학계에서 많이 사용해온 정보내용, 정확성, 적시성, 출력형태, 사용의 용이성, 지원성으로 구성하였으며 t-test와 일원변량분석(one-way ANOVA)을 실시하여 이용자의 특성 및 검색정보에 따른 차이를 살펴보았다. 또한 최근 구직자들의 고용정보시스템에 대한 요구사항들을 분석하였다. 본 연구결과는 공공 및 민간운영 고용정보시스템 운영체제 효율화에 기여할 수 있는 유용한 기초자료를 제공할 것으로 본다.

Abstract

A public information system is being expanded, along with the advance of information technology, to strengthen national competitiveness and provide people with better services. And there also is a growing need for the better performance of that system, as a tremendous amount of public finacial resources is invested in that. To address that need, it's required to make an evaluation of its efficiency on a regular basis to identify its problems and make it work better. The purpose of this study was, accordingly, to examine the quality of data and services provided by the Work-Net, a Web-based public employment information system. The subjects in this study were 102 users of it, and the system was evaluated in terms of content, accuracy, timelines, display format, ease of use and customer support. For data analysis, t-test and one-way ANOVA were implemented to find out the general characteristics of the users, and to see whether or not their view was different according to the type of information they searched for. The findings of this study are expected to lay some foundation for intensifying the efficiency of the public and private employment information systems.

초록보기
초록

기관 레포지토리는 대학의 지적 생산물에 대한 장기적 보존과 신속한 배포 뿐 아니라 상업출판사 구도의 학술 커뮤니케이션 흐름을 변화시키기 위한 주요 수단이다. 우리나라에서는 dCollection 시스템이 기관의 생산물을 수집․보존하는 한편 전국적으로 공유․유통시키기 위한 핵심 운영 도구로 자리매김하였다. 그러나 dCollection 시스템은 연구 성과 공표를 통해 기관의 존립 이유를 설명하고 더 나아가 오픈 엑세스를 실현하기 위한 대학의 자발적 운영 도구라고 말하긴 어렵다. 한편, 일본은 우리나라와 같이 문부성의 ‘차세대 기반 구축 사업’ 등에 의해 기관 레포지토리 운영을 확산시키고 있는데, 그 속도는 상대적으로 저조하지만, 개별 대학이 자발적으로 본연의 기능을 실현하고 운영 기술을 성숙시키고 있다는 점에서 비슷하지만 상이한 전개 양상을 보이고 있다. 본 연구에서는 일본의 기관 레포지토리 지원 정책과 레포지토리의 발전 양상을 비교 분석하고 한국 기관 레포지토리의 발전 과제를 조망하였다. 우리나라에서는 셀프 아카이빙 활성화를 위해 학협회 저작권정책 데이터베이스의 구축 운영이 시급하며, 연구업적 시스템 등 학내 시스템과의 연동, 다양한 컨텐츠의 등록, 외부 발신 체계 강화 등 기관이 자발적으로 레포지토리 운영 능력을 성숙시킬 수 있도록 하는 제도적 기술적 지원이 필요한 것으로 보여진다.

Abstract

IR(Institutional Repository) is an indispensable instrument for not only long time preservation of intellectual products but also for shifting commercial publishing company-dominated academic communication stream. In Korea, dCollection project of Ministry of education, science and technology has contributed on immediate, integrated circulation of distributed research products. dCollection is already one of the few integrating instrument for distributed academic resources, but it has not been university's voluntary instrument to announce their research accomplishments and to realize open access. On the other hand, Japanese government has promoted universities' IR operation through “Next generation infrastructure construction project.” Even though distributing speed is relatively low, each university made ripe operating skill by their selves and realize its own purpose. This study comparatively analyzed policy and current status of Institutional Repository in Korea and Japan from various viewpoints. And also it proposed directions of development about Korean Institutional Repositories.

106
김선우(경기대학교 문헌정보학과) ; 고건우(경기대학교 문헌정보학과) ; 최원준(한국과학기술정보연구원 콘텐츠 큐레이션센터) ; 정희석(한국과학기술정보연구원 콘텐츠 큐레이션센터) ; 윤화묵(한국과학기술정보연구원 콘텐츠큐레이션센터) ; 최성필(경기대학교) 2018, Vol.35, No.4, pp.141-164 https://doi.org/10.3743/KOSIM.2018.35.4.141
초록보기
초록

최근 학술문헌의 양이 급증하고, 융복합적인 연구가 활발히 이뤄지면서 연구자들은 선행 연구에 대한 동향 분석에 어려움을 겪고 있다. 이를 해결하기 위해 우선적으로 학술논문 단위의 분류 정보가 필요하지만 국내에는 이러한 정보가 제공되는 학술 데이터베이스가 존재하지 않는다. 이에 본 연구에서는 국내 학술문헌에 대해 다중 분류가 가능한 자동 분류 시스템을 제안한다. 먼저 한국어로 기술된 기술과학 분야의 학술문헌을 수집하고 K-Means 클러스터링 기법을 활용하여 DDC 600번 대의 중분류에 맞게 매핑하여 다중 분류가 가능한 학습집합을 구축하였다. 학습집합 구축 결과, 메타데이터가 존재하지 않는 값을 제외한 총 63,915건의 한국어 기술과학 분야의 자동 분류 학습집합이 구축되었다. 이를 활용하여 심층학습 기반의 학술문헌 자동 분류 엔진을 구현하고 학습하였다. 객관적인 검증을 위해 수작업 구축한 실험집합을 통한 실험 결과, 다중 분류에 대해 78.32%의 정확도와 72.45%의 F1 성능을 얻었다.

Abstract

Recently, as the amount of academic literature has increased rapidly and complex researches have been actively conducted, researchers have difficulty in analyzing trends in previous research. In order to solve this problem, it is necessary to classify information in units of academic papers. However, in Korea, there is no academic database in which such information is provided. In this paper, we propose an automatic classification system that can classify domestic academic literature into multiple classes. To this end, first, academic documents in the technical science field described in Korean were collected and mapped according to class 600 of the DDC by using K-Means clustering technique to construct a learning set capable of multiple classification. As a result of the construction of the training set, 63,915 documents in the Korean technical science field were established except for the values ​​in which metadata does not exist. Using this training set, we implemented and learned the automatic classification engine of academic documents based on deep learning. Experimental results obtained by hand-built experimental set-up showed 78.32% accuracy and 72.45% F1 performance for multiple classification.

107
노지윤(건국대학교 문헌정보학과 박사과정) ; 노영희(건국대학교 문헌정보학과) 2020, Vol.37, No.3, pp.1-24 https://doi.org/10.3743/KOSIM.2020.37.3.001
초록보기
초록

5G 시대 단말기의 다양화, 고화질 및 몰입형 중심의 SNS 전개로 동영상 중심의 소셜 미디어 패러다임이 계속적으로 심화되고 있다. 본 연구의 목적은 공공도서관에서 운영되고 있는 유튜브 채널의 운영과 제공 콘텐츠 현황에 대한 분석을 통해 다양한 활용 전략과 방안을 제안하는 데 있다. 본 연구에서는 도서관 유튜브 채널을 개설 및 운영하고 있는 국내의 44개 도서관과 구독자 수 1,000명 이상 도서관 유튜브 채널을 활발하게 활용하고 있는 국외 도서관 12개를 대상으로, 도서관 유튜브 채널의 구독자 수, 조회 수, 비디오 수 데이터 현황, 그리고 콘텐츠 내용과 전달 방식을 조사하였다. 분석 결과를 종합하여, 1) 도서관 유튜브 채널만이 가지는 특수성과 목적성을 확보, 2) 유튜브 채널의 홍보 및 접근성 제고, 3) 공공도서관에서 개설 및 운영하는 유튜브 채널임을 명시, 4) 이용자 친화적인 인터페이스로의 개선, 5) 도서관 전문성과 교육적 콘텐츠를 기획 및 제공, 6) 통합 유튜브 채널의 운영, 7) 이용자 기반 콘텐츠 제공 등의 도서관 유튜브 채널 활용방안을 제안하였다.

Abstract

The social media paradigm centered on videos continues to deepen due to the diversification of 5G devices, high-definition and immersive SNS. The purpose of this study is to propose various utilization strategies and measures through the analysis of the current status of YouTube channel operation and provided contents operated in public libraries. In this study, 44 libraries in Korea that have opened and operated Library YouTube Channel and 12 libraries that actively utilize library YouTube channels with more than 1,000 subscribers were surveyed for the current status of subscribers, views, video count data, and contents and delivery methods of Library YouTube Channel. Based on the analysis results, the library’s YouTube channel was proposed to utilize the library’s YouTube channel, 1) to secure the specificity and purpose of the library’s YouTube channel, 2) to promote and enhance access to the YouTube channel, 3) to improve the YouTube channel to user-friendly interface, 5) to plan and provide library expertise and educational contents, 6) to operate the integrated YouTube channel, and 7) to provide user-based content.

초록보기
초록

이 연구는 한국학의 주류를 이루는 연구영역들의 기원과 발전경로를 파악하기 위하여 텍스트 마이닝과 주경로 분석(main path analysis, MPA) 기법을 수행하였다. 이를 위하여 전통적인 인문학 연구방법론이 아닌 디지털 텍스트를 기반으로 한 정량적 분석을 시도하였고 인용 데이터베이스를 활용하여 인용정보가 포함된 한국학 관련 문헌들을 수집하고 직접 인용 네트워크를 구축하여 한국학 분야 주경로를 추출하였다. 주경로 추출 결과, 한국학 인문분야에서는 키루트(key-route) 주경로 탐색에서 두 개의 주경로 군집(①한국 고대 농경문화(역사․문화․고고학), ②한국인의 영어습득(언어학))이 발견되었고, 한국학 인문․사회분야에서는 키루트 주경로 탐색에서 네 개의 주경로 군집(①한국 지역(공간)개발․조경, ②한국 경제발전(경제원조․소프트파워), ③한국의 산업(정치경제학), ④한국의 인구구성(남아선호)․북한경제(빈곤․중국협력))이 발견되었다. 이 연구의 결과가 한국학의 정체성을 파악하는데 기존의 지엽적 분석에서 벗어나 한국학이라는 학문에서 논의되고 있는 주 영역의 발전과 진화를 거시적으로 분석․제시함으로써 한국학이 가지는 포괄성과 모호성을 다소 해소하고 한국학 외연을 가시적으로 조망하는데 기여할 수 있으리라 기대한다.

Abstract

In this study, text mining and main path analysis (MPA) were applied to understand the origins and development paths of research areas that make up the mainstream of Korean studies. To this end, a quantitative analysis was attempted based on digital texts rather than the traditional humanities research methodology, and the main paths of Korean studies were extracted by collecting documents related to Korean studies including citation information using a citation database, and establishing a direct citation network. As a result of the main path analysis, two main path clusters (Korean ancient agricultural culture (history, culture, archeology) and Korean acquisition of English (linguistics)) were found in the key-route search for the Humanities field of Korean studies. In the field of Korean Studies Humanities and Social Sciences, four main path clusters were discovered: (1) Korea regional/spatial development, (2) Korean economic development (Economic aid/Soft power), (3) Korean industry (Political economics), and (4) population of Korea (Sex selection) & North Korean economy (Poverty, South-South cooperation).

초록보기
초록

본 연구는 실재 시스템 환경에서 문헌 분류를 위해 범주화 기법을 적용할 경우, 범주화 성능이 어느 정도이며, 적정한 문헌범주화 성능의 달성을 위하여 분류기 학습에 필요한 범주당 가장 이상적인 학습문헌집합의 규모는 무엇인가를 파악하기 위하여 kNN 분류기를 사용하여 실험하였다. 실험문헌집단으로15만 여건의 실제 서비스되는 데이터베이스에서 2,556건 이상의 문헌을 가진 8개 범주를 선정하였다. 이들을 대상으로 범주당 학습문헌수 20개(Tr20)에서 2,000개(Tr2000)까지 단계별로 증가시키며 8개 학습문헌집합 규모를 갖도록 하위문헌집단을 구성한 후, 학습문헌집합 규모에 따른 하위문헌집단 간 범주화 성능을 비교하였다. 8개 하위문헌집단의 거시평균 성능은 F1 값 30%로 선행연구에서 발견된 kNN 분류기의 일반적인 성능에 미치지 못하는 낮은 성능을 보였다. 실험을 수행한 8개 대상문헌집단 중 학습문헌수가 100개인 Tr100 문헌집단이 F1 값 31%로 비용대 효과면에서 분류기 학습에 필요한 최적정의 실험문헌집합수로 판단되었다. 또한, 실험문헌집단에 부여된 주제범주 정확도를 수작업 재분류를 통하여 확인한 후, 이들의 범주별 범주화 성능과 관련성을 기반으로 위 결론의 신빙성을 높였다.

Abstract

This paper examines a level of categorization performance in a reallife collection of abstract articles in the fields of science and technology, and tests the optimal size of documents per category in a training set using a kNN classifier. The corpus is built by choosing categories that hold more than 2,556 documents first, and then 2,556 documents per category are randomly selected. It is further divided into eight subsets of different size of training documents: each set is randomly selected to build training documents ranging from 20 documents (Tr20) to 2,000 documents (Tr2000) per category. The categorization performances of the 8 subsets are compared. The average performance of the eight subsets is 30% in F1 measure which is relatively poor compared to the findings of previous studies. The experimental results suggest that among the eight subsets the Tr100 appears to be the most optimal size for training a kNN classifier. In addition, the correctness of subject categories assigned to the training sets is probed by manually reclassifying the training sets in order to support the above conclusion by establishing a relation between and the correctness and categorization performance.

초록보기
초록

네트워크 분석 기법을 활용한 연구가 다양한 학문 분야에서 수행되고 있다. 본 연구는 2003년부터 2021년까지 국내 학술지에 게재된 네트워크 분석 논문 총 2,187건을 대상으로 계량서지적 분석과 내용분석을 수행하였다. 분석결과는 살펴보면, 논문 생산에 있어서 교육학, 학제간연구, 컴퓨터학, 문헌정보학, 행정학, 경영학 등의 우위를 확인할 수 있다. 학술지 단위로 보면, 메가 학술지의 강세가 나타난다. 그러나 피인용 기반의 영향력을 살펴보면, 행정학, 문헌정보학, 교육학의 영향력을 뚜렷하게 확인할 수 있다. 저자 단위로 분석한 결과 역시 언론정보학, 행정학, 문헌정보학의 우위를 확인할 수 있다. 파악된 1,537명의 저자 중에서 극소수의 저자가 활발한 연구활동을 하는 것으로 나타났으며, 이를 통해 연구자 저변 확대의 필요성도 확인할 수 있다. 내용분석의 결과를 살펴보면, 논문을 데이터셋으로 하여 가중/비방향네트워크를 형성하는 것이 가장 일반적인 네트워크 형태로 나타났다. 노드는 단어, 링크는 동시출현으로 표현되는 것이 보편적이며, 분석을 위해서는 KrKwic, UCINET, NetMiner, NetDraw의 활용이 가장 두드러졌다.

Abstract

Research in various academic fields using network analysis techniques has been conducted and grown. This study performed bibliographical analysis and content analysis on a total of 2,187 network analysis papers published in journals from 2003 to 2021. The results showed that the fields of Pedagogy, Interdisciplinary Research, Computer Science, Library and Information Science, Public Administration, and Business Administration were higher in terms of the number of research papers. From the perspective of journal, mega-journals were indicated as the most productive journals. However, when looking at the impact based on the number of citations, the strength of Public Administration, Library and Information Science, and Pedagogy is clearly revealed. The results of the analysis by authors can also confirm the higher impact of Journalism, Public Administration Science, and Library and Information Science. Of the 1,537 authors identified, very few authors are active in research, confirming the need to expand the researcher base. The results of content analysis showed that the weighted and non-directional network was the most common network type with using the research papers as a data set. Generally nodes are expressed as words and links are expressed as relationship. For network analysis, the use of KrKwic, UCINET, NetMiner, and NetDraw is the most prominent.

정보관리학회지