바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 정보추출, 검색결과: 4
1
변우영(명지대학교 기록정보관리학과) ; 임진희(명지대학교 기록정보과학전문대학원) 2022, Vol.39, No.1, pp.195-217 https://doi.org/10.3743/KOSIM.2022.39.1.195
초록보기
초록

SIARD_KR은 스위스 연방 기록보존소에서 개발한 관계형 데이터베이스 컨텐츠의 장기보존에 이용하는 기술인 SIARD를 우리나라의 실정에 맞게 일부 수정한 행정정보 데이터세트 보존 도구이다. 기존의 선행연구는 SIARD가 얼마나 관계형 데이터베이스안에 들어있는 모든 데이터를 손실 없이 잘 추출할 수 있는지에 초점이 맞춰져 있다. 하지만 데이터베이스에 들어있는 데이터 전부가 의미 있는 정보, 즉 행정정보 데이터세트는 아니다. 따라서 이 논문은 SIARD_KR이 행정정보 데이터세트의 특성을 반영하고 있는가에 대한 문제의식에서 시작한다. SIARD_KR이 단순히 DB에 저장된 데이터를 추출하는 도구가 아니고 의미 있는 정보만을 식별하여 추출할 수 있을지, 본래의 시스템에서 유리되어도 의미 있는 정보를 유지할 수 있을지 확인하려 한다. 본 논문은 SIARD_KR의 구조를 분석하고, 예상되는 문제점을 도출하여 그에 대한 개선방안을 제시하는 것을 목적으로 한다.

Abstract

SIARD_KR is an administrative information dataset preservation tool. It is a partially modified version of SIARD, technology used for long-term preservation of relational databases developed by the Swiss Federal Archives, to suit Korea’s situation better. Previous studies have focused on how SIARD is able to effectively extract all data contained in the relational database without loss. However, not all data contained in the database is meaningful information, that is, an administrative information dataset. This paper began, therefore, with the awareness of the problem of whether SIARD_KR reflects the characteristics of the administrative information dataset. SIARD_KR is not only a tool for extracting data stored in the DB. We want to see if it is capable of identifying and extracting only meaningful information, and maintaining meaningful information, even if it is separated from the original system. The purpose of this paper is to analyze the structure of SIARD_KR, identify expected problems, and suggest improvement measures for them.

2
김진명(연세대학교 교육대학원 사서교육전공) ; 이지연(연세대학교) 2022, Vol.39, No.2, pp.131-157 https://doi.org/10.3743/KOSIM.2022.39.2.131
초록보기
초록

본 연구는 교사들의 생활교육에 대한 정보요구와 교육청으로부터 배부되는 교육지침에 대한 교사 인식 간 관계를 밝혀 이를 기반으로 한 학교도서관 정보서비스 제안에 목적을 두었다. 이론적 배경을 바탕으로 연구 모형을 제작하고 설계를 진행하였으며, 예비연구를 통한 심층면담을 분석하여 연구에서 고려할 요소들을 추출하고 설문 문항을 개발하였다. 경기도는 4개 권역으로 나누어지며, 각 권역별 3개 학교에 설문을 실시한 후 최종적으로 217부의 데이터를 최종 분석에 활용하였다. 연구 결과, 학교도서관의 생활교육 정보요구에 대한 관심이 궁극적으로 교사들의 학생생활교육 실태 개선에 영향을 미친다는 사실을 알 수 있었다. 연구 결과를 바탕으로 학교도서관에서 제공되는 정보서비스를 향상시키는 방법을 제시하였으며, 특히 교사들의 생활지도 정보요구를 학교 내부에서 해결하도록 학교도서관 서비스를 제안했다는 점에서 연구의 의의가 있다.

Abstract

This study aims to present the relationship between the teachers’ information needs regarding guidance and the perception of educational guidelines issued by the Office of Education. The research design was conducted based on the reviewing theoretical background studies, and questionnaires were found in in-depth semi-structured interviews in a pilot study. Gyeonggi Province is divided into four regions, which is the target of the survey. Teachers of three schools in each region were surveyed, and eventually 217 copies of the survey were used for the final analysis. The result shows that the role of school libraries in caring for teachers’ information needs ultimately influences the improvement of teachers’ guidance. Based on this result, the study suggests ways to improve information services provided by school libraries. In particular, the study is meaningful in that it has presented a potential service plan that can be performed by school libraries to help address teachers’ information needs about guidance in schools.

3
김선욱(경북대학교 사회과학대학 문헌정보학과) ; 양기덕(영남고문헌아카이브센터) 2022, Vol.39, No.3, pp.99-132 https://doi.org/10.3743/KOSIM.2022.39.3.099
초록보기
초록

본 연구의 목적은 LDA 토픽모델링 결과와 BERTopic 토픽모델링 결과를 합성하는 방법론인 Augmented and Extended Topics(AET)를 제안하고, 이를 사용해 문헌정보학 분야의 연구주제를 분석하는 데 있다. AET의 실제 적용결과를 확인하기 위해 2001년 1월부터 2021년 10월까지의 Web of Science 내 문헌정보학 학술지 85종에 게재된 학술논문 서지 데이터 55,442건을 분석하였다. AET는 서로 다른 토픽모델링 결과의 관계를 WORD2VEC 기반 코사인 유사도 매트릭스로 구축하고, 매트릭스 내 의미적 관계가 유효한 범위 내에서 매트릭스 재정렬 및 분할 과정을 반복해 증강토픽(Augmented Topics, 이하 AT)을 추출한 뒤, 나머지 영역에서 코사인 유사도 평균값 순위와 BERTopic 토픽 규모 순위에 대한 조화평균을 통해 확장토픽(Extended Topics, 이하 ET)을 결정한다. 최적 표준으로 도출된 LDA 토픽모델링 결과와 AET 결과를 비교한 결과, AT는 LDA 토픽모델링 토픽을 한층 더 구체화하고 세분화하였으며 ET는 유효한 토픽을 발견하였다. AT(Augmented Topics)의 성능은 LDA 이상이었으며 ET(Extended Topics)는 일부 경우를 제외하고 대부분 LDA와 유사한 수준의 성능을 나타내었다.

Abstract

The purpose of this study is to propose AET (Augmented and Extended Topics), a novel method of synthesizing both LDA and BERTopic results, and to analyze the recently published LIS articles as an experimental approach. To achieve the purpose of this study, 55,442 abstracts from 85 LIS journals within the WoS database, which spans from January 2001 to October 2021, were analyzed. AET first constructs a WORD2VEC-based cosine similarity matrix between LDA and BERTopic results, extracts AT (Augmented Topics) by repeating the matrix reordering and segmentation procedures as long as their semantic relations are still valid, and finally determines ET (Extended Topics) by removing any LDA related residual subtopics from the matrix and ordering the rest of them by (BERTopic topic size rank, Inverse cosine similarity rank). AET, by comparing with the baseline LDA result, shows that AT has effectively concretized the original LDA topic model and ET has discovered new meaningful topics that LDA didn’t. When it comes to the qualitative performance evaluation, AT performs better than LDA while ET shows similar performances except in a few cases.

4
심지영(연세대학교 대학도서관발전연구소) 2022, Vol.39, No.2, pp.299-324 https://doi.org/10.3743/KOSIM.2022.39.2.299
초록보기
초록

본 연구는 기존의 도서추천 시스템 연구에서 간과되어 온 도서이용의 맥락 요소를 파악하기 위해, 다양한 도서탐색 배경을 지닌 적극적인 도서 이용자 15명을 대상으로 6가지 도서탐색 상황에서 생성하는 내용을 사고구술(think-aloud) 프로토콜을 통해 수집하였다. 수집된 도서이용 내용은 내용분석 과정을 통해 독자자문 서비스의 이론적 개념인 ‘어필 요소(appeal factor)’를 토대로 도서이용에 영향을 미치는 내부 어필 요소와 외부 어필 요소를 각각 식별하였으며, 도서탐색에 사용하는 정보원과 탐색방법 관련 개념들을 또한 세분화하였다. 본 연구의 결과는 향후 도서추천 시스템 설계에 의미 있는 속성 데이터를 추출하고 반영하는 데 사용될 수 있을 것이다.

Abstract

In this study, in order to explore the contextual elements of book use that were overlooked in the existing book recommender system research, for 15 avid readers with various book search backgrounds, the contents generated in 6 book search situations were collected through the think-aloud protocol. By using content analysis from the collected book use contents, not only the internal and external appeal factors affecting book use, based on the ‘appeal factor’, the theoretical concept of the readers’ advisory service, but also information sources and search methods regarding book use were identified and categorized. The results of this study can be used to extract and reflect meaningful attribute data in the future book recommender system design process.

정보관리학회지