바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: database, 검색결과: 83
초록보기
초록

본 연구는 문헌정보학 측면에서 국외 독서 및 독서교육 연구의 동향을 분석하고 향후의 연구과제를 제시하였다. 이를 위해 첫째, 문헌정보학 분야 국외 데이터베이스(LISTA)의 통제 키워드와 DDC 23판을 검토하여 독서 및 독서교육 관련 주요 연구 영역을 설정하였다. 둘째, 문헌정보학 분야 국외 데이터베이스(LISTA)에서 검색한 지난 100년(1914년~2014년) 동안의 독서 및 독서교육 관련 학술논문(2,115편)을 대상으로 지적구조 분석을 적용하여 연구동향을 분석하였다. 셋째, 이러한 연구동향 분석의 결과에 기초하여 독서 및 독서교육 분야의 향후 연구과제를 제시하였다.

Abstract

This study aims to analyse the research areas and trends of reading (reading instruction) abroad in the respect of LIS, and suggest future research tasks. First, I reviewed the controlled keywords in SU field of LISTA database and the entries of DDC 23, and identified the research areas of reading and reading instruction in overseas. Second, I analysed the research trends of this field by applying a intellectual structure analysis on 2,115 research articles (1914~2014) retrieved from a representative database in the areas of Library and Information Science (LISTA). Third, Based on the results of these analysis, I suggested the future research tasks of this field in the domain of library and information science.

32
김병규(한국과학기술정보연구원) ; 강무영(한국과학기술정보연구원) ; 최선희(한국과학기술정보연구원) ; 김순영(한국과학기술정보연구원) ; 류범종(한국과학기술정보연구원) ; 신재도(충남대학교) 2011, Vol.28, No.2, pp.117-133 https://doi.org/10.3743/KOSIM.2011.28.2.117
초록보기
초록

Abstract

There have been little comprehensive research for studying impact of foreign journals on Korean scientists. The main reason for this is because there was no extensive citation index database of domestic journals for analysis. Korea Institute of Science and Technology Information (KISTI) built the Korea Science Citation Database (KSCD), and have provided Korea Science Citation Index (KSCI) and Korea Journal Citation Reports (KJCR) services. In this article, citing behavior of Korean scientists on foreign journals was examined by using KSCD that covers Korean core journals. This research covers (1) analysis of foreign document types cited, (2) analysis of citation counts of foreign journals by subject and the ratio of citing different disciplines, (3) analysis of language and country of foreign documents cited, (4) analysis of publishers of journals and whether or not journals are listed on global citation index services and (5) analysis for current situation of subscribing to foreign electronic journals in Korea. The results of this research would be useful for establishing strategies for licensing foreign electronic journals and for information services. From this research, immediacy citation rate (average 1.46%), peak-time (average 3.9 years) and half-life (average 8 years) of cited foreign journals were identified. It was also found that Korean scientistis tend to cite journals covered in SCI(E) or SCOPUS, and 90% of cited foreign journals have been licensed by institutions in Korea.

33
장수현(중앙대학교 문헌정보학과) ; 남영준(중앙대학교) 2022, Vol.39, No.3, pp.263-292 https://doi.org/10.3743/KOSIM.2022.39.3.263
초록보기
초록

본 연구는 문헌정보학 현장인 도서관에서 제공되는 서비스인 이용자 교육의 관련 개념인 리터러시가 각종 문헌정보학 연구 분야에서 어떠한 연구 주제를 다루는지 확인하는 것을 목적으로 한다. 이를 위해 WoS와 KCI 데이터베이스에서 문헌정보학 분야 리터러시 관련 논문을 수집하여 키워드 분석 및 토픽 모델링 분석 기법을 상호보완적으로 사용해 분석하였다. 분석 결과, WoS와 KCI의 문헌정보학 분야 리티러시 관련 연구 동향은 저자 키워드, 주요 주제 등에서 차이가 있는 것으로 나타났으며, 토픽 모델링을 통해 KCI의 리터러시 관련 연구를 3개의 토픽으로 분류하였다. 또한, 연구에서 확인한 국내 문헌정보학 분야 리터러시 연구 동향은 전체 리터러시 관련 연구 동향과 연구량 급증 시기, 핵심 다빈출 키워드 차이가 있음을 분석하였다. 특히, 전체 분야 리터러시 연구는 ‘리터러시’, ‘교육’, ‘미디어’, ‘디지털’ 등의 단어가 다수 도출되었지만 문헌정보학 분야의 리터러시 연구는 ‘정보활용능력’, ‘학교도서관’ 등의 키워드가 다수 등장하였다. 이를 바탕으로 향후 국내에서도 정보가 급증하는 오늘날의 정보화 환경에 맞춰 정보에 대한 평가적인 안목을 기를 수 있는 능력에 관한 연구가 필요하다는 결론을 도출하였다.

Abstract

The purpose of this study is to identify the topics of research related to the concepts of literacy in the field of Library and Information Science which is related to user education in libraries. Data were collected from the WoS and KCI databases, and complementary keyword analysis and topic modeling analysis techniques were used to identify topics of literature-related research articles in the field of Library and Information Science. Findings presented that there was a difference in keywords and topics between the two databases. Literacy-related topics identified from the KCI database were classified into three groups through topic modeling. Also, it was analyzed that there is a difference between the overall literacy-related research trend, the timing of the surge in research volume, and key frequent keywords in the Library and Information Science field confirmed in the study. In particular, in the study of literacy in all fields, a number of words such as ‘literacy’, ‘education’, ‘media’, and ‘digital’ were derived. However, in literature research in the field of Library and Information Science, keywords such as ‘information utilization ability’ and ‘school library’ appeared. Based on this, it was concluded that research on the ability to develop an evaluative eye for information is needed in line with today’s information environment, where information is rapidly increasing in Korea in the future.

34
한유경(정보통신정책연구원) ; 최원석(정보통신정책연구원) ; 이민철(카카오엔터프라이즈) 2023, Vol.40, No.2, pp.115-135 https://doi.org/10.3743/KOSIM.2023.40.2.115
초록보기
초록

본 연구는 단행본, 학술지, 보고서 등 다양한 종류의 발간물로 구성된 연구보고서의 참고문헌 데이터베이스를 효율적으로 구축하기 위한 것으로 딥러닝 언어 모델을 이용하여 참고문헌의 자동추출 성능을 비교 분석하고자 한다. 연구보고서는 학술지와는 다르게 기관마다 양식이 상이하여 참고문헌 자동추출에 어려움이 있다. 본 연구에서는 참고문헌 자동추출에 널리 사용되는 연구인 메타데이터 추출과 더불어 참고문헌과 참고문헌이 아닌 문구가 섞여 있는 환경에서 참고문헌만을 분리해내는 원문 분리 연구를 통해 이 문제를 해결하였다. 자동 추출 모델을 구축하기 위해 특정 연구기관의 연구보고서 내 참고문헌셋, 학술지 유형의 참고문헌셋, 학술지 참고문헌과 비참고문헌 문구를 병합한 데이터셋을 구성했고, 딥러닝 언어 모델인 RoBERTa+CRF와 ChatGPT를 학습시켜 메타데이터 추출과 자료유형 구분 및 원문 분리 성능을 측정하였다. 그 결과 F1-score 기준 메타데이터 추출 최대 95.41%, 자료유형 구분 및 원문 분리 최대 98.91% 성능을 달성하는 등 유의미한 결과를 얻었다. 이를 통해 비참고문헌 문구가 포함된 연구보고서의 참고문헌 추출에 대한 딥러닝 언어 모델과 데이터셋 유형별 참고문헌 구축 방향을 제안하였다.

Abstract

The purpose of this study is to assess the effectiveness of using deep learning language models to extract references automatically and create a reference database for research reports in an efficient manner. Unlike academic journals, research reports present difficulties in automatically extracting references due to variations in formatting across institutions. In this study, we addressed this issue by introducing the task of separating references from non-reference phrases, in addition to the commonly used metadata extraction task for reference extraction. The study employed datasets that included various types of references, such as those from research reports of a particular institution, academic journals, and a combination of academic journal references and non-reference texts. Two deep learning language models, namely RoBERTa+CRF and ChatGPT, were compared to evaluate their performance in automatic extraction. They were used to extract metadata, categorize data types, and separate original text. The research findings showed that the deep learning language models were highly effective, achieving maximum F1-scores of 95.41% for metadata extraction and 98.91% for categorization of data types and separation of the original text. These results provide valuable insights into the use of deep learning language models and different types of datasets for constructing reference databases for research reports including both reference and non-reference texts.

초록보기
초록

본 연구는 남북합작으로 건립하는 PUST에 설치될 도서관과 디지털도서관 모델 제시를 위해 수행되었다. 우선 이론적 연구를 통해 디지털도서관의 문제와 PUST 디지털도서관의 이슈를 파악하였다. 그 결과, 저작권법하의 공정사용 미흡 등으로 현 단계에서 디지털도서관만 운영하는 것은 문제가 있는 것으로 파악되었다. 또 남북의 언어와 지적기반의 차이 등으로 홈페이지 접근·데이터베이스 구축·자료의 검색 등에 문제가 있는 것으로 파악되었다. 이에 연구자는 디지털도서관과 하이브리드 도서관을 병행 운영할 것과, 디지털도서관 관련 하여 유니코드를 통한 홈페이지의 이중화·NCHAR 데이터타입 설정을 통한 다국어 저장, 전거 데이터베이스 구축 등을 제안하였다.

Abstract

This study was conducted under the premise of providing the model for the construction of the library and the digital library in PUST, the joint construction from South and North Korea. First, we determined the problems in the construction of digital libraries as well as possible issues that may rise from the construction of the digital library in PUST. The results of the research showed that there were imminent problems from the operation of a digital library with the inadequate progress in the field of copyright. In addition, the difference in the language system and the knowledge foundations of the two countries will produce problems in the homepage access, database construction, and information retrieval. In order to overcome these predictable problems, this research proposes the following: (1) parallel operation of both digital and high-drive libraries; (2) duplexing the homepage through the application of unicode concerning the digital library; (3) development and application of converted letter codes through the establishment of NCHAR data type; and (4) construction of an authority database.

초록보기
초록

Abstract

The purpose of this study is to identify topic areas of academic library research using two informetric methods; word clustering and Pathfinder network. For the data analysis, 139 articles published in major library and information science journals from 2005 to 2009 were collected from the Korean Science Citation Index database. The keywords that represent research topics were gathered from two sections: an abstract and titles in references. Results showed that reference titles usefully represent topics in detail, and combining abstracts and reference titles can produce an expanded topic map.

초록보기
초록

현재 국내외 대학도서관의 전자학술정보 입수는 일명 빅딜로 불리는 수백, 수천 종의 전자학술지 묶음을 다년간, 고정된 인상율로 계약하는 구독방식이 주류를 이루고 있다. 1990년대 중반에 시작된 이러한 구독방식은 대학도서관과 이용자에게 많은 장점을 제공했다. 하지만 이들 패키지의 가격이 지속적으로 상승함에 따라 이러한 방식의 지속가능성에 대한 의문이 제기되고 있다. 현재까지 pay-per-view 방식을 제외하면 구독기반 모형의 구체적인 대안은 제시되지 않고 있으며 향후 도서관 예산문제가 심각한 뇌관으로 남아있다. 2000년대 초반 시작된 오픈액세스 운동은 다양한 방법으로 학술지의 출판과 유통의 장벽을 제거하고 있다. 오픈액세스 출판 규모는 매년 두 자릿수로 증가하고 있고, 오픈액세스 학술지 논문은 Scopus와 Web of Science 인용데이터베이스에의 편입비율이 20%에 육박하는 등 양적, 질적인 성장을 보이고 있다. 2004년에 시작된 구글 학술검색은 현재 대다수 학술출판사의 학술지 논문에 대한 편리한 검색 및 접근 도구로 성장하고 있다. 비록 학술지 선택의 기준, 제한된 검색 기능, 독점화에 대한 우려 등이 있지만 구글 학술검색을 대학도서관 데이터베이스의 대안으로 진지하게 주목할 필요가 있다. 대학도서관의 예산 문제, 오픈액세스 출판의 활성화, 구글 학술검색과 같은 무료 도구의 성장은 구독기반 모형을 대체할 수 있는 파괴적인 변화로 인식되고 있으며 대학도서관 사서는 새로운 환경에 대한 구체적인 대응을 고민해야 한다.

Abstract

The dominant model of acquiring scholarly contents at academic libraries is so called big deal where libraries subscribe to a bundle of hundreds, if not thousands of journals in a multi-year contract with fixed annual rate increase. The bid deal, started in the mid-1990s, offered a number of advantages for academic libraries and their users. However, escalating prices for these packages have become a serious issue casting doubts about the sustainability of the subscription-based model. At the moment, it appears there is no viable alternative other than pay-per-view method that is being tested at some libraries. Libraries’ budget situation will remain a key factor that might change the situation. Open access started in the 2000s as a vehicle to eliminate barriers to publishing and distributing peer-reviewed scholarly journal articles. Open access publishing is witnessing two-digit growth annually. Open access articles now occupy close to 20% of two major citation databases: Scopus and Web of Science. Google Scholar service, debuted in late 2004, is now a popular tool for discovering and accessing scholarly articles from a vast selection of journals around the world. There is a call for taking Google Scholar seriously as a potential replacement of library databases amid concerns regarding the quality of journals indexed, limited search capabilities vis-à-vis library databases, and monopoly of public goods. Escalating budget problems, rapid growth of open access publishing and the emergence of powerful free tool, such as Google Scholar, need to be taken seriously as these forces might bring disruptive changes to the existing subscription-based model of scholarly contents at academic libraries

초록보기
초록

데이터 학술지와 데이터 논문이 오픈과학 패러다임에서 데이터 공유와 재이용이라는 학술활동이 등장하여 지속적으로 성장하고 있다. 본 논문은 영향력있는 다학제적 분야의 데이터 학술지인 Scientific Data에 게제된 총 713건의 논문을 대상으로 저자, 인용, 주제분야 측면을 분석하였다. 그 결과 저자의 주된 주제 영역은 생명공학, 물리학 등으로 나타났으며, 공저자 수는 평균 12명이다. 공저 형태를 네트워크로 살펴보면, 특정 연구자 그룹이 패쇄적으로 공저활동을 수행하는 것으로 나타났다. 인용의 주제영역을 살펴보면, 데이터 논문 저자의 주제영역과 크게 다르지 않게 나타났으나, 방법론을 주로 다루는 학술지의 인용 비중이 높은 것은 데이터 논문의 특징으로 볼 수 있다. 데이터 논문 저자의 키워드를 사용하여 동시출현단어분석 네트워크로 살펴본 데이터 논문의 주제영역은 생물학이 중심이며, 구체적으로 해양생태, 암, 게놈, 데이터베이스, 기온 등의 세부 주제 영역을 확인할 수 있다. 이러한 결과는 다학제학문 분야를 다루는 데이터 학술지이지만, 데이터 학술지 출간에 관한 논의를 일찍부터 시작해온 생명공학 분야에 집중된 현상을 보여준다.

Abstract

Data journals and data papers have grown and considered an important scholarly practice in the paradigm of open science in the context of data sharing and data reuse. This study investigates a total of 713 data papers published in Scientific Data in terms of author, citation, and subject areas. The findings of the study show that the subject areas of core authors are found as the areas of Biotechnology and Physics. An average number of co-authors is 12 and the patterns of co-authorship are recognized as several closed sub-networks. In terms of citation status, the subject areas of cited publications are highly similar to the areas of data paper authors. However, the citation analysis indicates that there are considerable citations on the journals specialized on methodology. The network with authors’ keywords identifies more detailed areas such as marine ecology, cancer, genome, database, and temperature. This result indicates that biology oriented-subjects are primary areas in the journal although Scientific Data is categorized in multidisciplinary science in Web of Science database.

39
한유진(숙명여자대학교) ; 오승우(Seoul National University) 2010, Vol.27, No.2, pp.7-20 https://doi.org/10.3743/KOSIM.2010.27.2.007
초록보기
초록

Abstract

This study aims to provide a method of extracting the most recent information on US patent documents. An HTML paring technique that can directly connect to the US Patent and Trademark Office (USPTO) Web page is adopted. After obtaining a list of 50 documents through a keyword searching method, this study suggested an algorithm, using HTML parsing techniques, which can extract a patent number, an applicant, and the US patent class information. The study also revealed an algorithm by which we can extract both patents and subsequent patents using their closely connected relationship, that is a very distinctive characteristic of US patent documents. Although the proposed method has several limitations, it can supplement existing databases effectively in terms of timeliness and comprehensiveness.

40
박명규(연세대학교) ; 김희정(국제백신연구소(IVI)) 2011, Vol.28, No.2, pp.53-63 https://doi.org/10.3743/KOSIM.2011.28.2.053
초록보기
초록

Abstract

This paper aims to find out the kinds of sub-topics that were researched in relation to Information Literacy (IL). The text mining method was applied to the articles with ‘information literacy’ in the fields of the descriptor, title and abstract in the LISA Database. Also, out of 214 journals that published these articles, those with the top ten highest frequencies were listed and analyzed. Research results show that 908 articles on information literacy were published in 214 journals and ‘User training’ and ‘Students’ were major descriptors in the sub-topic area of information literacy. Also, Reference Services Review and The Journal of Academic Librarianship are two key journals in IL research as they have the highest frequency of related articles and have shown increasing trends.

정보관리학회지