바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 추천, 검색결과: 27
11
감미아(연세대학교 문헌정보학과) ; 이지연(연세대학교 문헌정보학과) 2023, Vol.40, No.1, pp.121-148 https://doi.org/10.3743/KOSIM.2023.40.1.121
초록보기
초록

본 연구는 ‘우수한 성능의 메타데이터 속성 유사도 기반의 학술 문헌추천시스템’을 제안하는 데에 목적을 두고 있다. 본 연구에서는 정보조직에서 다루는 메타데이터의 활용과 계량정보학에서 다루고 있는 동시인용, 저자-서지결합법, 동시출현 빈도, 코사인 유사도의 개념을 활용한 문헌정보학 기반의 학술 문헌 추천기법을 제안하고자 하였다. 실험을 위해 수집한 ‘불평등’, ‘격차’ 관련 총 9,643개의 논문 메타데이터를 정제하여 코사인 유사도를 활용한 저자, 키워드, 제목 속성 간의 상대적 좌표 수치를 도출하였고, 성능 좋은 가중치 조건 및 차원의 수를 선정하기 위해 실험을 수행하였다. 실험 결과를 제시하여 이용자의 평가를 거쳤으며, 이를 이용해 기준노드와 추천조합 특성 분석 및 컨조인트 분석, 결과 비교 분석을 수행하여 연구질문 중심의 논의를 수행하였다. 그 결과 전반적으로는 저자 관련 속성을 제한 조합 혹은 제목 관련 속성만 사용하는 경우 성능이 뛰어난 것으로 나타났다. 본 연구에서 제시한 기법을 활용하고 광범위한 표본의 확보를 이룬다면, 향후 정보서비스의 문헌 추천 분야뿐 아니라 사회의 다양한 분야에 대한 추천기법 성능 향상에 도움을 줄 수 있을 것이다.

Abstract

The purpose of this study is to propose a scholarly paper recommendation system based on metadata attribute similarity with excellent performance. This study suggests a scholarly paper recommendation method that combines techniques from two sub-fields of Library and Information Science, namely metadata use in Information Organization and co-citation analysis, author bibliographic coupling, co-occurrence frequency, and cosine similarity in Bibliometrics. To conduct experiments, a total of 9,643 paper metadata related to “inequality” and “divide” were collected and refined to derive relative coordinate values between author, keyword, and title attributes using cosine similarity. The study then conducted experiments to select weight conditions and dimension numbers that resulted in a good performance. The results were presented and evaluated by users, and based on this, the study conducted discussions centered on the research questions through reference node and recommendation combination characteristic analysis, conjoint analysis, and results from comparative analysis. Overall, the study showed that the performance was excellent when author-related attributes were used alone or in combination with title-related attributes. If the technique proposed in this study is utilized and a wide range of samples are secured, it could help improve the performance of recommendation techniques not only in the field of literature recommendation in information services but also in various other fields in society.

12
송성전(독립연구자) ; 심지영(연세대학교 대학도서관발전연구소) 2022, Vol.39, No.3, pp.311-336 https://doi.org/10.3743/KOSIM.2022.39.3.311
초록보기
초록

본 연구는 도서관 정보서비스 환경에서 도서 이용자의 도서추천에 영향을 미치는 선호요인을 파악하기 위해 전 세계 도서 이용자의 참여로 이루어지는 사회적 목록 서비스인 Goodreads 리뷰 데이터를 대상으로 내용분석하였다. 이용자 선호의 내용을 보다 세부적인 관점에서 파악하기 위해 샘플 선정 과정에서 평점 그룹별, 도서별, 이용자별 하위 데이터 집합을 구성하였으며, 다양한 토픽을 고루 반영하기 위해 리뷰 텍스트의 토픽모델링 결과에 기반하여 층화 샘플링을 수행하였다. 그 결과, ‘내용’, ‘캐릭터’, ‘글쓰기’, ‘읽기’, ‘작가’, ‘스토리’, ‘형식’의 7개 범주에 속하는 총 90개 선호요인 관련 개념을 식별하는 한편, 평점에 따라 드러나는 일반적인 선호요인은 물론 호불호가 분명한 도서와 이용자에서 드러나는 선호요인의 양상을 파악하였다. 본 연구의 결과는 이용자 선호요인의 구체적 양상을 파악하여 향후 추천시스템 등에서 보다 정교한 추천에 기여할 수 있을 것으로 보인다.

Abstract

This study analyzed the contents of Goodreads review data, which is a social cataloging service with the participation of book users around the world, to identify the preference factors that affect book users’ book recommendations in the library information service environment. To understand user preferences from a more detailed point of view, sub-datasets for each rating group, each book, and each user were constructed in the sample selection process. Stratified sampling was also performed based on the result of topic modeling of review text data to include various topics. As a result, a total of 90 preference factors belonging to 7 categories(‘Content’, ‘Character’, ‘Writing’, ‘Reading’, ‘Author’, ‘Story’, ‘Form’) were identified. Also, the general preference factors revealed according to the ratings, as well as the patterns of preference factors revealed in books and users with clear likes and dislikes were identified. The results of this study are expected to contribute to more sophisticated recommendations in future recommendation systems by identifying specific aspects of user preference factors.

13
남영준(중앙대학교 문헌정보학과 교수) 2021, Vol.38, No.3, pp.311-334 https://doi.org/10.3743/KOSIM.2021.38.3.311
초록보기
초록

이 연구의 목적은 합리적인 장서관리정책 수립을 위한 이론적 근거와 계량화된 객관적 기준점 제시이다. 본 연구의 연구결과를 요약하면 다음과 같다. 스테디셀러는 정기간행물 형태의 학습서가 대부분이었다. 또한, 현대소설로서 스테디셀러는 특정 작가에 의존하는 현상을 확인할 수 있었다. 베스트셀러는 출판사와 저자의 영향을 받는 것으로 조사되었다. 특히 만화와 아동용 교재를 출판하는 출판사의 도서는 베스트셀러 선정에 상당부분 상관성을 갖고 있었다. 추천된 도서 한 권당 추천 도서의 대출 수 평균은 14,871권이었으며, 베스트셀러로 선정된 도서 한 권당 평균 대출 수는 53,531권이었다. 한편 대출데이터를 기준으로 약 80~82%의 도서가 전체 상위권 대출의 90%를 감당하고 있고, 약 27~29%의 도서가 전체 상위권 대출의 50%를 감당하고 있었다. 이는 일련의 파레토법칙이 공공도서관 대출패턴에서도 굳건히 적용될 수 있음을 보여주고 있다. 문학의 대출은 전체 대출에서 50.6%를 차지하였으며, 문학 중에서 한국문학작품이 전체 51.3%를 차지하였다. 자연과학은 다른 주제분야에 비해 상대적으로 작은 수의 문헌으로 더 많은 대출을 발생시키고 있었다.

Abstract

The purpose of this study is to present the theoretical basis and quantified objective standards for the establishment of collection management policy. The study results are summarized as follows. Most of the study books were in the form of periodicals as a steady seller. Most of the steady sellers were textbooks which published periodically. As a modern novel, a steady seller was able to confirm the phenomenon of dependence on a specific author. Bestsellers were investigated to be influenced by publishers and authors. Books of publishers that publish comics and children’s textbooks had a significant correlation with the selection of bestsellers. The average number of recommended books borrowed per recommended book was 14,871. The average number of loans per book selected as a bestseller was 53,531. Based on the loan data, about 80-82% of all top-tier loans were covered by 90%, and about 27-29% of all top-ranked loans were covered by 50%. This shows that the Pareto Principle can be firmly applied to public library lending patterns. Loans in the field of literature accounted for 50.6% of the total loans. Among literature, Korean literature accounted for 51.3% of the total. The natural sciences were generating more loans with a relatively small pool of literature compared to other subject fields.

초록보기
초록

본 연구에서는 주요 검색 포털들의 검색어 추천 서비스를 분석, 평가하였다. 이 연구에서는 네이버와 구글 코리아를 대상으로 추천되는 연관 검색어의 적합도 및 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 또한 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하고, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교하였다. 연구 결과, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 또한 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 본 연구의 결과는 향후 포털들의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다.

Abstract

This study aims to analyze and evaluate term suggestion services of major search portals, Naver and Google Korea. In particular, this study evaluated relevance and currency of related search terms provided, and analyzed characteristics such as number and distribution of terms, and queries that did not produce terms. This study also analyzed types of terms in terms of the relationship between queries and terms, and investigated types and characteristics of harmful terms and terms with grammatical errors. Finally, Korean queries and English queries, and popular queries and academic queries were compared in terms of the amount and relevance of search terms provided. The results of this study show that the relevance and currency of Naver's related search terms are somewhat higher than those of Google. Both Naver and Google tend to add terms to or delete terms from original queries, and provide identical search terms or synonym terms rather than providing entirely new search terms. The results of this study can be implemented to the portal's effective development of term suggestion services.

초록보기
초록

최근 이용자들이 정보를 공동생산하고 소비하는 웹기반 서비스들이 활발해지면서 이용자가 정보를 이용한 기록이나 이용자가 습득한 정보를 활용하여 생산한 다양한 부가 정보들이 다시 이용자에게 제공되고 있다. 또한 쌍방향으로 이용자들이 소통할 수 있는 정보채널이 다양해짐으로써 공통된 관심사를 가진 이용자의 정보소비 경험을 공유할 수 있는 방법이 활발하게 모색되고 있다. 이 연구에서는 동시출현정보 분석기법과 자아중심 네트워크 분석 기법을 적용하여 IMDB 서비스의 기존 이용자들이 자신이 보고 싶거나 좋아하는 영화를 선별하여 만들어 놓은 영화리스트에 나타난 정보를 토대로 특정 영화를 좋아하는 이용자가 선호할 만한 다른 영화를 찾아낼 수 있도록 연관영화정보를 다각적으로 표현하였다. 한 영화를 기준으로 연관 영화, 감독, 장르로 분석을 한 결과 영화의 테마나 주인공성향과 같은 다양한 자질로도 연관영화가 연결되었고 감독의 경우 영화내용보다는 감독의 인지도에 영향을 받는 것으로 나타났다. 또한 영화는 주제의 복합성이 큰 것으로 나타나 장르가 연관영화정보를 제공하기에 적합하지 않은 것으로 분석되었다.

Abstract

Recently, many information services allow users to collaborate to produce and use information. Sharing information is also important for users who have similar taste or interest. As various channels are available for users to share their experiences and knowledge, users’ data have also been accumulated within the information services. This study collected movie lists made by users of IMDB service. Co-word analysis and ego-centered network analysis were adapted to discover relevant information for users who chose a specific movie. Three factors of movies including movie title, director and genre were used to present related movie information. Movie title is an effective feature to present related movies with various aspects such as theme or characters and the popularity of directors affects on identifying related directors. Genre is not useful to find related movies due to the complexity in the topic of a movie.

16
김민철(제주대학교) ; 권순만(서울대학교) 2002, Vol.19, No.3, pp.49-68 https://doi.org/10.3743/KOSIM.2002.19.3.049
초록보기
초록

본 연구는 국내 건강정보 사이트의 평가 모형을 제시하고 이를 통해 소비자 만족에 영향을 미치는 요인들을 분석하였다. 이를 위해 건강정보 사이트 방문자들을 대상으로 한 설문조사 결과를 공변량구조모형을 이용해 분석하였다. 연구 결과 사이트 평가 요인은 컨텐츠, 웹시스템 그리고 고객서비스의 3개 요인으로 나누어졌으며, 이들 요인 중에서도 정보내용과 관련된 컨텐츠 요인이 고객 만족도와 통계적으로 가장 유의한 정의 관계를 보여주고 있음을 알 수 있었다. 또한 평가요인이 소비자 만족도와 이용료 수준의 적정성에 영향을 미치고, 이러한 고객반족이 타인추천에 영향을 미치는 것으로 나타났다.

Abstract

The purpose of this paper is to examine the evaluation models of internet sites and to analyze the factors affecting the consumer satisfaction of health information sites in the Internet. Based on the covariance structural model applied to a customer survey, this study shows that among the characteristics of the site. contents has the most significant effect on customer satisfaction, which in turn affects the consumer willingness to recommend the site to others.

초록보기
초록

본 연구에서는 도서관과 정보센터에서 전통적으로 제공되어진 SDI 서비스와 함께 일부 기관에서 제공하고 있는 맞춤정보 서비스를 기반으로 한 개인화 정보 서비스 시스템의 기술요소 및 전체 시스템의 구조를 제안하였다. 제안된 개인화 정보 서비스 시스템은 이용자의 개인 프로파일정보를 바탕으로 이용자의 정보탐색행태 등을 추가 입력 값으로 해서 학습과정을 거쳐 이용자에게 가장 적절한 정보를 출력 값으로 제공할 수 있다. 이를 위해 개인화 정보 서비스 시스템에서 가장 중요한 기능을 수행하는 학습시스템과 추천시스템을 구축하는데 필요한 요소에 대해 살펴보았다.

Abstract

With SDI service provided in libraries and information centers traditionally, this paper studies component technologies and structure of system platform in PIS (personalization information service based on the customized information service served currently in some institutions. The PIS system should provide relevant information as an output through the learning system analyzing user information searching behavior as an input value with personal profile information. To do it, this paper studies requirements and algorithms to develop PIS, and proposes learning system and recommendation system as core components in PIS.

초록보기
초록

본 연구에서는 커뮤니티 기반 질의응답 서비스에서의 질의할당을 위하여, 해당 커뮤니티에 축적된 질의응답 데이터 세트를 이용하여 해당 카테고리내의 토픽을 분석하고 이를 바탕으로 해당 토픽에 관심을 가지는 이용자의 관심 토픽을 분석하고자 하였다. 특정 카테고리 내의 토픽을 분석하기 위해서 LDA기법을 사용하였고 이를 이용하여 이용자의 관심 토픽을 모델링하였다. 나아가, 커뮤니티에 새롭게 유입되는 질의에 대한 토픽을 분석한 후, 이를 바탕으로 해당 토픽에 대해 관심을 가지고 있는 이용자를 추천하기 위한 일련의 방법들을 실험하였다.

Abstract

The main goal of this study is to investigate how to route a question to some relevant users who have interest in the topic of the question based on users’ topic interest. In order to assess users’ topic interest, archived question-answer pairs in the community were used to identify latent topics in the chosen categories using LDA. Then, these topic models were used to identify users’ topic interest. Furthermore, the topics of newly submitted questions were analyzed using the topic models in order to recommend relevant answerers to the question. This study introduces the process of topic modeling to investigate relevant users based on their topic interest.

초록보기
초록

본 고의 목적은 초등학생용 독서자료의 텍스트수준에 영향을 미치는 요인들을 규명하여 텍스트수준 적 요인들을 대상으로 표본집단에 부여된 텍스트수준 점수와의 상관관계를 검토한 결과 글자수, 어절수, 이형어절수, 문장수, 단락수 요인이 텍스트수준을 결정하는 요인으로 드러났다. 단순회귀분석을 통해 도출된 회귀방정식들 중에서 이형어절수 모형이 최적의 공식으로 드러났으나, 중회귀분석을 한 결과 이형어절수요인과 새어절출현비율요인을 결합한 모형은 설명력이 더욱 향상된 공식으로 밝혀졌다. 공식에 따라 독서능력에 적합한 자료를 추천할 수 있다.

Abstract

The purpose of this study is to determine factors affecting text difficulty and to model objective formulas which measure readability scores. Some reada total number of letters, total number of syllables, total numbe r of unique syllables, total number of sentences and total number of paragraphs were found through regression equations with these factors as their variables were produced through regression analysis. A model estimating rea dability score from total numbe r of unique syllables was a nique syllables and new syllable occurrence ratio, was a better enhanced one. The readability sc ore represents detailed level so we can recomend students read texts corresponding to their reading levels.

20
오지은(광진정보도서관) ; 정동열(이화여자대학교) 2015, Vol.32, No.1, pp.43-62 https://doi.org/10.3743/KOSIM.2015.32.1.043
초록보기
초록

본 연구는 국내 공공도서관에서 장서개발정책 수립 시에 활용할 수 있는 다양한 장서평가 지표를 제시할 목적으로 수행되었다. 이러한 탐색적 연구를 위하여 공공도서관의 실제 데이터를 개별 장서평가 지표에 적용하는 사례연구를 통해서 그 활용 가능성을 확인하고자 하였다. 장서평가 지표 분석을 위하여 서울시 광진구립도서관의 최근 10년간 장서대출 데이터가 이용되었다. 주요 장서평가 지표로는 연도별 구입도서의 장서회전율과 이용계수, 연도별 사서 추천도서 장서회전율과 이용계수, 연도별 비대출도서 비율, 대출자 거주지별 도서관 이용도 등이 분석되었다.

Abstract

This study was implemented to suggest various indicators of collection evaluation for collection development policy in public libraries. For the sake of the exploratory research, this study tried to show the usability of indicators of collection evaluation through actual data of a case study. Also to analyze indicators of collection evaluation, this study used the ten years circulation records of the Gwangjin District Public Library in Seoul. Majors indicators of collection evaluation were the rate of use and use factor of purchasing books by annual, the rate of use and use factor of librarian’s recommended books by annual, the rate of non circulating books by annual, and the rate of use by residence annually.

정보관리학회지