바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: use pattern, 검색결과: 48
41
이혜영(한국과학기술원) ; 곽승진(충남대학교) 2008, Vol.25, No.1, pp.191-210 https://doi.org/10.3743/KOSIM.2008.25.1.191
초록보기
초록

일반적으로 문헌을 검색하고 접근하기 위하여 주제색인과 같은 주제어를 활용하곤 한다. 그렇다면 문헌의 내용과 문헌의 주제어는 분명히 어떤 밀접한 상관관계가 있을 것으로 예측해볼 수 있다. 본 연구는 이러한 의문점에서 출발하여, 디지털콘텐트의 본문내용이 비교적 짜임새 있게 정형화되어 있는 석사 학위논문을 연구문헌으로 한정하여 학위논문 전문에서 나타나는 학위논문의 주제어 분포도를 연구하였다. 학위논문의 주제어는 논문 저자가 부여한 주제어를 사용하되, 학위논문 전문은 ‘목차’, ‘서론’, ‘이론배경’, ‘본론’, ‘결론’, ‘참고문헌’의 내용위치로 분할하여 내용위치에 따른 주제어의 출현율을 확인하였다. 연구대상 학위논문 전문은 1226.3개의 용어, 5152.3번의 용어 출현을 보였다. 학위논문 저자가 부여한 주제어는 12~13개 용어로 구성되어 있었다. 연구결과, 전문 내용위치에 따른 주제어의 출현율은 ‘목차’ 11.4%와 ‘서론’ 11.2%에서 가장 높았으며(11%), 다음 순위는 내용위치 ‘결론’ 9.8%이었다.

Abstract

We would generally use subject terms such as subject indexing for searching and accessing documents. So then, there must be any relationship between document's full-text and its subject terms. This study is started in this question. Master's theses in field of science and technology are worked with because full-text is relatively formatted. This study is to study locations of subject term on Thesis, distribution patterns of subject terms on content of full-text; ‘Contents’, ‘Introduction’, ‘Theory’, ‘Main subject’, ‘Conclusion’ and ‘References’. Thesis were averagely composed of 1226.3 terms. And Subject terms were averagely compose of 12~13 terms. As a result, ‘Contents’ and ‘Introduction’ have had the most frequency of subject.

42
정영미(연세대학교) ; 이용구(계명대학교) 2005, Vol.22, No.2, pp.125-145 https://doi.org/10.3743/KOSIM.2005.22.2.125
초록보기
초록

이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음, 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 92%의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 67% 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 39.6%의 정확률을 보였고, EM 알고리즘 통합 검색이 약 36%의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 37%와 비교하면 나이브 베이즈 통합 검색은 약 7.4%의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 3%의 성능 저하율을 보였다.

Abstract

This paper presents a semantic vector space retrieval model incorporating a word sense disambiguation algorithm in an attempt to improve retrieval effectiveness. Nine Korean homonyms are selected for the sense disambiguation and retrieval experiments. The total of approximately 120,000 news articles comprise the raw test collection and 18 queries including homonyms as query words are used for the retrieval experiments. A Naive Bayes classifier and EM algorithm representing supervised and unsupervised learning algorithms respectively are used for the disambiguation process. The Naive Bayes classifier achieved 92% disambiguation accuracy, while the clustering performance of the EM algorithm is 67% on the average. The retrieval effectiveness of the semantic vector space model incorporating the Naive Bayes classifier showed 39.6% precision achieving about 7.4% improvement. However, the retrieval effectiveness of the EM algorithm-based semantic retrieval is 3% lower than the baseline retrieval without disambiguation. It is worth noting that the performances of disambiguation and retrieval depend on the distribution patterns of homonyms to be disambiguated as well as the characteristics of queries.

43
한희정(전북대학교) ; 김태영(전북대학교) ; 두효철(전북대학교) ; 오효정(전북대학교) 2017, Vol.34, No.4, pp.81-99 https://doi.org/10.3743/KOSIM.2017.34.4.081
초록보기
초록

기술문서는 지식정보사회에서 생성되는 중요 연구 성과물로, 이를 제대로 활용하기 위해서는 정보 요약 및 정보추출과 같은 개선된 정보 처리 방법을 토대로 기술문서 활용의 편의성을 높여줄 필요가 있다. 이에 본 연구는 기술문서의 핵심 정보를 추출하기 위한 방안으로, 기술문서의 구조와 정의문 패턴을 기반으로 전문용어 및 정의문을 자동 추출하고, 이를 기반으로 전문용어사전을 구축할 수 있는 시스템을 제안하였다. 나아가 전문용어사전을 지식메모리로서 보다 다양하게 활용할 수 있도록 전문용어사전에 기반한 개인화서비스 제공방안을 제안하였다. 이처럼 전문용어 및 정의문 자동추출을 기반으로 전문용어사전을 구축하게 되면 새롭게 등장하는 전문용어를 빠르게 수용할 수 있어 이용자들이 최신정보를 보다 손쉽게 찾을 수 있다. 더불어 개인화된 전문용어사전을 이용자에게 제공한다면 전문용어사전의 가치와 활용성, 검색의 효율성을 극대화할 수 있다.

Abstract

Technical documents are important research outputs generated by knowledge and information society. In order to properly use the technical documents properly, it is necessary to utilize advanced information processing techniques, such as summarization and information extraction. In this paper, to extract core information, we automatically extracted the terminologies and their definition based on definitional sentences patterns and the structure of technical documents. Based on this, we proposed the system to build a specialized terminology dictionary. And further we suggested the personalized services so that users can utilize the terminology dictionary in various ways as an knowledge memory. The results of this study will allow users to find up-to-date information faster and easier. In addition, providing a personalized terminology dictionary to users can maximize the value, usability, and retrieval efficiency of the dictionary.

44
김성진(인하공업전문대학) 2006, Vol.23, No.4, pp.197-214 https://doi.org/10.3743/KOSIM.2006.23.4.197
초록보기
초록

전통적인 정보환경에 비해 웹 환경은 매우 다양하고 이질적인 이용자들을 대상으로 하기 때문에 이용자의 개별적 특성에 초점을 맞추어서는 웹 정보탐색행위에 대한 일반적인 이해가 불가능하다. 따라서 본 연구는 웹 이용자에게서 보여지는 공통된 정보탐색행위에 초점을 맞춰 이용자들이 웹에서 어떻게 정보를 찾는지 그 행위 패턴을 분석하고자 한다. 이를 위해 시간대별 인터뷰 기법을 적용하여 Dervin의 인지이동 개념을 기반으로 웹과의 상호작용 속에서 이루어진 일련의 인지적 움직임을 파악하고 하였다. 본 연구는 응답자 21명을 대상으로 37개의 웹 탐색 경험을 조사하였다. 분석결과, 웹 정보탐색행위는 시작, 검색, 브라우징, 조사, 정보발견, 결정/행동, 종료의 7가지 유형으로 구성되었다. 응답자별로 매우 다양한 행위 패턴을 보였으며 특히 브라우징 단계를 중심으로 반복되고 순환되면서 웹 정보탐색행위의 다방향적이고 비선형적인 특징을 보였다.

Abstract

A Web-based environment has very various and heterogeneous users. The emphasis on their individual characteristics may make it hard to reach the general understanding of how they seek and use information on the Web. The purpose of this study is to find common patterns in information seeking behavior on the Web by analyzing a series of cognitive movement of users in interaction with the Web. Based on Dervin’s concept and Timeline interview methodology, this study collected 37 Web experience descriptions from 21 respondents, which consisted of 302 steps. Findings addressed that Web information seeking behavior can be classified into seven types: Starting, Searching, Viewing/Browsing, Examining/Comparing, Finding/Compiling, Deciding/Acting, and Ending. Movement paths in the seven-type information seeking process showed that user’s interaction with the Web was repeated and circulated at the Viewing/Browsing step and that information seeking behavior on the Web was multi-directional and non-linear.

45
강미희(전남대학교) ; 홍현진(전남대학교) 2012, Vol.29, No.1, pp.253-277 https://doi.org/10.3743/KOSIM.2012.29.1.253
초록보기
초록

이 연구의 목적은 어린이도서관의 공간특성과 이용자의 행위특성을 규명하고, 이용행태에 따른 공간특성의 선호도 차이를 실증 분석하는 것이다. 이를 위해 이 연구는 전국에 분포한 16개 어린이도서관을 표집기관으로 선정하고, 영유아, 저학년, 고학년 이용자를 대상으로 661부의 자료를 수집하여 분석하였다. 분석결과는 다음과 같다. 첫째, 공간특성과 이용자특성간의 관계에서 연령, 성별에 따른 차이가 있는 반면, 발달단계에 따른 차이는 없었다. 둘째, 공간특성과 이용행태와의 관계에서 차이가 나타났다. 구체적 내용은 다음과 같다. 방문목적: 독서목적의 이용자는 쾌적성과 편안함을 선호하는 반면 비독서목적의 이용자는 소통성과 영역성을 선호하였다. 방문형태: 단독방문보다 동반방문시 다양성, 편안함, 소통성을 더 선호하였다. 활동패턴: 동적활동의 이용자보다 정적활동의 이용자가 다양성을 더 선호하였다. 이용빈도: 방문횟수가 증가할수록 심미성, 역동성, 융통성, 휴식성, 소통성, 영역성에 대한 선호도는 증가하는 반면 안전성에 대한 선호도는 감소하였다. 체류시간: 체류시간이 길수록 다양성, 자존감, 편안함, 역동성, 융통성에 대한 선호도가 높았다.

Abstract

The purpose of this study is to clarify the spatial characteristics of the children's library and user's behavioral characteristics and to empirically analyze the difference in preference of the spatial characteristics based on the using behaviors. For doing this, this study selected 16 children's libraries in the country as a sampling institute and collected and analyzed 661 questionnaires targeting infants, and the lower and upper graders. The results of analysis are as follows. First, while there was a difference in the relation between the spatial characteristics and the user's characteristics according to ages and sexes, there was no difference in the developing stage. Second, there was a difference in the relation between the spatial characteristics and the using behaviors. Detailed results are as follows. While users who visit the library for reading prefer amenity and peacefulness, those who visit the library for other reasons prefer communication and territoriality. Children prefer diversity, peacefulness and communication when they visit in group rather than to visit individually. In terms of behavioral patterns, users who act quietly prefer diversity than those who act actively. Reading use frequency, as the number of times to visit increased, preference on esthetic sense, dynamics, flexibility, leisure, communication and territoriality increased, but preference on safety decreased. As the length of visit became longer, preference on diversity, self-esteem, peacefulness, dynamics and flexibility increased.

초록보기
초록

본 연구는 사용자의 중심의 시스템을 지향하고 있는 현 시점에서 사용자 인터페이스 연구의 동향을 분석하는 것이 그 어느 때 보다 중요하다고 보고, 최근 10년 동안에 정보학분야에서 수행된 사용자 인터페이스 연구를 정량적으로 그리고 정성적으로 살펴보았다. 즉, 6개의 정보학관련 학술잡지에 수록된 128편의 논문을 분석하여 다음과 같은 4가지의 연구질문에 답하였다: 1) 어떠한 주제들이 연구되었는지, 2) 어떠한 학술지가 주로 어떠한 주제의 논문을 출판하는지, 3) 어떠한 방법론이 어떤 주제에서 많이 사용되고 있는지, 4) 연도별 연구변화는 어떠한지. 이에 따라 본 연구는 주제별 분포, 학회지별 분포, 학회지별 주제 분포, 방법론별 학회지 분포, 방법론별 주제 분포, 연도별 주제 분포와 연도별 학회지 분포를 살펴보고 정성적으로 각각의 논문들을 주제별로 리뷰하였다. 그 결과, 「정보관리학회지」가 비율적으로 이 주제를 가장 많이 다루고 있는 것으로 나타났고, ‘웹사이트 평가’, ‘탐색 인터페이스’, ‘정보설계’, ‘상호작용 스타일 설계’ 순으로 연구가 많이 수행되었다. 또한 방법론은 서베이 연구 방법론, 비개입적 연구방법론, 실험연구 방법론 순으로 많이 사용된 것으로 나타났다. 그리고 사용자 인터페이스 연구는 2000년대 초반에 후반보다 더 많은 연구가 수행된 것을 알 수 있었다. 앞으로 사용자 인터페이스 연구가 보다 확고한 정보학의 소주제 영역으로 자리 잡기 위해서는 폭넓은 연구주제와 연구방법론의 선택이 필요하다고 본다.

Abstract

The aims of this study are to provide an overview of research trends on user interface in the field of Information Science. This study attempts to address the following four questions: 1) what are the research areas or subject topics, 2) what are the patterns of user interface publication, 3) what methods are often used to what topics, and 4) what are the changes in the subject topics and research methods over the past ten years. It analyzed a total of 128 research articles published in four Korean LIS journals and one U.S. journal. The study also reviewed 72 articles published in Korean journals for identifying research trends. The study found that the most productive areas were ‘web site evaluation’, followed by ‘search interface’, ‘information design’ and ‘interaction style design’. The most frequently used research methods were survey methods, followed by unobtrusive methods, and experiments. Journal of the Korean Society for Information Management published the most articles on research of user interface. The research of user interface was conducted more frequently in the early 2000s than later years.

47
서선경(한국과학기술정보연구원) ; 최호남(한국과학기술정보연구원) ; 김병규(KISTI) ; 최선희(한국과학기술정보연구원) ; 김정환(한국과학기술정보연구원) 2016, Vol.33, No.2, pp.157-176 https://doi.org/10.3743/KOSIM.2016.33.2.157
초록보기
초록

Cited-by Linking 서비스는 CrossRef에서 제공하는 주요 서비스 중 하나로 해당 논문이 DOI를 통하여 얼마나 인용되었는지 누적하여 집계된 데이터이다. 이에 본 연구에서는 KISTI의 학술정보통합관리시스템에서 월단위로 구축․관리하는 Cited-by Linking 데이터를 분석하여 자연과학과 공학 분야의 인용 패턴을 규명하고자 하였다. 이를 위해서 전체 기탁된 21만 건 중 자연과학과 공학 분야 총 170,999건(315종)을 분석 대상으로 하고, 2016년 3월까지 누적된 Cited-by Linking 데이터를 수집하였다. 연구의 분석 결과, 첫째, 글로벌하게 인용될 가능성에서 사용 언어는 영향을 미치고 있으며, 둘째, SCIE 및 SCOPUS 등재 여부 역시 인용가능성에 상당 부분 기여하고 있음을 확인하였다. 셋째, 자연과학 분야는 거의 동일한 주제 분야에서 인용을 받고 있으며, 상대적으로 공학 분야는 타주제 분야에서 더 인용 받고 있음을 파악하였다. 이러한 연구의 결과는 자연과학과 공학 분야의 세부주제 분야별 인용 행태를 규명하고, 향후, 인용 행태에 관한 연구에서 유용하게 활용될 것으로 기대한다.

Abstract

Cited-by Linking Service is one of the CrossRef’s information services that allows you to discover how your publications are being cited and to incorporate that information into your online publication platform. This study tries to investigate citation patterns in the field of both Natural Science and Engineering using all of DOI assigned articles and Cited-by Linking data which are accumulated and managed by KISTI. The investigating approach is designed to verify the theory of 1) cognitive accessibility, 2) ‘perceived quality and significance’ and 3) ‘subject relativity’. For cognitive accessibility verification the fulltext language portion of Korean and English between “Cited DOI Source Data” and “NOT Cited DOI Source Data” was compared. For perceived quality and significance verification the availability of the “Cited DOI Source Data” and “NOT Cited DOI Source Data” from SCIE and SCOPUS was employed. For subject relativity DOI data were classified and analysed on the basis of OECD subject classification scheme. Findings are that global citability is closely related to the fulltext language of the articles and their quality and significance. And in the natural science field most of citations are from the same subject categories, while relatively more citations are from other subject categories in the engineering field.

48
오찬희(성균관대학교 문헌정보학과 석사과정) ; 김규리(성균관대학교 문헌정보학과 석사과정) ; 주영준(연세대학교 문헌정보학과) 2022, Vol.39, No.1, pp.257-280 https://doi.org/10.3743/KOSIM.2022.39.1.257
초록보기
초록

본 연구에서는 대한민국 정부가 지정한 국가전략기술 사업인 반도체, 이차전지, 바이오 산업에 대한 여론을 파악하고 여론의 변화와 주가 흐름의 연관성을 분석하기 위해 각 산업별 대표 기업에 대한 기사의 댓글을 분석하였다. 반도체 산업에서 ‘삼성전자’, ‘SK하이닉스’, 이차전지 산업에서 ‘삼성SDI’, ‘LG화학’, 바이오 산업에서 ‘삼성바이오로직스’, ‘셀트리온’을 선정하여 이를 제목에 포함하고 있는 2020년 1월 1일부터 2020년 12월 31일까지 발행된 네이버 뉴스 기사의 댓글 47,452개를 수집하고 분석하였다. 먼저, 해당 댓글을 긍정, 중립, 부정의 감성으로 나누고 각 감성 그룹에서의 시간의 흐름에 따른 댓글의 동적인 주제를 분석하여 각 산업별 여론의 트렌드를 파악하였다. 분석 결과 반도체 산업 분야의 경우 투자, 코로나19관련 이슈, 삼성전자라는 대기업에 대한 신뢰, 정부 정책 변화로 인한 타격에 대한 언급이 주제 토픽으로 나타났다. 이차전지 산업체의 경우 투자, 배터리, 기업 이슈에 대한 언급이 주제 토픽으로 나타났다. 바이오 산업체의 경우 투자, 코로나19 관련 이슈 및 기업 이슈에 대한 언급이 주제 토픽으로 나타났다. 다음으로, 댓글의 감성이 실제 주가와 연관성이 있는지를 알아보고자 각 대표 기업 별 주가의 변화와 댓글의 감성 점수 변화를 시각적 분석기법을 이용하여 비교 분석하였다. 분석 결과, 댓글의 감성 점수와 주가의 변화 흐름이 매우 유사하게 나타남을 통해 여론의 감성 점수 변화와 주가의 흐름에는 연관성이 있음을 확인하였다. 본 연구는 주가와의 연관성이 높은 뉴스 기사 댓글을 분석했다는 점, 수집 시기를 코로나19로 선정하여 코로나19라는 특수한 상황에서의 여론 트렌드 변화를 파악했다는 점, 국가전략기술제도에 속하는 산업 기업에 대한 여론을 분석하여 정부기관의 관련 정책 제정에 객관적인 근거를 제공하였다는 점에서 의의를 지닌다.

Abstract

In this study, we analyzed comments on news articles of representative companies of the three industries (i.e., semiconductor, secondary battery, and bio industries) that had been listed as national strategic technology projects of South Korea to identify public opinions towards them. In addition, we analyzed the relationship between changes in public opinion and stock price. ‘Samsung Electronics’ and ‘SK Hynix’ in the semiconductor industry, ‘Samsung SDI’ and ‘LG Chem’ in the secondary battery industry, and ‘Samsung Biologics’ and ‘Celltrion’ in the bio-industry were selected as the representative companies and 47,452 comments of news articles about the companies that had been published from January 1, 2020, to December 31, 2020, were collected from Naver News. The comments were grouped into positive, neutral, and negative emotions, and the dynamic topics of comments over time in each group were analyzed to identify the trends of public opinion in each industry. As a result, in the case of the semiconductor industry, investment, COVID-19 related issues, trust in large companies such as Samsung Electronics, and mention of the damage caused by changes in government policy were the topics. In the case of secondary battery industries, references to investment, battery, and corporate issues were the topics. In the case of bio-industries, references to investment, COVID-19 related issues, and corporate issues were the topics. Next, to understand whether the sentiment of the comments is related to the actual stock price, for each company, the changes in the stock price and the sentiment values of the comments were compared and analyzed using visual analytics. As a result, we found a clear relationship between the changes in the sentiment value of public opinion and the stock price through the similar patterns shown in the change graphs. This study analyzed comments on news articles that are highly related to stock price, identified changes in public opinion trends in the COVID-19 era, and provided objective feedback to government agencies’ policymaking.

정보관리학회지