바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: time-series analysis, 검색결과: 14
11
황성욱(전북대학교 기록관리학과) ; 정예용(전북대학교 기록관리학과) ; 김수정(전북대학교 문헌정보학과) ; 오효정(전북대학교 문헌정보학과) 2020, Vol.37, No.2, pp.23-45 https://doi.org/10.3743/KOSIM.2020.37.2.023
초록보기
초록

최근 ‘코로나19’라는 초유의 재난 사태를 맞이하여 대한민국 정부의 투명한 정보 공개를 통한 적극적 대응에 전 세계가 주목하고 있다. 이렇듯 공공데이터 개방은 특정 정보에 대한 국민의 인지도와 접근성을 높임으로써 다양한 사회적, 경제적 가치를 상승시키는 데 필수적이다. 본 연구는 정부차원에서 주도적으로 수집하고 공개하고 있는 공공데이터포털의 이용 활성화를 위해 각국에서 운영하고 있는 SNS 현황과 그에 따른 개선방안을 제안하고자 한다. 이를 위해 국내․외 공공데이터포털 SNS 운용현황을 살펴보고, 그 중 선진 사례 3국(인도, 미국, 한국)의 서비스를 선정하여 계량 분석, 피드백 분석, 시계열 분석, 정보유형 분석을 실시하였다. 분석결과를 통해 정보유형 및 이용요구를 파악하고 시사점을 도출하여 공공데이터 이용 활성화를 위한 구체적인 개선방안을 제언하였다.

Abstract

The world is paying attention to the South Korean government’s aggressive COVID-19 response, key of which is transparency and openness in sharing information. Opening up government information is essential to enhancing its social and economic value through increased awareness and accessibility. The purpose of this study is to investigate the current status of SNS operated by national open data portals in which government-collected and -disclosed data is available and to suggest improvements for the use of open data portals. To do this, the study compared 3 national open data portals, each from India, U.S.A, and Korea, by performing quantitative analysis, user feedback analysis, time-series analysis, and information type analysis. Based on the identified information types and user needs, the study suggests concrete ways to facilitate the use of open data portals.

12
이정연(이화여자대학교 이화사회과학원) ; 전수현(우아한형제들 데이터애널리스트) 2020, Vol.37, No.2, pp.171-195 https://doi.org/10.3743/KOSIM.2020.37.2.171
초록보기
초록

본 연구는 대표적인 온라인 협업커뮤니티인 한국 위키피디아의 초기 2002년부터 2019년까지의 편집로그 빅데이터를 해체하여 공동협업과정을 시계열적으로 분석하였다. 공개된 오픈데이터의 표준화된 XML 문서편집 기록을 활용해 Phython과 R을 이용하여 분석 요소를 추출하여 이를 활용하였다. 연구 분석 결과 한국 위키피디아 편집자의 참여 방법, 데이터 내용의 특징, 문서 생성의 추이 등을 설명할 수 있었다. 소수 편집자들의 적극적 활동과 대다수 편집자들의 느슨한 참여도 밝혀졌으며, 온라인에서도 나타나는 사회 문화적 특징이 한국 위키피디아에서도 나타났다. 집단지성을 지속화시키기 위해서는 새롭고 다양한 외부자원이 필수인데 신규 진입자들이 공동편집 커뮤니티에 안착하기 위한 다각적인 고려가 필요하며, 관리자 그룹의 고착화를 탈피하여 순환구조를 통한 개방성이 필요함을 제언하였다.

Abstract

This study analyzed the collaborative process in time series by dismantling the edit log big data of Wikipedia Korea, a representative online collaboration community, from early 2002 to 2019. Analysis elements were extracted from the document edit records, formatted in standardized XML, and analyzed using Python and R. The ways of editors’ contribution, the characteristics of data contents, and the trend of document creation were explained by the analysis. An active contribution of a small set of editors and a loose participation of the majority were revealed. In addition, sociocultural characteristics that appear in online communities were also found in Wikipedia Korea. A new, diverse set of external resources is necessary to sustain the collective intelligence. An effort to settle new editors into the wikipedia community and an openness through circulation structure to avoid the exclusiveness of the management group are suggested.

초록보기
초록

본 논문에서는 온라인 뉴스 기사에서 자동으로 추출된 키워드 집합을 활용하여 특정 시점에서의 세부 주제별 토픽을 추출하고 정형화하는 새로운 방법론을 제시한다. 이를 위해서, 우선 다량의 텍스트 집합에 존재하는 개별 단어들의 중요도를 측정할 수 있는 복수의 통계적 가중치 모델들에 대한 비교 실험을 통해 TF-IDF 모델을 선정하였고 이를 활용하여 주요 키워드 집합을 추출하였다. 또한 추출된 키워드들 간의 의미적 연관성을 효과적으로 계산하기 위해서 별도로 수집된 약 1,000,000건 규모의 뉴스 기사를 활용하여 단어 임베딩 벡터 집합을 구성하였다. 추출된 개별 키워드들은 임베딩 벡터 형태로 수치화되고 K-평균 알고리즘을 통해 클러스터링 된다. 최종적으로 도출된 각각의 키워드 군집에 대한 정성적인 심층 분석 결과, 대부분의 군집들이 레이블을 쉽게 부여할 수 있을 정도로 충분한 의미적 집중성을 가진 토픽들로 평가되었다.

Abstract

In this paper, we propose a new methodology for extracting and formalizing subjective topics at a specific time using a set of keywords extracted automatically from online news articles. To do this, we first extracted a set of keywords by applying TF-IDF methods selected by a series of comparative experiments on various statistical weighting schemes that can measure the importance of individual words in a large set of texts. In order to effectively calculate the semantic relation between extracted keywords, a set of word embedding vectors was constructed by using about 1,000,000 news articles collected separately. Individual keywords extracted were quantified in the form of numerical vectors and clustered by K-means algorithm. As a result of qualitative in-depth analysis of each keyword cluster finally obtained, we witnessed that most of the clusters were evaluated as appropriate topics with sufficient semantic concentration for us to easily assign labels to them.

14
한종엽(한국해양과학기술원) 2015, Vol.32, No.1, pp.23-41 https://doi.org/10.3743/KOSIM.2015.32.1.023
초록보기
초록

이 연구는 국제학술지에 나타난 ‘동해’ 관련 연구에서 ‘동해’ 표기유형별 특성을 계량적으로 분석한 것이다. 이 때 동해표기 유형은 ‘동해 단독’, ‘일본해 단독’, ‘병행표기’로 구분하였다. 분석을 위해 Web of Science DB에서 총 4,192편을 대상으로, 표기유형별 시계열 변화, 저자 소속국가별 표기유형, 연구주제의 차이, 피인용도, 연구협력 및 공저 네트워크를 분석하였다. 그 결과 ‘동해’ 연구에서 ‘일본해 단독 표기’의 비율이 가장 많은 것으로 나타났고, 1990년대 이후 ‘동해 단독 표기’과 ‘병기’의 비율이 지속적으로 상승하고 있었다. 또한 ‘동해’ 연구의 핵심국가는 ‘일본’, ‘러시아’, ‘한국’, ‘미국’, ‘중국’ 5개국이며, ‘일본해 단독 표기’의 경우 ‘일본’을 중심으로 ‘미국’, ‘러시아’, ‘중국’과 공동연구가 활발히 이루어지며, ‘동해 단독 표기’와 ‘병기’는 ‘한국’ 연구자를 중심으로 ‘미국’, ‘일본’과의 연구의 비율이 높았다. 공저 네트워크는 ‘일본해 단독 표기’의 경우 하나의 “거대 구성집단”(Giant Component)을 형성하여 이(異) 집단 간의 협업이 활발히 이루어지고 있으나, ‘동해 단독 표기’의 경우 소속기관을 중심으로 소규모의 연구그룹이 분산된 것으로 나타났다.

Abstract

This study worked on the qualitative analysis about nomenclature East Sea by the record type in researches related to East Sea shown in the scientific journals. Here in this study, the way of marking is classified as three: ‘sole notation of East Sea’, ‘sole notation of Sea of Japan’, and ‘simultaneous notation of both’. Based on a total of 4,192 selections from Web of Science DB, the analysis was followed up for change in time series by the notation type, notation type according to the nation that authors belong to, difference in research topic, impact factor, collaboration in research, and co-authorship network. The result turned out in this work that the sole notation of Sea of Japan accounted for the largest portion. It also showed that the rates of sole notation of East Sea and simultaneous notation have kept increasing continuously since the 1990s. Hub nations regarding the research of East Sea is five including Japan, Russia, Korea, USA, and China. In the case of sole notation of Sea of Japan, active collaboration studies are performed in USA, Russia, and China with a focus in Japan. In the case of sole notation of East Sea and simultaneous use, the research rate is relatively high in USA and Japan with a focus in Korea. As to the co-authorship network in the sole notation of Sea of Japan, sort of a “giant component” among different groups has been set up and through which the collaborative works are actively underway. However, it was found that the research of sole notation of East Sea is dispersed into small groups on the base of relevant individual institution.

정보관리학회지