바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 학습자, 검색결과: 5
초록보기
초록

국내 학술회의 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히 구현이 쉽고 컴퓨터 처리 속도가 빠른 로치오 알고리즘을 사용하여 『한국정보관리학회 학술대회 논문집』의 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 분류기 생성 방법, 학습집합 규모, 가중치부여 기법, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 파라미터(β, λ)와 학습집합의 크기(5년 이상)를 적절하게 적용하는 것이 효과적이며, 동등한 성능 수준이라면 보다 단순한 단일 가중치부여 기법을 사용하여 분류의 효율성을 높일 수 있음을 발견하였다. 또한 국내 학술회의 논문의 분류는 특정 논문에 하나 이상의 범주가 부여되는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있으므로, 이러한 환경을 고려하여 주요 성능 요소들의 특성에 기초한 최적의 분류 모델을 개발할 필요가 있다.

Abstract

This study examined the factors affecting the performance of automatic classification for the domestic conference papers based on machine learning techniques. In particular, In view of the classification performance that assigning automatically the class labels to the papers in Proceedings of the Conference of Korean Society for Information Management using Rocchio algorithm, I investigated the characteristics of the key factors (classifier formation methods, training set size, weighting schemes, label assigning methods) through the diversified experiments. Consequently, It is more effective that apply proper parameters (β, λ) and training set size (more than 5 years) according to the classification environments and properties of the document set. and If the performance is equivalent, I discovered that the use of the more simple methods (single weighting schemes) is very efficient. Also, because the classification of domestic papers is corresponding with multi-label classification which assigning more than one label to an article, it is necessary to develop the optimum classification model based on the characteristics of the key factors in consideration of this environment.

초록보기
초록

본 연구의 목적은 1) 소설 속 지명 데이터베이스(DB)를 구축하고, 2) 확장 가능한 지명 DB를 위해 자동으로 지명을 추출하여 데이터베이스를 갱신하며, 3) 데이터베이스 내의 소설지명과 용례를 검색하고 시각화하는 파일럿시스템을 구현하는 데 있다. 특히, 학습자료(training)에 해당하는 말뭉치(corpus)를 확보하기 어려운, 소설지명과 같이 현재 잘 쓰이지 않는 개체명을 자동으로 추출하는 것은 매우 어려운 문제이다. 효과적인 지명 정보 추출용 학습자료 말뭉치 확보 문제를 해결하기 위해 본 논문에서는 이미 수작업으로 구축된 웹 지식(어휘사전)을 활용하여 학습에 필요한 충분한 양의 학습말뭉치를 확보하는 방안을 적용하였다. 이렇게 확보된 학습용 코퍼스와 학습된 자동추출 모듈을 가지고, 새로운 지명 용례를 찾아 추가하는 지명 데이터베이스 확장 도구를 만들었으며, 소설지명을 지도 위에 시각화하는 시스템을 설계하였다. 또한, 시범시스템을 구현함으로써 실험적으로 그 타당성을 입증하였다. 끝으로, 현재 시스템의 보완점을 제시하였다.

Abstract

This study aimed to design a semi-automatic web-based pilot system 1) to build a Korean novel geo-name, 2) to update the database using automatic geo-name extraction for a scalable database, and 3) to retrieve/visualize the usage of an old geo-name on the map. In particular, the problem of extracting novel geo-names, which are currently obsolete, is difficult to solve because obtaining a corpus used for training dataset is burden. To build a corpus for training data, an admin tool, HTML crawler and parser in Python, crawled geo-names and usages from a vocabulary dictionary for Korean New Novel enough to train a named entity tagger for extracting even novel geo-names not shown up in a training corpus. By means of a training corpus and an automatic extraction tool, the geo-name database was made scalable. In addition, the system can visualize the geo-name on the map. The work of study also designed, implemented the prototype and empirically verified the validity of the pilot system. Lastly, items to be improved have also been addressed.

초록보기
초록

해외에 진출한 국내기업의 소송 사례가 증가하면서 기업들의 전자증거개시제도의 대응에 대한 요구가 증가하고 있다. 영미법에서 유래된 제도인 전자증거개시제도는 절차 진행과정에서 여러 곳에 산재해 있는 전자적 정보들을 중 제한된 시간 내에 소송과 관련된 전자적 정보들을 찾아 증거자료로 검토하여 제출하는 제도이다. 이는 하루에도 수많은 전자기록이 생산되는 국내기업들의 기록관리가 잘 이루어지지 않고 있는 현실에서 제한된 시간 이내에 증거자료를 추리고 검토하여 제출하는 것은 쉽지 않은 일이다. 검토대상을 줄이고 검토과정을 효율적으로 진행하는 것은 소송에서 승소를 위한 가장 중요한 과제 중 하나이다. Predictive Coding은 전자증거개시 검토 과정에서 사용되는 도구로써 기계학습을 이용하여 기업들이 보유하고 있는 전자적 정보들의 검토를 도와주는 도구이다. Predictive Coding이 기존의 검색 도구보다 효율성이 높고 잠재적으로 소송과 관련된 전자적 정보를 추려내는데 강점이 있다고 판단된다. 기업의 효율적인 검색도구의 선택과 지속적인 기록관리를 통해 검토비용의 시간적, 비용적 절감을 꾀할 수 있을 것으로 예상된다. 따라서 기업은 전자증거개시 제도에 대응하기 위해서 시간과 비용적 측면을 고려한 전문적인 Predictive Coding 솔루션의 도입과 기업 기록관리를 통해 가장 효과적인 방법을 모색해야 할 것이다.

Abstract

As the domestic companies which have made inroads into foreign markets have more lawsuits, these companies’ demands for responding to E-Discovery are also increasing. E-Discovery, derived from Anglo-American law, is the system to find electronic evidences related to lawsuits among scattered electronic data within limited time, to review them as evidences, and to submit them. It is not difficult to find, select, review, and submit evidences within limited time given the reality that the domestic companies do not manage their records even though lots of electronic records are produced everyday. To reduce items to be reviewed and proceed the process efficiently is one of the most important tasks to win a lawsuit. The Predictive Coding is a computer assisted review instrument used in reviewing process of E-Discovery, which is to help companies review their own electronic data using mechanical learning. Predictive Coding is more efficient than the previous computer assister review tools and has a merit to select electronic data related to lawsuit. Through companies’ selection of efficient computer assisted review instrument and continuous records management, it is expected that time and cost for reviewing will be saved. Therefore, in for companies to respond to E-Discovery, it is required to seek the most effective method through introduction of the professional Predictive Coding solution and Business records management with consideration of time and cost.

4
서지웅(경북대학교 문헌정보학과) ; 김희섭(경북대학교) 2016, Vol.33, No.1, pp.181-196 https://doi.org/10.3743/KOSIM.2016.33.1.181
초록보기
초록

본 연구의 목적은 고령층을 위한 웹 사이트의 정보 구조를 조직화 체계와 레이블링 체계의 측면에서 평가하는데 있다. 본 연구의 목적을 달성하기 위하여 고령자들이 비교적 많이 이용하는 국내 웹 사이트 한 곳(네이버)을 선정하고, 실험참가자들은 주어진 세 가지의 정보탐색 과제를 수행한 후, 사후 설문과 필요한 경우 추가적인 인터뷰를 통하여 총 74명의 실험 데이터를 수집하였다. 수집된 데이터는 SPSS Ver.20으로 통계분석을 실시했다. 연구 결과를 요약하면, 실험대상으로 선정한 웹 사이트는 정보 구조의 조직화 측면에서 실험참가자들에게 긍정적인 평가를 받았는데, 특히 콘텐츠의 체계적인 주제별 분류와 시간순이나 연대순 브라우징에 대하여 긍정적이었다. 또한 실험참가자들은 단어 레이블보다 아이콘 레이블을 더 잘 이해하는 것으로 파악되었고, 이는 실험참가자 개인의 학습정도에 따라 차이가 있는 것으로 나타났다.

Abstract

The objective of this study is to evaluate the organization system and the labeling system of information architecture of a website for the elderly. To achieve this aims, we selected a representative website, i.e., Naver, and the participants were conducted given three types of search tasks using their own information literacy skills and they were answered to the questionnaire and an additional interview, if necessary. A total of 74 valid data were collected through the experiment, and we analyzed the data using SPSS Ver. 20. It revealed that Naver received a positive evaluation in the organization system aspect, particularly its systematic subject categorization and chronological browsing mechanisms. Old adults were preferred the icon-based labeling than the text-based labeling system, and showed a significant difference among their academic backgrounds.

초록보기
초록

본 연구의 목적은 대학도서관이 급격한 환경변화 속에 있는 대학의 환경을 반영하고, 정보기술의 발전을 반영함으로써 대학을 리드하는 기관으로서 우뚝 서기 위한 전략을 모색하기 위함이다. 이를 위해 대학도서관 사서들을 대상으로 설문을 수행하였으며, 그 결과는 다음과 같다. 첫째, 대학도서관 사서는 대학도서관과 관련된 빅이슈가 「대학도서관진흥법」, 대학도서관 평가 및 평가지표, 대학에서의 대학도서관의 가치, 대학도서관의 공간구성 및 기능변화라고 하였고, 대학의 환경변화, 정부의 대학에 대한 정책, 각종 국책사업, 각종 구조개혁이 대학도서관에 영향을 상당히 미친다고 하였다. 둘째, 대학도서관 사서는 도서관의 역할 변화로 학생의 정보자원 및 기술의 활용능력 향상, 학생의 독서능력 향상, 대학구성원의 연구능력 향상, 대학구성원 학습역량 향상 등에 기여할 수 있다고 하였다. 셋째, 대학도서관 사서는 이용자가 대학도서관에 가장 높게 요구하는 서비스를 전자책 및 정보자원의 확대 등으로 생각하고 있는 것으로 나타났다.

Abstract

This study was carried out for the university library to find out a strategy to stand tall as an institution to lead the university, by reflecting the university environment having with drastic environmental changes and reflecting the evolution of information technology. As a result, first, university librarians responded that big issues related to the university library is the University Library Promotion Act, University Library evaluation and assessment indicators, the value of university libraries at the university, and changing spatial composition and functions of the university library. Second, university librarians responded that changes of the university environment, government policy on universities, various national projects, and various university reform policy significantly affect to the university library. Third, about what you think would be helpful to the crisis in their universities as changing role of the library, they responded that they can contribute in terms of improving students’ information and technology literacy, improving students’ reading skills, improving research capacity, and improve students’ learning ability. Fourth, they responded that services that users demand the highest in the university library will be expansion of e-books and information resource.

정보관리학회지