바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 한국어, 검색결과: 15
초록보기
초록

한국어 및 영어의 글쓰기를 도와주는 문장 및 문단 제공시스템을 구축하기 위하여 색인작성과 탐색시에 필요한 색인언어를 연구하였다. 색인언어로 명사어와 술어 및 부사어를 선정하였고 여러 가지 보조 색인기호들도 추가하였다. 접근점으로 주제명과 키워드를 사용하였고 키워드 검색은 1절, 2절, 3 절, 문맥첨가 탐색을 포함하였다. 검색의 만족도는 긍정적이었으며 데이터베이스의 양과 질을 충실히 보완한다면 문장이나 문단을 제공하여 주는 시스템은 효과적일 수 있다.

Abstract

An indexing language were studied to construct the sentences and paragraphs providing system aided to write a Korean or English composition. The indexing language includes the index terms like noun, predicate, and adverb. and also various index symbols. The subject name and the keyword Included the symbols, which Indicate the connectives between clauses in a sentence, is used as the access point. The search results show this system will be effective with large database and developed retrieval methods.

2
최석두(한성대학교) ; 이우범(한성대학교) ; 김이겸(광주대학교) ; 이정연(한국학술진흥재단 지식정보센터) ; 최상기(전북대학교) ; 한상길(대림대학교) 2006, Vol.23, No.4, pp.147-164 https://doi.org/10.3743/KOSIM.2006.23.4.147
초록보기
초록

Abstract

This paper reports an effort to construct a grand-scale Korean thesaurus that can be used for enhancing retrieval performance in various fields. This thesaurus is currently being used for indexing and retrieving purpose and new terms are being added to it. As the new demands on retrieval performance increase in Korea, developing a grand-scale ontology appears to be necessary so a project is undertaken to transfer the current thesaurus into an ontology system. The paper describes how the thesaurus is constructed and prepared to be the base for an ontology system.

3
허영수(연세대학교 언어정보학협동과정) ; 박지홍(연세대학교) 2021, Vol.38, No.2, pp.65-86 https://doi.org/10.3743/KOSIM.2021.38.2.065
초록보기
초록

외국어 교육 분야에서 학습자는 교육의 한 축을 이루는 중요한 부분이지만 한국어교육의 경우 교육 내용, 교수 방법, 교재 등에 비해 학습자 연구는 미진한 면이 있었다. 이에 학습자 연구, 그중에서도 학습전략 연구가 어떻게 이루어져 왔는지를 분석하고 더 나은 교육을 위해 연구가 필요한 부분을 도출해 보는 것은 의미가 있다. 본 연구에서는 한국어교육 분야에서 학습전략 연구의 현황을 분석하기 위해 학술지와 학위논문의 제목에 대해 동시출현단어 분석을 진행하였다. 연구 결과, 한국어 학습자의 학습전략 관련 가장 많은 연구가 이루어진 분야는 ‘읽기’이고, 대상은 ‘중국인 유학생’과 ‘결혼이민자’였다. 또한, 연구 주제에 대한 서브그룹 분석 결과를 보면 주요 서브그룹이 네 개가 나타나는데 ‘학문 목적 읽기’ 관련 그룹, ‘요청, 거절, 대화 등 화행’ 관련 그룹, ‘쓰기’ 관련 그룹, ‘어휘, 듣기’ 관련 그룹이다. 이를 통해 한국어 학습자의 학습전략과 관련해 연구자들의 주요 관심 분야가 ‘읽기, 화행’ 등임을 알 수 있으며, 연구 대상과 연구 분야가 부분적으로 편중되어 있는 상황이므로 다양한 분야와 대상으로 연구를 확대할 필요가 있음을 알 수 있다.

Abstract

In the foreign language education, learners are an important part of education, however in the Korean language education, the study of learners was insufficient compared to the contents of education, teaching methods and textbooks. Therefore, it is meaningful to analyze how learner research, especially learning strategy research, has been conducted and derive areas that need research for better education. In this study, co-word analysis was conducted on the titles of academic journals and dissertations in order to analyze the learning strategy research in Korean language education. I found it is about “reading” that the most studies related to Korean language learners’ learning strategies were conducted and those studies’ subjects mostly were ‘Chinese international students’ and ‘marriage-immigrants’. In addition, the results of the subgroup analysis on the research topic show four major subgroups: a group related to ‘reading for academic purposes’, a group related to ‘request, rejection, conversation, etc.’, a group related to ‘writing’, and a group related to ‘vocabulary, listening’. This shows that the researchers’ major interests in studying Korean learner’s strategies are “reading” and “speaking” and their studies have been concentrated in the specific areas. Therefore, it is necessary for researchers to study various functions and subjects in Korean language learner’s learning strategies.

초록보기
초록

학술 문헌 원문에서 발견되는 인용문은 인용에 기초한 학술문헌 자동 요약, 리뷰 논문 자동 생성, 인용문 감성 분석, 인용문 기반 문헌 검색 등 다양한 학술 정보 서비스의 창출을 가능케 한다. 이러한 서비스가 가능하기 위해서는 원문 텍스트로부터 인용문의 자동 인식이 선행되어야 한다. 그러나 인용문의 인식은 인용 표지가 부착되지 않은 암묵 인용문의 존재로 인해 그 처리가 용이하지 않다. 영어의 경우 최근 이에 대한 연구가 집중되고 있으나 한국어 학술 문헌 내 인용문의 자동 인식 연구는 찾기 힘들다. 이 논문은 한국어 인용문을 자동 인식하는 규칙 기반의 방법을 제시하고 다양한 베이스라인 기법들과 인용문 인식 성능을 비교하였다. 제안된 방법은 테스트 셋 내 전체 암묵 인용문의 30%를 약 70%의 정확률로 인식할 수 있었다.

Abstract

Identifying citing sentences from article full-text is a prerequisite for creating a variety of future academic information services such as citation-based automatic summarization, automatic generation of review articles, sentiment analysis of citing statements, information retrieval based on citation contexts, etc. However, finding citing sentences is not easy due to the existence of implicit citing sentences which do not have explicit citation markers. While several methods have been proposed to attack this problem for English, it is difficult to find such automatic methods for Korean academic literature. This article presents a rule-based approach to identifying Korean citing sentences. Experiments show that the proposed method could find 30% of implicit citing sentences in our test data in nearly 70% precision.

초록보기
초록

이 연구에서는 프로파일링 분석과 동시출현단어 분석을 이용해 인접 학문과의 연관성을 바탕으로 한국어교육학의 정체성을 분석하고자 하였다. 먼저, 한국어교육학, 국어교육학, 국어학 학술지의 논문에서 추출한 주제어를 기반으로 저널 프로파일링 분석을 수행하였고 그 결과 한국어교육학 분야의 학술지들이 하나의 독립된 군집을 형성하는 것으로 나타났다. 그리고 학문 분야 프로파일링 분석과 동시출현단어 분석을 이용해 학문 분야 간 관계를 분석한 결과 한국어교육학이 국어학보다 국어교육학과 더 큰 유사성을 가지는 것으로 나타났다. 마지막으로, 동시출현단어 분석을 통해 세 학문 분야의 지적 구조를 비교․분석하였다. 이를 통해 한국어교육학에서만 출현한 주제들을 확인함으로써 인접학문들과의 관계 속에서 한국어교육학이 드러내는 정체성을 파악할 수 있었다.

Abstract

This study aims at establishing the identity of teaching Korean as a Foreign Language (KFL) domain by using journal profiling and co-word analysis in comparison with the relevant and adjacent domains. Firstly, by extracting and comparing topic terms, we calculate the similarity of academic journals of the three domains, KFL, teaching Korean as a Native Language (KNL), and Korean Linguistics (KL). The result shows that the journals of KFL form a distinct cluster from the others. The profiling analysis and co-word analysis are then conducted to visualize the relationship among all the three domains in order to uncover the characteristics of KFL. The findings show that KFL is more similar to KNL than to KL. Finally, the comparison of knowledge structures of these three domains based on the co-word analysis demonstrates the uniqueness of KFL as an independent domain in relation with the other relevant domains.

초록보기
초록

국내의 외국인 유학생들의 증가에도 불구하고, 유학생들의 건강정보탐색행위에 대한 연구는 부족한 실정이다. 본 연구는 한국에 거주하는 외국인 유학생의 건강정보탐색행위를 설문지와 결정적사건기법을 이용한 면담을 병행하여 조사하였다. 최근 경험한 건강정보 요구 중에는 코로나와 관련된 정보요구(코로나 검사, 증상, 백신)와 병원을 찾는 요구가 가장 많이 보고되었다. 건강정보탐색 과정에서 경험한 어려움으로는 언어의 문제가 가장 많았고, 한국 의료시스템에 대한 이해의 부족, 인터넷상의 정보 불충분 또는 정보과잉 등도 보고되었다. 언어의 장벽에도 불구하고, 유학생들은 한국어 정보원(친구/가족, 웹사이트, 소셜미디어)을 주요 건강정보원으로 사용하였다. 유학생들은 구글번역기를 사용하거나, 이중언어가 가능한 친구/가족의 도움을 받아 한국어 정보원을 통해 건강정보를 탐색하는 것으로 조사되었다. 한국 체류기간이 짧거나 한국어 능력이 부족한 경우, 소셜네트워크 상의 커뮤니티를 통해 건강정보를 얻는 경향을 보이는 반면, 한국 체류기간이 길고 한국어 능력이 좋을수록 웹사이트를 사용하는 것으로 나타났다. 필요한 건강정보를 찾는데 있어 어느 정도 자신감을 가지는가에 대한 질문에는 참가자의 28%만이 긍정적인 대답을 하였다. 본 연구 결과를 통한 유학생들의 건강정보추구행위에 대한 이해를 바탕으로 유학생들이 필요한 건강정보를 탐색하는데 도움을 줄 수 있는 방안에 관한 제언을 제시하였다.

Abstract

Despite the increasing number of international students in Korea, there is a lack of research on the health information-seeking behavior of international students. This study examined the health information search behavior of international students in Korea through a questionnaires and in-depth interviews adopting Critical Incident Technique. Most frequent health information needs that the participants experienced were related to Covid-19 and locating doctors/hospitals. The difficulties in seeking health information were language barriers, lack of knowledge of the Korean medical system, insufficient or overflowing information on the Internet. However, despite the language barrier, international students mainly used Korean sources (friends/family, websites, social media) for searching health information. In order to search health information on Korean websites, they used Google Translator or got help from bilingual friends/family members. The participants who have lived in Korea for a shorter period of time or who have lower Korean language proficiency tend to obtain health information through the community on social networks; whereas the longer the period of residence in Korea and the better the Korean language proficiency, the more likely to use websites. Only 28% of the participants gave positive answers to the question asking their confidence in finding the health information they needed. It is discussed how to help international students find accurate and credible health information.

7
김수경(한국정보통신대학교) ; 안기홍(한밭대학교) ; 최호진(한국과학기술원) 2008, Vol.25, No.4, pp.43-66 https://doi.org/10.3743/KOSIM.2008.25.4.043
초록보기
초록

시맨틱 웹 기술의 제안과 더불어 다양한 분야에 온톨로지의 특징을 적용한 기술 개발 연구가 많이 진행되고 있다. 인간이 소유한 개념을 가장 적절하게 표현하기 위해 현재에도 OWL, RDF와 같은 온톨로지 언어의 표현력을 확장시키기 위해 N-ary 관계나 모델-이론 의미론과 같은 개발이 진행되고있다. 본 연구는 한국어에 있어 문장이 내포하는 의미를 정확하게 결정하기 위해 문장의 구조에 따라 달라지는 단어의 의미를 연관할 수 있도록 N-ary 관계와 디자인 기반이 적용된 온톨로지의 지식 표현 방법을 연구하였다. 특히 다양한 지식 영역을 포함하는 다의어(polysemy)와 동의어(synonym)의 특징을 갖는 단어에 있어 각 지식 영역으로 분류되어 각 지식 영역에 있는 유사한 의미를 가진 단어로 확장되어 유사한 의미를 가진 단어가 포함된 문장의 경우 까지도 확장할 수 있는 표현 방법을 연구하였다. 연구의 검증을 위해 사용자가 입력한 병증 문장을 제안된 방법에 따라 구축된 온톨로지내 지식 관계와 의미 결정을 위한 추론 표현 방법을 이용하여 병증의 의미를 결정하고 그에 따른 진단을 제공하는 실험 시스템을 구현하였고, 한국어가 갖고 있는 문장의 유의성, 모호성, 복합성 의 특징을 보유한 증상문들의 실험 결과 의미 결정과 유사 의미 확장에 있어 우수한 성능을 보여주었다.

Abstract

Currently be proceeded a lot of researchers for ‘user information demand description' for interface of an information retrieval system or Web search engines, but user information demand description for a natural language form is a difficult situation. These reasons are as they cannot provide the semantic similarity that an information retrieval model can be completely satisfied with variety regarding an information demand expression and semantic relevance for user information description. Therefore, this study using the description logic that is a knowledge representation base of OWL and a vector model-based weight between concept, and to be able to satisfy variety regarding an information demand expression and semantic relevance proposes a decision way for perfect assistances of user information demand description. The experiment results by proposed method, semantic similarity of a polyseme and a synonym showed with excellent performance in decision.

8
정영미(연세대학교) ; 한승희(서울여자대학교) ; 김명옥(숭의여자대학) ; 유재복(한국원자력연구원) ; 이재윤(연세대학교) 2002, Vol.19, No.1, pp.135-161 https://doi.org/10.3743/KOSIM.2002.19.1.135
초록보기
초록

과학기술 분류표, 시소러스, 용어사전 등의 주요한 색인 및 검색 도구를 한국어, 영어, 일본어의 3개 언어로 통합 구축하고 활용할 수 있도록 다기능, 다국어 과학기술 통합 개념체계의 개발 방안을 마련하였다. 개념을 기본 단위로 시소러스 모델을 개발하였으며, 용어사전 레코드는 ISO 12620 표준에 근거하여 필수요소를 지정하였다. 또한 과학기술분야 표준분류표를 대분류 수준까지 작성하고 기존 분류표와의 매핑 테이블을 작성하여 다른 분류표를 통한 접근이 가능하도록 하였다. 시소러스, 용어사전, 분류표의 원활한 상호 연계와 운용을 위해서 통합 개념체계 모형을 설계하였다. 본 연구에서 개발한 통합 개념체계를 이용하여 원자력 분야를 대상으로 한 프로토타입 시스템을 구축하고 실제 검색 사례를 제시하였다.

Abstract

9
김선우(경기대학교 문헌정보학과) ; 고건우(경기대학교 문헌정보학과) ; 최원준(한국과학기술정보연구원 콘텐츠 큐레이션센터) ; 정희석(한국과학기술정보연구원 콘텐츠 큐레이션센터) ; 윤화묵(한국과학기술정보연구원 콘텐츠큐레이션센터) ; 최성필(경기대학교) 2018, Vol.35, No.4, pp.141-164 https://doi.org/10.3743/KOSIM.2018.35.4.141
초록보기
초록

최근 학술문헌의 양이 급증하고, 융복합적인 연구가 활발히 이뤄지면서 연구자들은 선행 연구에 대한 동향 분석에 어려움을 겪고 있다. 이를 해결하기 위해 우선적으로 학술논문 단위의 분류 정보가 필요하지만 국내에는 이러한 정보가 제공되는 학술 데이터베이스가 존재하지 않는다. 이에 본 연구에서는 국내 학술문헌에 대해 다중 분류가 가능한 자동 분류 시스템을 제안한다. 먼저 한국어로 기술된 기술과학 분야의 학술문헌을 수집하고 K-Means 클러스터링 기법을 활용하여 DDC 600번 대의 중분류에 맞게 매핑하여 다중 분류가 가능한 학습집합을 구축하였다. 학습집합 구축 결과, 메타데이터가 존재하지 않는 값을 제외한 총 63,915건의 한국어 기술과학 분야의 자동 분류 학습집합이 구축되었다. 이를 활용하여 심층학습 기반의 학술문헌 자동 분류 엔진을 구현하고 학습하였다. 객관적인 검증을 위해 수작업 구축한 실험집합을 통한 실험 결과, 다중 분류에 대해 78.32%의 정확도와 72.45%의 F1 성능을 얻었다.

Abstract

Recently, as the amount of academic literature has increased rapidly and complex researches have been actively conducted, researchers have difficulty in analyzing trends in previous research. In order to solve this problem, it is necessary to classify information in units of academic papers. However, in Korea, there is no academic database in which such information is provided. In this paper, we propose an automatic classification system that can classify domestic academic literature into multiple classes. To this end, first, academic documents in the technical science field described in Korean were collected and mapped according to class 600 of the DDC by using K-Means clustering technique to construct a learning set capable of multiple classification. As a result of the construction of the training set, 63,915 documents in the Korean technical science field were established except for the values ​​in which metadata does not exist. Using this training set, we implemented and learned the automatic classification engine of academic documents based on deep learning. Experimental results obtained by hand-built experimental set-up showed 78.32% accuracy and 72.45% F1 performance for multiple classification.

10
정영미(연세대학교) ; 이용구(계명대학교) 2005, Vol.22, No.2, pp.125-145 https://doi.org/10.3743/KOSIM.2005.22.2.125
초록보기
초록

이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음, 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 92%의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 67% 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 39.6%의 정확률을 보였고, EM 알고리즘 통합 검색이 약 36%의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 37%와 비교하면 나이브 베이즈 통합 검색은 약 7.4%의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 3%의 성능 저하율을 보였다.

Abstract

This paper presents a semantic vector space retrieval model incorporating a word sense disambiguation algorithm in an attempt to improve retrieval effectiveness. Nine Korean homonyms are selected for the sense disambiguation and retrieval experiments. The total of approximately 120,000 news articles comprise the raw test collection and 18 queries including homonyms as query words are used for the retrieval experiments. A Naive Bayes classifier and EM algorithm representing supervised and unsupervised learning algorithms respectively are used for the disambiguation process. The Naive Bayes classifier achieved 92% disambiguation accuracy, while the clustering performance of the EM algorithm is 67% on the average. The retrieval effectiveness of the semantic vector space model incorporating the Naive Bayes classifier showed 39.6% precision achieving about 7.4% improvement. However, the retrieval effectiveness of the EM algorithm-based semantic retrieval is 3% lower than the baseline retrieval without disambiguation. It is worth noting that the performances of disambiguation and retrieval depend on the distribution patterns of homonyms to be disambiguated as well as the characteristics of queries.

정보관리학회지