바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 의미사전, 검색결과: 8
초록보기
초록

시맨틱 라이브러리는 의미사전을 구축함으로써 EDI 전자문서의 교환에 활용될 수 있다. 본 논문은 실무 개발자들이 메타데이터를 이용한 의미사전을 개발하는 과정에서 참고할 수 있는 시맨틱 라이브러리 설계정보를 기술한다. 시맨틱 라이브러리를 구성하는 요소로는 크게 시맨틱 요소(Semantic Element)와 시맨틱 단위(Semantic Unit), 매핑 테이블(Mapping Table) 등 3개로 구성된다. 본 논문에서는 이러한 구성요소들의 기본적인 특성과 개발 관련 설계 방법을 제안한다. 또한 이러한 구성요소와 제반 규칙을 준용하여 메타 데이터 간 의미적 교환을 위한 사전을 구축한 사례를 소개한다.

Abstract

Semantic libraries can be used for EDI messages to exchange by implementing the semantic dictionaries. This paper describes the design information of semantic libraries for the field engineers to implement the semantic dictionary using metadata. The components of semantic libraries are semantic elements, semantic units and mapping tables. The basic characteristics and design methods related implementing are proposed. Also the metadata semantic dictionaries including the components and rules are introduced.

2
이용구(계명대학교) ; 정영미(연세대학교) 2007, Vol.24, No.1, pp.321-342 https://doi.org/10.3743/KOSIM.2007.24.1.321
초록보기
초록

이 연구에서는 수작업 태깅없이 기계가독형 사전을 이용하여 자동으로 의미를 태깅한 후 학습데이터로 구축한 분류기에 대해 의미를 분류하는 단어 중의성 해소 모형을 제시하였다. 자동 태깅을 위해 사전 추출 정보 기반 방법과 연어 공기 기반 방법을 적용하였다. 실험 결과, 자동 태깅에서는 복수 자질 축소를 적용한 사전 추출 정보 기반 방법이 70.06%의 태깅 정확도를 보여 연어 공기 기반 방법의 56.33% 보다 24.37% 향상된 성능을 가져왔다. 사전 추출 정보 기반 방법을 이용한 분류기의 분류 정학도는 68.11%로서 연어 공기 기반 방법의 62.09% 보다 9.7% 향상된 성능을 보였다. 또한 두 자동 태깅 방법을 결합한 결과 태깅 정확도는 76.09%, 분류 정확도는 76.16%로 나타났다.

Abstract

This study presents an effective word sense disambiguation model that does not require manual sense tagging process by automatically tagging the right sense using a machine-readable dictionary, and attempts to classify the senses of those words using a classifier built from the training data. The automatic tagging technique was implemnted by the dictionary information-based and the collocation co-occurrence-based methods. The dictionary information-based method that applied multiple feature selection showed the tagging accuracy of 70.06%, and the collocation co-occurrence-based method 56.33%. The sense classifier using the dictionary information-based tagging method showed the classification accuracy of 68.11%, and that using the collocation co-occurrence-based tagging method 62.09%. The combined tagging method applying data fusion technique achieved a greater performance of 76.09% resulting in the classification accuracy of 76.16%.

3
고영만(성균관대학교) ; 이승준(성균관대학교 정보관리연구소) ; 송민선(성균관대학교 정보관리연구소) 2015, Vol.32, No.2, pp.131-152 https://doi.org/10.3743/KOSIM.2015.32.2.131
초록보기
초록

본 연구에서는 R2RML 방식과 Non-R2RML 방식을 각각 적용하여 RDB를 RDF 온톨로지로 변환한 결과를 비교하였다. RDB 기반의 구조적학술용어사전 데이터베이스인 STNet의 데이터를 대상으로, 변환이 완료된 데이터의 규모, 튜플당 변환에 걸리는 시간, 그리고 질의 응답 속도를 측정하였다. 변환 규모의 평가 결과 Non-R2RML 방식이 더 많은 수의 변환을 하였으며, 표현의 풍부성과 추론 가능성 정도를 높이는 변환을 수행한 것으로 나타났다. 튜플당 변환 시간의 경우 Non-R2RML 방식이 미세하지만 더 빠른 것으로 나타났으며, 질의 응답 속도는 두 방식 모두 300회 이상의 질의 횟수부터는 안정적인 성능을 보이면서 유사한 형태의 속도를 보였다. 측정에 대한 종합적 검토 결과 데이터의 변형이 빈번하고 새로운 데이터의 추가나 데이터들 간의 연결관계가 지속적으로 변화하는 STNet과 같은 동적인 RDB에는 Non-R2RML 방식이 적절한 것으로 평가되었다.

Abstract

This study described the results of converting RDB to RDF ontology by each of R2RML method and Non-R2RML method. This study measured the size of the converted data, the conversion time per each tuple, and the response speed to queries. The STNet, a structured terminology dictionary based on RDB, was served as a test bed for converting to RDF ontology. As a result of the converted data size, Non-R2RML method appeared to be superior to R2RML method on the number of converted triples, including its expressive diversity. For the conversion time per each tuple, Non-R2RML was a little bit more faster than R2RML, but, for the response speed to queries, both methods showed similar response speed and stable performance since more than 300 numbers of queries. On comprehensive examination it is evaluated that Non-R2RML is the more appropriate to convert the dynamic RDB system, such as the STNet in which new data are steadily accumulated, data transformation very often occurred, and relationships between data continuously changed.

초록보기
초록

포털사이트는 검색엔진을 넘어 사이버스페이스 자체를 의미할 정도로 개념과 영역이 확대되었다. 일반인들뿐만 아니라, 필요로 하는 학술정보가 서비스되기 때문에 연구자도 포털사이트를 많이 이용한다. 그동안 포털의 검색은 얼마나 많은 정보를 검색하게 해 줄 것인가 하는 양적인 면에 관심을 두었다. 그러나 최근에는 검색의 질에 보다 관심이 많아지고 있다. 이 논문은 포털이 제공하는 학술정보검색의 문제점을 분석하고, 비교적 신뢰성을 인정받는 사전 서비스와 학술정보를 연계함으로써 학술정보검색의 질을 향상하기 위한 시범적인 시도이다. 즉, 검증되고 압축적으로 정리된 사전의 표제어와 해당 표제어를 키워드로 하는 권위 있는 연구 성과를 연계시킴으로써, 사전을 검색할 때 주제어 관련 연구 성과까지 검색할 수 있게 하는 방안을 제시하고자 한다.

Abstract

Internet portals have been revolutionized not only as simple search engines but also as a new space for the Internet users. They have developed to give satisfying search results for academic information users. academic fields. However, their attention was given to the quantity rather than the quality of the results. This tendency is now changing. This study addresses the problems in the search process using the current portal sites and presents an integrated scholarly information service where users can access more organized and trustworthy information linked with online technical keyword dictionary. When a user enter a keyword on a portal site, he/she can access to high quality scholarly information resources linked with keyword. This could assure the user to get an expanded knowledge with confirmation.

5
고영만(성균관대학교) ; 송민선(성균관대학교 정보관리연구소) ; 김비연(성균관대학교) ; 민혜령(성균관대학교) 2013, Vol.30, No.2, pp.227-243 https://doi.org/10.3743/KOSIM.2013.30.2.227
초록보기
초록

본 연구의 목적은 저자키워드의 출현빈도와 해당 키워드가 속한 논문들의 총피인용횟수 간 상관관계 여부를 확인하고자 하는 것이다. 연구의 배경은 인문사회과학 분야 학술용어사전을 구축하는데 있어서 실제 연구에서의 활용도가 높고 다른 키워드와의 의미적 연관관계가 많은 학술용어를 추출하기 위한 방법론을 개발해 보고자 하는 것이다. 본 연구의 목적을 이루기 위해 한국연구재단 한국학술지인용색인(KCI)에 수록된 2007년에서 2011년까지의 인문학 및 사회과학 분야 학술지 논문의 저자키워드와 피인용횟수를 분석하였다. 분석 결과 저자키워드의 출현빈도와 해당 키워드가 속한 논문들의 총피인용횟수는 통계적으로 상관관계가 있으며, 저자키워드의 출현빈도가 늘어날수록 논문의 총피인용횟수도 많아지는 것으로 나타났다.

Abstract

The purpose of this study is to verify the correlation between the appearance frequency of author keyword and the number of citation in journal articles. In this study, we were trying to develop a methodology that can select the term having semantic relation with other terms and higher utilization to build a structured scientific glossary. In order to achieve this purpose, we analyzed the number of citation and the author keyword of the humanities and social science journal articles of the Korea Citation Index (KCI) from 2007 to 2011. This study found a correlation between appearance frequency of author keyword and the number of citation of the journal articles, with higher appearance frequency of author keyword of the journal articles being more cited.

초록보기
초록

기계학습 기반 문서범주화 기법에 있어서 최적의 자질을 구성하는 것이 성능향상에 있어서 중요하다. 본 연구는 학술지 수록 논문의 필수적 구성요소인 저자 제공 키워드와 논문제목을 대상으로 자질확장에 관한 실험을 수행하였다. 자질확장은 기본적으로 선정된 자질에 기반하여 WordNet과 같은 의미기반 사전 도구를 활용하는 것이 일반적이다. 본 연구는 키워드와 논문제목을 대상으로 WordNet 동의어 관계 용어를 활용하여 자질확장을 수행하였으며, 실험 결과 문서범주화 성능이 자질확장을 적용하지 않은 결과와 비교하여 월등히 향상됨을 보여주었다. 이러한 성능향상에 긍정적인 영향을 미치는 요소로 파악된 것은 정제된 자질 기반 및 분류어 기준의 동의어 자질확장이다. 이때 용어의 중의성 해소 적용과 비적용 모두 성능향상에 영향을 미친 것으로 파악되었다. 본 연구의 결과로 키워드와 논문제목을 활용한 분류어 기준 동의어 자질 확장은 문서 범주화 성능향상에 긍정적인 요소라는 것을 제시하였다.

Abstract

Identifying optimal feature sets in Text Categorization(TC) is crucial in terms of improving the effectiveness. In this study, experiments on feature expansion were conducted using author provided keyword sets and article titles from typical scientific journal articles. The tool used for expanding feature sets is WordNet, a lexical database for English words. Given a data set and a lexical tool, this study presented that feature expansion with synonymous relationship was significantly effective on improving the results of TC. The experiment results pointed out that when expanding feature sets with synonyms using on classifier names, the effectiveness of TC was considerably improved regardless of word sense disambiguation.

7
김인후(중앙대학교 문헌정보학과 대학원) ; 김성희(중앙대학교 문헌정보학과) 2022, Vol.39, No.3, pp.293-310 https://doi.org/10.3743/KOSIM.2022.39.3.293
초록보기
초록

본 연구에서는 한국어 데이터로 학습된 BERT 모델을 기반으로 문헌정보학 분야의 문서를 자동으로 분류하여 성능을 분석하였다. 이를 위해 문헌정보학 분야의 7개 학술지의 5,357개 논문의 초록 데이터를 학습된 데이터의 크기에 따라서 자동분류의 성능에 어떠한 차이가 있는지를 분석, 평가하였다. 성능 평가척도는 정확률(Precision), 재현율(Recall), F 척도를 사용하였다. 평가결과 데이터의 양이 많고 품질이 높은 주제 분야들은 F 척도가 90% 이상으로 높은 수준의 성능을 보였다. 반면에 데이터 품질이 낮고 내용적으로 다른 주제 분야들과 유사도가 높고 주제적으로 확실히 구별되는 자질이 적을 경우 유의미한 높은 수준의 성능 평가가 도출되지 못하였다. 이러한 연구는 미래 학술 문헌에서 지속적으로 활용할 수 있는 사전학습모델의 활용 가능성을 제시하기 위한 기초자료로 활용될 수 있을 것으로 기대한다.

Abstract

In this study, we analyzed the performance of the BERT-based document classification model by automatically classifying documents in the field of library and information science based on the KoBERT. For this purpose, abstract data of 5,357 papers in 7 journals in the field of library and information science were analyzed and evaluated for any difference in the performance of automatic classification according to the size of the learned data. As performance evaluation scales, precision, recall, and F scale were used. As a result of the evaluation, subject areas with large amounts of data and high quality showed a high level of performance with an F scale of 90% or more. On the other hand, if the data quality was low, the similarity with other subject areas was high, and there were few features that were clearly distinguished thematically, a meaningful high-level performance evaluation could not be derived. This study is expected to be used as basic data to suggest the possibility of using a pre-trained learning model to automatically classify the academic documents.

8
박주현(건국초등학교 사서교사) ; 박성훈(행정안전부 국가정보자원관리원) ; 강봉숙(대구 다사고등학교) 2019, Vol.36, No.3, pp.81-107 https://doi.org/10.3743/KOSIM.2019.36.3.081
초록보기
초록

본 연구의 목적은 문헌정보학에서 미디어 교육을 적극적으로 수용해야 하는 당위성을 주장하고 문헌정보학의 관점에서 미디어의 개념과 분류기준에 따라 미디어의 종류를 제시하는 데 있다. 미디어의 개념에 따른 미디어 종류를 제시하기 위하여 미디어의 사전적 개념과 목록규칙 RDA에 제시된 미디어 분류를 고찰하였고, 고등학교 ‘언어와 매체’ 교과서와 한국언론학회의 초․중등학생용 교육 자료 및 문헌정보학 교과서를 분석하였다. 그리고 분석 결과를 바탕으로 미디어의 개념과 분류기준에 따른 미디어의 종류를 제시하였다. 본 연구에서는 미디어를 매체와 동일한 의미로 설정하고, 미디어가 의사소통의 수단으로 기능하며, 정보를 담고 있거나 전달하거나 재현하는 물리적인 물체를 통해 그 속에 담긴 정보를 인간의 감각기관을 통해 획득할 수 있는 것으로 정의하였으며, ‘미디어 속 정보’, ‘자료’, ‘재현 장치’를 미디어의 3가지의 논리적 구성요소로 설정하였다.

Abstract

The purpose of this study is to assert the justification for actively accepting media education in Library and Information Science and to suggest the media type according to the concept and classification criteria of the media from the perspective of Library and Information Science. In order to present the media type according to the concept of the media, the dictionary concept of the media was reviewed, the language and media for high school students in Korean language, the educational materials for elementary and secondary school students written by Media Education Committee of Korean Society for Journalism & Communication Studies, the educational textbooks for elementary and secondary school students in Library and Information Science, and media classification presented in the RDA of the cataloging rules were analyzed. In addition, the implications were derived based on the analysis results of the concepts and media type. The concept of media was set based on the analysis results and implications, and the media types were presented according to the concepts and classification criteria. In this study, the media was set up in the same meaning as the medium, and it was defined that the media function as a means of communication and that information contained in it can be obtained through the human sensory apparatus through physical objects that contain, transmit or reproduce information. The media was set up as three logical components of the media in this study: information in the media, materials, and representation devices.

정보관리학회지