바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 전문용어, 검색결과: 7
1
한희정(전북대학교) ; 김태영(전북대학교) ; 두효철(전북대학교) ; 오효정(전북대학교) 2017, Vol.34, No.4, pp.81-99 https://doi.org/10.3743/KOSIM.2017.34.4.081
초록보기
초록

기술문서는 지식정보사회에서 생성되는 중요 연구 성과물로, 이를 제대로 활용하기 위해서는 정보 요약 및 정보추출과 같은 개선된 정보 처리 방법을 토대로 기술문서 활용의 편의성을 높여줄 필요가 있다. 이에 본 연구는 기술문서의 핵심 정보를 추출하기 위한 방안으로, 기술문서의 구조와 정의문 패턴을 기반으로 전문용어 및 정의문을 자동 추출하고, 이를 기반으로 전문용어사전을 구축할 수 있는 시스템을 제안하였다. 나아가 전문용어사전을 지식메모리로서 보다 다양하게 활용할 수 있도록 전문용어사전에 기반한 개인화서비스 제공방안을 제안하였다. 이처럼 전문용어 및 정의문 자동추출을 기반으로 전문용어사전을 구축하게 되면 새롭게 등장하는 전문용어를 빠르게 수용할 수 있어 이용자들이 최신정보를 보다 손쉽게 찾을 수 있다. 더불어 개인화된 전문용어사전을 이용자에게 제공한다면 전문용어사전의 가치와 활용성, 검색의 효율성을 극대화할 수 있다.

Abstract

Technical documents are important research outputs generated by knowledge and information society. In order to properly use the technical documents properly, it is necessary to utilize advanced information processing techniques, such as summarization and information extraction. In this paper, to extract core information, we automatically extracted the terminologies and their definition based on definitional sentences patterns and the structure of technical documents. Based on this, we proposed the system to build a specialized terminology dictionary. And further we suggested the personalized services so that users can utilize the terminology dictionary in various ways as an knowledge memory. The results of this study will allow users to find up-to-date information faster and easier. In addition, providing a personalized terminology dictionary to users can maximize the value, usability, and retrieval efficiency of the dictionary.

2
최윤수(한국과학기술정보연구원) ; 정창후(한국과학기술정보연구원) ; 조현양(경기대학교) 2011, Vol.28, No.1, pp.89-104 https://doi.org/10.3743/KOSIM.2011.28.1.089
초록보기
초록

대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

Abstract

Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In order to extract these entities automatically from scientific documents at once, we developed a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer and terminology extractor.

초록보기
초록

본 연구에서는 웹기반 정보검색시스템을 사용함에 있어 이용자 편의성을 최적화할 수 있는 검색 인터페이스 표준 용어를 제안하였다. 이를 위해 국립중앙도서관을 비롯하여 주요 전문 정보를 제공하고 있는 기관의 웹페이지를 조사. 분석하였다. 분석한 결과에 근거하여 웹기반 정보검색시스템에서 사용자 오류와 혼란을 최소화하고 검색 편의성을 극대화할 수 있는 표준 용어를 제안하였다. 제안의 기준은 해당 용어의 사용빈도와 의미를 활용하였다. 분석은 검색관련 기본 모듈을 비롯하여 검색범위설정 모듈, 이용자 지원 모듈에서 사용된 용어 가운대 최소 50%이상의 기관에서 제공하는 기능에 존재하는 용어만을 대상으로 하였다. 본 연구의 결과는 웹 기반 검색화면 설계 및 구축 전문가에게 검색 관련 용어선정을 위한 표준 자료로 활용될 것이다.

Abstract

This research suggesrs the method of standardizing terms for raising the dffectiveness of information retrival. Especiallly for web search, I propose the proper terms which they will use in retriveal by surveying and analysing the related terms abour information retrieval interface. The proper terms will solve the eqyivocaiton for user and increase the retrieval effectiveness. And I think the proposed terms will be used to standard data for designers who are construct the user interface systems.

4
이혜영(한국과학기술원) ; 곽승진(충남대학교) 2008, Vol.25, No.1, pp.191-210 https://doi.org/10.3743/KOSIM.2008.25.1.191
초록보기
초록

일반적으로 문헌을 검색하고 접근하기 위하여 주제색인과 같은 주제어를 활용하곤 한다. 그렇다면 문헌의 내용과 문헌의 주제어는 분명히 어떤 밀접한 상관관계가 있을 것으로 예측해볼 수 있다. 본 연구는 이러한 의문점에서 출발하여, 디지털콘텐트의 본문내용이 비교적 짜임새 있게 정형화되어 있는 석사 학위논문을 연구문헌으로 한정하여 학위논문 전문에서 나타나는 학위논문의 주제어 분포도를 연구하였다. 학위논문의 주제어는 논문 저자가 부여한 주제어를 사용하되, 학위논문 전문은 ‘목차’, ‘서론’, ‘이론배경’, ‘본론’, ‘결론’, ‘참고문헌’의 내용위치로 분할하여 내용위치에 따른 주제어의 출현율을 확인하였다. 연구대상 학위논문 전문은 1226.3개의 용어, 5152.3번의 용어 출현을 보였다. 학위논문 저자가 부여한 주제어는 12~13개 용어로 구성되어 있었다. 연구결과, 전문 내용위치에 따른 주제어의 출현율은 ‘목차’ 11.4%와 ‘서론’ 11.2%에서 가장 높았으며(11%), 다음 순위는 내용위치 ‘결론’ 9.8%이었다.

Abstract

We would generally use subject terms such as subject indexing for searching and accessing documents. So then, there must be any relationship between document's full-text and its subject terms. This study is started in this question. Master's theses in field of science and technology are worked with because full-text is relatively formatted. This study is to study locations of subject term on Thesis, distribution patterns of subject terms on content of full-text; ‘Contents’, ‘Introduction’, ‘Theory’, ‘Main subject’, ‘Conclusion’ and ‘References’. Thesis were averagely composed of 1226.3 terms. And Subject terms were averagely compose of 12~13 terms. As a result, ‘Contents’ and ‘Introduction’ have had the most frequency of subject.

초록보기
초록

웹 상의 의학 분야 자료들은 방대한 규모로 존재하며, 각 검색엔진에서는 이를 분류하여 제공하고 있으나 그 구성에 있어서 일관성과 체계성이 부족하다. 따라서 본 논문은 검색엔진에서 의학 분야 웹 자료 분류체계를 구성하기 위하여 의학 전문 문헌분류표인 NLMC를 준용하고, 항목의 배열이 주제간 관련성을 기반으로 이루어져야 한다는 것을 제안하였다. 또한 순환성을 고려한 1차 분류 및 2차 분류 항목에서의 중복 분류시, 그에 대한 명확한 기준이 설정되어야 하며, 분류 항목명을 의학 분야 표준 용어집인 MeSH와 의학용어집의 용어로 선택하여 기존의 도서관 정보검색시스템과의 상호호환성을 높여야 한다는 것을 제안하였다.

Abstract

There are lots of Web materials in the field of medicine and many search engines classify the medical materials on the Web through directories. But the organization of these directories are wanting in consistency and systematization. In order for manager of search engines to organize medical materials on the Web systematically, this paper suggests several guidelines. NLMC, a special classification system for medicine, need to be applied to develop directories of medicine in search engines. Also, items of the directories should be arranged based on the relevance of subjects among subfields of medical science. For classifying an item to several directories repeatedly, clear criteria should be established. In addition to, controlled vocabularies or glossaries for medicine such as MeSH and the English-Korean, Korean-English Medical Terminology Collection should be used for selection of the name of items in medical directories.

6
김미령(서울지방경찰청 사서) ; 노윤주(경찰청 사서) ; 김성훈(성균관대학교 문헌정보학과 초빙교수) 2019, Vol.36, No.4, pp.253-277 https://doi.org/10.3743/KOSIM.2019.36.4.253
초록보기
초록

4차 산업혁명시대를 맞아 데이터의 중요성은 심화되고 있으나, 개인정보보호 등의 문제로 데이터의 활용이 쉽지 않은 경우가 많이 있다. 형사사법정보는 범죄 예측 및 예방, 범죄수사 과학화, 양형합리화 등 다양한 활용가치가 예상됨에도 현재 개인정보보호와 형사사법정보 관련 법률적 해석 문제로 활용이 상당히 제한되고 있다. 본 연구는 형사사법정보의 구조화․범주화를 통해 ‘범죄데이터’로 전환하여 빅데이터로서 활용하도록 제안하였으며, ‘범죄데이터’ 활용시 법률적 문제, 활용가치, 데이터 생성 및 활용시 고려사항을 전문가를 통해 검증하고 향후 전략적 발전방안을 도출하였다. 연구결과, ‘범죄데이터’는 개인정보보호문제는 해결된 것으로 보여지나, 형사사법정보 관련법에 명시할 필요는 있으며, 빅데이터 활용을 위해 분석 가능하도록 표준화된 형태로 정리되는 것이 시급함이 밝혀졌다. 향후 진행방향으로는 데이터 요소 도출, 용어사전 시소러스 구축, 데이터 등급화를 위한 개인민감정보 정의 및 등급지정, 비정형데이터의 정형화를 위한 알고리즘 개발 등을 제시하였다.

Abstract

In the era of the 4th Industrial Revolution, the importance of data is intensifying, but there are many cases where it is not easy to use data due to personal information protection. Although criminal justice information is expected to have various useful values such as crime prediction and prevention, scientific investigation of criminal investigations, and rationalization of sentencing, the use of criminal justice information is currently limited as a matter of legal interpretation related to privacy protection and criminal justice information. This study proposed to convert criminal justice information into ‘crime data’ and use it as big data through the structuralization and categorization of criminal justice information. And when using “crime data,” legal issues, value in use, considerations for data generation and use were verified by experts, and future strategic development plans were identified. Finally we found that ‘crime data’ seems to have solved the privacy problem, but it is necessary to specify in the criminal justice information related law and it is urgent to be organized in a standardized form for analysis to use big data. Future directions are to derive data elements, construct a dictionary thesaurus, define and classify personal sensitive information for data grading, and develop algorithms for shaping unstructured data.

7
성희혜(숙명여자대학교 문헌정보학과 석사졸업) ; 이혜은(숙명여자대학교 문헌정보학과 부교수) 2021, Vol.38, No.3, pp.239-262 https://doi.org/10.3743/KOSIM.2021.38.3.239
초록보기
초록

「조선의보」는 일제강점기에 일본의 의사단체에 대항하여 조선인 의학자들이 창립한 단체인 조선의사협회에서 발간된 최초의 우리말 의학학술지이다. 본 연구는 계량서지학적 연구방법을 사용하여 「조선의보」를 분석하였다. 먼저, 112편의 논문 제목에서 MeSH (Medical Subject Headings) 용어를 추출하여 주제 경향을 분석하고, 저자의 특성, 논문에 사용된 언어를 파악하였다. 이어서 참고문헌의 발행국과 발행 연도를 분석하고 좌담회의 제목에서 추출한 키워드의 빈도분석을 통하여 당시 연구자들의 관심사를 살펴보았다. 연구의 결과 감염 및 전염병, 병리학적 증상, 소화기 질환을 주제로 하는 연구가 많이 수행되었고, 연구자의 소속은 세브란스연합의학전문학교가 가장 많았으며 주로 내과와 외과 교실에 속해있었다. 논문의 제목과 본문은 국한문혼용으로 표기된 것이 가장 많았고, 131편의 논문 중 40편만 초록이 있었으며, 이 중 영문 초록이 22편으로 가장 많았다. 연구자들이 인용한 1,103개의 참고문헌을 분석한 결과 주로 일본, 독일, 미국에서 발행된 최신 학술지를 인용하였음을 확인하였다. 좌담회의 주요 논제는 결핵, 신경쇠약, 임질 순이었다. 이 연구를 통하여 우리말로 된 의학학술지 간행의 역사를 고찰하였으며, 1930년대 조선인 의학자들이 「조선의보」에 연구 성과를 축적하고, 의학 학술 커뮤니티를 통하여 의학 수준을 높이는데 기여하였음을 확인하였다.

Abstract

The Korean Medical Journal (1930-1937) is the first Korean medical journal published by The Korean Medical Association, which Korean doctors established to resist Japanese medical organizations during the Japanese colonial period. Using the bibliometric research method for The Korean Medical Journal, this study aimed to analyze the journal as follows. First, the study analyzed the subject trends of medical research by extracting the MeSH terms from the title of the articles. Next, the study identified characteristics of authors, type of language used in the papers, publication year and countries of references included in the papers. Also, this study identified the researchers’ interests by analyzing the frequency of keywords appearing in the roundtable titles. As a result of the research, infections, pathological symptoms and diseases of the digestive system were studied most often. Most authors belonged to Severance Union Medical College, and internal medicine and general surgery departments had the most authors. Most of the titles and texts of the papers were written in Korean and Chinese characters in combination. Of the 131 papers, only 40 contained abstracts, 22 of which were English abstracts, the most number. The study analyzed 1,103 references in the papers and found that the authors mainly cited the latest journals published in Japan, Germany, and the United States. The topics discussed the most in the roundtable talks were tuberculosis, neurasthenia, and gonorrhea in order. This research examined the history of the publication of The Korean medical journal. Also, it showed that Korean doctors accumulated their academic medical research results and contributed to improving medical conditions.

정보관리학회지