바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

정보 시스템의 유니코드 기반 한자 검색 지원

Support on Ideograph Characters Search of Unicode Based Information System

정보관리학회지 / Journal of the Korean Society for Information Management, (P)1013-0799; (E)2586-2073
2007, v.24 no.4, pp.375-391
https://doi.org/10.3743/KOSIM.2007.24.4.375
윤소영 (국사편찬위원회)
  • 다운로드 수
  • 조회수

초록

현재 유니코드 CJK 한자코드는 부수 기준 배열방식을 따르고 있어 한자의 한글음가를 기준으로 하는 우리의 문자생활 방식과 차이가 있으며, 우리나라 고유한자나 동형이음어, 이두문자, 그리고 이체자 관계 등을 모두 수록하고 있지 않아 정보시스템에 그대로 적용하기에는 무리가 있다. 따라서 유니코드 기반 정보시스템의 정확한 한자표현 및 한자검색을 위해서는 한자를 포함하는 자료에 대한 정확한 이해를 바탕으로 여러 가지 지원방안을 마련해야 한다. 이러한 측면에서 역사분야 정보검색시스템에서는 한글음가 및 한국에서만 사용되는 동형이음어 처리를 위한 한자-한글음가 사전, 본래 한자의 음가와 다르게 읽히는 한자를 위한 특수용어사전, 이형자와 이체자를 위한 이체자사전, 그리고 유니코드 CJK 통합한자에 등록되어 있지 않은 한자를 위한 신출한자목록을 지원하고 있다.

keywords
유니코드, 한자검색, 문자표현, 한글음가, 이체자Unicode, ideograph character search, character presentation, hangul phonetic value, variant forms of chinese character, Unicode, ideograph character search, character presentation, hangul phonetic value, variant forms of chinese character, Unicode, ideograph character search, character presentation, hangul phonetic value, variant forms of chinese character

Abstract

Unicode Han ideograph character set differed from the our principle of the phonetic value ordering in that it followed the principle of KangXi radical-stroke ordering of the characters. Therefore, information system should support ideograph search on precise analysis of materials which consist of korean character (hangul) and ideograph character (hanja). History Information system has been maintaining Hanja(Chinese Character) to Hangul Dictionary, Terminology Dictionary for composition, borrowing, non-ideographic principles, Variant Forms Dictionary, and Recently discovered Chinese Characters List.

keywords
유니코드, 한자검색, 문자표현, 한글음가, 이체자Unicode, ideograph character search, character presentation, hangul phonetic value, variant forms of chinese character, Unicode, ideograph character search, character presentation, hangul phonetic value, variant forms of chinese character, Unicode, ideograph character search, character presentation, hangul phonetic value, variant forms of chinese character

참고문헌

1.

강대걸. (2005). 한국역사정보통합시스템 구축 및 포털시스템 업그레이드 사업 검색엔진 사전테이블 업그레이드 연구. , -.

2.

기술표준원. (2000). 국제문자부호계 KS규격의 국제규격부합화 연구. , -.

3.

류범종. (2004). 정보검색 관리시스템 KRISTAL-2002. (15), 36-40.

4.

문자코드연구센터. (2004). 신출한자의 처리와 국제 표준화. , -.

5.

박종우. (2007). 한자 국제 표준화와 인명용 한자. (19), 1-3.

6.

산업표준심의회. (2004). 정보 교환용 부호계(한글 및 한자) KS X 1001. , -.

7.

신상현. (2004). 우리나라 固有漢字 조사 보고. 1(14), 7-8.

8.

안대혁. (2007). 유니코드 환경에서의 올바른 한글 정규화를 위한 수정 방안. 34(2), 169-177.

9.

이규옥. (2005). 한적자료 DB구축사업과 이체자 정리. (15), 2-4.

10.

정우봉. (2005). 21세기 세종계획 문자코드 표준화 연구. , -.

11.

조순영. (2003). 학술 데이터베이스의 유니코드 변환 적용에 관한 연구. , -.

12.

주리정. (2001). 유니코드의 구조와 문제점. , 23-28.

13.

홍윤표. (1995). 한글코드에 관한 연구. , -.

14.

Allen J.D. (2007). The Unicode Standard 5.0. , -.

15.

Korpela, Jukka K.. (2006). Unicode Explained. , -.

16.

Patrick Faltstrom and others. (2003). Internationalizing Domain Names in Applications (IDNA) - RFC 3490. , -.

정보관리학회지