본문 바로가기
서 예 방/서예 5체 학습자료 등

모든 한자는 이곳에서 찾으세요 - 유니코드 한자 검색 시스템

by 연송 김환수 2012. 3. 25.

유니코드한자검색시스템

GRID코드표, 고한자, 신출부호, 뿌리코드 한자 검색서비스 제공.

 

유니코드한자검색시스템

http://www.koreanhistory.or.kr/newchar/

초등학교 교육> 교수, 학습자료> 한문

 

옛날에 사용되었던 한자지만 현재는 사용하지 않아 검색이 어렵거나 찾아 볼 수 없는 어려운 한자를 이곳에서 부수 검색으로 찾을 수 있고 아니면 총획수 검색으로 쉽게 찾을수 있는 한자검색 시스템 입니다.

 

(* 음가검색, 사각호마검색, 파자검색, 코드검색, 문자검색, GRID코드표, 고한자/신출부호, 뿌리코드를 이용하여 찾기 가능)

 

 

-----------------------------------------------------------------------------

유니코드 (unicode)

 

한글을 비롯해 전 세계의 문자를 소프트웨어적으로 거의 완벽하게 처리할 수 있는 국제표준 통일문자코드

 

세계의 많은 언어들이 통일된 언어코드가 없어 많은 불편이 따르자 전 세계적으로 통일된 언어코드를 만들자는 움직임이 일어났고 그 결과 만들어지게 된 것이다. 국제표준화기구(ISO)에서 추진하고 있는 유니버설코드 체계 진행상황에 불만을 느낀 IBMㆍ마이크로소프트 등에 의해 만들어진 것으로, 2바이트(16비트) 체계에 전 세계 모든 문자를 나타내는 것을 목표로 하는 통일된 코드 체계다. 세계 각국의 다양한 현대 언어로 작성된 텍스트에 대해 상호교환, 처리 및 표현을 용이하게 하기 위한 시스템이다.

 

컴퓨터에서 세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된

국제적인 문자 코드 규약.

 

국제표준으로 제정된 2바이트계의 만국 공통의 국제 문자부호 체계(UCS: Universal Code System)를 말한다. 애플컴퓨터·IBM·마이크로소프트 등이 컨소시엄으로 설립한 유니코드(Unicode)가 1990년에 첫 버전을 발표하였고, ISO/IEC JTC1에서 1995년 9월 국제표준으로 제정하였다. 공식 명칭은ISO/IEC 10646-1(Universal Multiple-Octet Coded Character Set)이다.

 

데이터의 교환을 원활하게 하기 위하여 문자 1개에 부여되는 값을 16비트로 통일하였다. 코드의 1문자당 영어는 7비트, 비영어는 8비트, 한글이나 일본어는 16비트의 값을 지니는데, 이를 모두 16비트로 통일한 것이다. ISO/IEC 10646-1의 문자판에는 전세계에서 사용하고 있는 26개 언어의 문자와 특수기호에 대해 일일이 코드값을 부여하고 있다. 최대로 수용할 수 있는 문자수는 6만 5,536자이다. 이 가운데 3만 8,885자는 주요 국가의 언어를 구현하는 용도로 이미 할당되어 있고 6400자는 사용자 정의 영역으로, 나머지는 2만여 자는 새로 추가될 언어 영역으로 각각 비워두고 있다. 코드 할당비율을 보면 한자가 39.89%로 가장 많고, 한글 17.04%, 아스키 및 기호문자 10.39% 등의 순이다.

 

여기에 포함된 한글 코드 체계는 옛 한글의 자모를 포함한 한글자모 240자(HANGUL JAMO, 11열)와 한국표준인 KSC 5601의 조합형 한글자모 94자(HANGUL COMPATIBILITY, 31열), 한글에서 구현할 수 있는 최대 글자수 1만 1,172자를 가나다순으로 배열해 놓은 완성형(HANGUL, AC열∼D7열) 등 3종으로 되어 있다. 또한 각국의 문자를 2바이트로 수용하기 위해 우리나라와 중국·일본·타이완의 한자를 통합하였다. 한자의 비중이 높은만큼 동양권에서는 서체의 통합과 입출력 방식에 대해 계속 논의를 해오고 있다.

 

=============================================================================

아래는 유니코드한자검색시스템 사용에 대한 설명서 입니다. 

------------------------------------------------------------------------------------

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         |  코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과

개요

유니코드 한자 검색 시스템은 정보통신부에서 지난 2000년부터 추진해 온 지식정보자원관리사업을

통해 출현한 신출한자 및 기타 신출문자들을 통합 관리하고, 이들 문자에 대한 다양한 정보를 일반인이

웹 상에서 쉽게 열람 검색할 수 있도록 개발되었다. 신출한자 혹은 신출문자라 함은 지식정보자원관리

사업에서 문자표준으로 채택한 국제표준문자체계 3.0 버전(이하 ‘유니코드 3.0’이라 부름)에 등록되지

않은 문자를 말한다. 역사분야 DB 구축 자료가 한자나 옛한글로 기록된 고전적 자료라는 특성 때문에

정보처리시스템에서 원활하게 처리할 수 없는 다량의 문자가 출현하였다. 역사분야 각 전문정보센터

에서는 이들 문자를 처리하기 위하여 신출문자에 대한 인코딩 스킴을 개발하는 등의 노력을 기울였으며,

2004년도에 이어 2005, 2006년도에도 이들 신출문자에 대해 전문기관의 검정을 거쳐 통합목록으로

정리한 자료를 제공하게 되었다.

자료구성
구분 영역 이름 코드 범위 문자 수 비 고
표준 BMP
영역
한중일 통합한자
(CJK Unified Ideographs)
0x4E00 ~ 0x9FA5 20,902자 UNICODE 2.0
한중일 통합한자 확장 A
(CJK Unified Ideographs Extension A)
0x3400~0x4DB5 6,582자 UNICODE 3.0
Extension B
영역
한중일 통합한자 확장 B
(CJK Unified Ideographs Extension B)
0x20000 ~ 0x2A6D6 42,711자 UNICODE 3.1
비표준 신출한자(新出漢字) KC00001 ~ KC04787 4,787자

2004년

통합정리

KC04788 ~ KC05980 1,193자

2005년

통합정리

KC05981 ~ KC06968 988자

2006년

통합정리

KC06969 ~ KC07191 223자

2007년

통합정리

KC07192 ~ KC07355 164자

2008년

통합정리

신출부호(新出符號) KS00001 ~ KS00097 97자

2004년

통합정리

KS00099 ~ KS00256 159자

2005년

통합정리

KS00257 ~ KS00297 41자

2006년 통합

정리

KS00258 ~ KS00299 2자

2007년 통합

정리

KS00300 1자

2008년 통합

정리

고한자(古漢字) OH00001 ~ OH00114 114자

2005년 통합

정리

OH00115 ~ OH00159 45자

2006년 통합

정리

OH00160 ~ OH00166 7자

2007년 통합

정리

===================================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         |  코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과

초기화면

 

유니코드한자 검색시스템 메인 화면을 영역별로 구분하면 다음과 같다.

글로벌 메뉴
- 오른쪽 상단에 상시 메뉴로 설정하여 언제라도 이동 가능
- 홈, 도움말, 한국역사정보통합시스템으로 이동
- GRID 코드표, 고한자/신출부호, 뿌리코드로 이동

검자 메뉴
- 부수/획수, 음가, 사각호마, 파자 정보를 이용하여 다양하게 한자를 검색

검색 메뉴
- 주요 정보를 제시하는 상단에 코드검색과 문자검색을 상시 메뉴로 설정

- 코드검색은 유니코드와 신출한자 통합코드를 검색
- 문자검색은 한자를 직접 입력하거나 복사 후 붙여넣기를 이용하여 검색
정보영역
- 검색결과 및 문자정보를 제공하는 영역

검색 결과는 기본적으로 전체 카테고리가 선택되어 있지만, Unicode BMP, Extension B, 신출한자의

카테고리를 선택하여 검색결과를 표시할 수 있다.


=====================================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과
부수/획수 검색
한자를 부수 혹은 총획수로 검색할 수 있다.
부수 검색

 

찾고자 하는 한자의 부수를 아래의 부수 목록(그림 ④)에서 선택하여 부수 입력란(그림 ①)에

      입력한다. (삭제 버튼을 클릭하면 해당 부수가 삭제)

획수 입력란(그림 ②)에 찾고자 하는 한자에서 부수를 뺀 나머지 획수를 입력한다.
(범위 버튼을 클릭하면 나머지 획수의 범위를 지정할 수 있다.)

 



부수와 획수가 입력된 상태에서 검색을 클릭하면 검색 결과가 정보 영역에 출력된다.

검색 결과는 기본적으로 전체 카테고리가 선택되어 있지만, Unicode BMP, Extension B, 신출한자의
카테고리를 선택하여 검색결과를 표시할 수 있다.

 

===========================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과

총획수 검색

 

 

총획수 입력란(그림 ①)에 찾고자 하는 한자의 총획수를 입력한다.
(범위 버튼을 클릭하면 총획수의 범위를 지정할 수 있다.

 

 
총획수가 입력된 상태에서 검색을 클릭하면 검색 결과가 정보 영역에 출력된다.

검색 결과는 기본적으로 전체 카테고리가 선택되어 있지만, Unicode BMP, Extension B, 신출한자의
카테고리를 선택하여 검색결과를 표시할 수 있다.

 

=======================================================



개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과
음가 검색
음가 검색은 한글음가, 한글 로마자, 한어병음, 일본어 훈독, 일본어 음독 검색을 지원한다.

 

찾고자 하는 한자의 음가종류를 ①의 콤보박스에서 선택한다.
(선택할 수 있는 음가는 한글음가, 한글 로마자, 한어병음, 일본어 훈독, 일본어 음독 총 5가지이다.)

찾고자 하는 한자의 음가를 아래 음가 목록(그림 ④)에서 선택하거나 직접 검색어 입력란 ②에

       입력한다.

 


검색어가 입력된 상태에서 검색을 클릭하면 검색 결과가 정보 영역에 출력된다.

=====================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과

사각호마 검색

 

 

찾고자 하는 한자의 사각호마를 검색어 입력란(그림 ①)에 직접 입력한다. 혹은 아래의 사각호마

선택 목록에서 숫자를 선택할 수도 있다. (상단의 아이콘은 앞의 두 자리이며, 선택하였을 시 하단에

나머지 자리수가 출력된다.)

 


사각호마가 입력된 상태에서 검색을 클릭하면 검색 결과가 정보 영역에 출력된다.


==========================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과

파자 검색

 

 

찾고자 하는 한자의 파자를 하단의 파자 목록(그림②)에서 선택하여 파자 입력란(그림 ①)에 입력

       한다.
파자목록의 숫자 아이콘은 파자목록을 임의로 분류한 번호이며 해당 아이콘을 클릭하면 하단에 파자

목록이 출력된다.

* 참고 : 파자원칙
심볼 관계 보기 비고
+ 좌우 氵+飛 생략 가능
- 삭제 石+(毁-殳)
/ 상하 髟/目
* 결합 (臼*米)/皿 의 이체자
() 우선 穴/(爿+未) 의 이체자

 


파자가 입력된 상태에서 검색을 클릭하면 검색 결과가 정보 영역에 출력된다.


===========================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과
코드 검색

 

 

찾고자 하는 한자의 코드값을 입력란(그림 ①)에 입력한다.
*참고 : 영역별 입력값
문자 영역 입력값 표시 비고
Unicode BMP 영역 4E00
Unicode Extension B 영역 24000
신출한자 KC00001 KC 다음은 숫자 5자리

 


코드값이 입력된 상태에서 검색을 클릭하면 해당 검색값이 정보 영역에 출력된다.
(Unicode BMP 영역, Unicode Extension B 영역, 신출한자 영역 전부를 검색할 수 있다)


================================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과

문자 검색

 

 

 

찾고자 하는 한자를 입력란(그림 ①)에 직접 입력하거나 본 검색시스템, 상용 편집기, 기타 웹

화면에서 복사해서 붙여넣기 한다.

 

 


입력된 상태에서 검색을 클릭하면 검색 결과가 정보 영역에 출력된다.


==============================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과
GRID코드표

한자와 신출한자에 대해 코드 영역 단위로 열람할 수 있는 Grid Map이다.

 

 

상단의 “GRID 코드표” 를 클릭하면 Unicode BMP, Unicode Extension B, 신출한자의 코드표가

나타난다. 이 중 원하는 글자 영역의 코드 범위(그림 ①)를 클릭하여 열람한다.

 



 


선택된 코드 범위의 한자 목록 화면(그림 ①)이 나타난다. Unicode BMP, Extension B 는 한 화면에

256자, 신출한자는 100자 단위로 목록을 제시한다.

이전을 클릭하면 이전 코드 목록, 다음을 클릭하면 다음 코드 목록, 전체를 클릭하면 초기 화면으로

이동한다. (그림 ③)

각 문자(그림 ②) 위에 마우스를 올려 놓으면 해당 한자의 요약 정보(그림 ④)가 나타난다.


==============================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과
고한자/신출부호

Grid 코드표와 같은 방법으로 고한자 및 신출부호를 열람할 수 있다.

고한자는 성균관대학교 존경각에서 구축한 경학자료집성(古尙書 등)에서 약 100여 자와 경상대학교
문천각의 남명학 관련 자료, 민족문화추진회의 한국문집총간에서 출현한 한자이다.

신출부호는 한자 이외에 고전적 자료에 출현한 다양한 신출문자들을 지칭한다. 옛한글, 구결문자,

 64괘외에 한자 구성원리를 설명하기 위해 자형의 일부를 표기한 것 등 표준문자코드로 구현할 수 없는

각종 부호들이다.

 

 

글로벌 메뉴에서 “古漢子/신출부호”를 선택하면 古漢子/신출부호 코드 단위가 나타난다. 열람을
원하는 코드 범위를 클릭하여 세부 화면으로 이동한다.

 

 


코드 영역에서 선택한 영역의 고한자를 100자씩 목록으로 제시하는 화면이다. 고한자 목록은
원본에서 추출한 낱자 이미지를 보여 준다.

낱자 이미지 위에 마우스를 올려놓으면 요약 정보가 화면 하단에 나타난다.



 

 


고한자 코드 목록에서 선택했을 때 나타나는 상세정보 화면이다. 신출한자의 상세정보와 같은

항목을 제시한다.
원전이미지파일명 항목에 있는 이미지 파일명을 클릭하면 팝업 창을 통해 이미지를 확인할 수 있다.

신출부호 열람 방법 역시 고한자 열람 방법과 동일하다.


===========================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과
뿌리코드

뿌리법을 이용하여 문자를 검색할 수 있다. 뿌리법은 한자의 모양을 270여 개로 나누고 이를 40개

자판에 배당하여, 하나의 한자를 1키에서 4키의 조합으로 입력할 수 있도록 고안된 입력법이다.

따라서 음가를 몰라도 입력이 가능하며 입력된 한자의 유니코드값을 확인할 수 있다.

 

 

화면 상단에 보이는 키보드 형태의 인터페이스(그림①)를 이용하거나 입력창(그림 ②)에
직접 뿌리키에 해당하는 문자를 입력한다.
입력할 때마다 선택된 뿌리키를 후보로 하는 문자목록(그림 ③)이 나타난다.
후보문자 목록에서 문자를 선택시 해당 한자의 상세정보(그림 ④)가 화면 하단에 출력된다.


==========================================================

 

개요 | 초기화면 | 부수 검색 | 총획수 검색 | 음가 검색 | 사각호마 검색 | 파자 검색

 

         | 코드 검색

문자 검색 GRID코드표 | 고한자/신출부호 | 뿌리코드 | 검색결과

검색결과

 

 

부수/획수, 음가, 사각호마, 파자 등으로 검색을 하였을 때 각 영역 별 검색 건수가 화면에 표시된다.

(그림 ①)

해당 한자(그림 ②)에 마우스를 올려 놓으면 요약정보(그림 ⑤)가 화면 하단에 나타난다.

요약정보는 확대한 자형, 코드값, 부수, 획수, 총획수, 음가로 구성되어 있다.

검색결과가 두 페이지 이상일 경우 페이지 번호가 디스플레이된다. (그림 ③) 원하는 페이지

번호를 클릭하면 해당 페이지로 이동한다.

좌측 하단의 박스(그림 ④)로 검색 결과에서 한 화면에 보여질 문자의 개수를 설정할 수 있다.
(기본값은 20, 50, 100)

 

 

 

상세정보에서는 자형 이미지, 코드값, 부수, 획수, 총획수, KS코드, JIS코드, GB코드, BIG5코드,

한국어 의미, 영어 의미, 한어병음, 일본어 훈, 일본어 음, 사각호마, 파자 등의 정보를 제시한다.

신출한자는 추가로 기관명, 사업차수, 관련DB명, 출전서명, 출전묶음, 출전위치, 출전파일명,

전후문맥, 원전이미지파일명, 강희자전, 인코딩스킴, 임시마크, 오필획코드, 검정내역 정보가 추가

된다.

이전 및 다음 아이콘(그림 ①)으로 목록의 이전 및 다음 한자의 상세보기 화면으로 이동할 수 있다.
목록 아이콘(그림 ②)을 클릭하면 목록화면으로 이동한다.