|
|
漢字
언어별 명칭 | |||
한자 ([한ː짜]) | |||
chữ Hán, Hán tự, Hán văn, chữ nho | |||
Sawgun | |||
Chinese characters, Han characters[4] | |||
Sinogramme | |||
Chinesische Schriftzeichen | |||
Sinograma, Caracteres chinos | |||
Китайское письмо | |||
Character Sinicus | |||
Ĉina Skribo |
중국에서 발달하여 오늘날에도 중국, 한국, 일본 등에서 쓰고 있는 문자. 표어문자. 은허에서 출토된 기원전 15세기경의 갑골 문자가 현존하는 가장 오래된 것이며, 후대로 오면서 더 많이 만들어져 현재 알려져 있는 글자 수는 약 5만에 이르는데 실제로 쓰이는 것은 최대 5,000자 정도이다. 처음에는 순수한 상형문자였으나 세월이 흐르면서 상형 이외의 원리로 만들어진 글자가 추가되었다.[5] 전자 외에도 많은 약자(略字), 속자(俗字)가 있다.
본래 세계 각국의 다른 문자를 접하지 않은 옛 중국인들은 그냥 '자(字)'라고 불렀다. 그러나 중국이 통일되고 한나라가 세워진 이후 '중국인'이라는 민족감정이 생기면서, 다른 문자에 대한 상대적 비교의 개념으로 '한나라의 문자', '한족의 문자'라는 뜻인 '한자'라는 말이 처음 생겼다.
중국 신화 전설에선 창힐이 새의 발자국을 본떠 창제하였다고 하며, 고고학적으로 따지자면 한자의 기원은 신석기시대 양사오 문화의 도기문자나 은나라시기 팔괘와 같은 기호 체계까지 거슬러 올라간다. 그리고 갑골문자에 이르러서는 현대 한자의 직계조상이라 할 정도로 성숙한 문자체계를 갖추게 된다.
중국을 비롯한 중화권, 대한민국, 일본에서 사용하며 베트남에서도 근대 이전까지 사용했다. 이 중 실제 언어생활에서는 오직 한자만 사용하는 중화권, 한자와 고유 문자를 섞어쓰는 일본, 일반적 언어생활에서는 거의 쓰지 않고 보조표기로만 사용하는 한국 등 한자를 쓰는 정도에는 지역차가 있다. 한글은 기본적으로 표음문자이기 때문에 동음이의어를 한글로 쓰면 잘 구별이 되지 않는 경우에 문맥 등에 의존해야 하지만, 한자로 쓰면 명확해지는 경우가 많다. 서양권에 라틴어 관용어가 있다면, 동양권에는 한자성어가 그 위치를 차지한다.
세계적으로 오래된 문자 가운데 하나로, 수메르 문자[6], 마야 상형 문자와 함께[7] 다른 문자의 영향을 받지 않고 독자적으로 생성된 세 종의 문자 중 하나다.
한자와 한문을 혼동하는 경우가 많은데 한자는 한글, 키릴 문자, 가나와 같은 문자이고, 한문은 그 한자를 이용해 쓴 고대 중국어 문어체다. 즉 '學' 이나 '習' 같은 것은 한자이고, '학이시습지불역열호(學而時習之不亦說乎)'[8] 같은 것은 한문이다. 또 한자어와도 혼동하기 쉬운데 한자어는 한자로 쓰인 단어라고 보면 된다. 즉 위에서 예로 든 '학이시습지불역열호'는 한문이고, '학습(學習)' 은 한자어다. 또한 사전적 정의에 따르면 한자어는 '한국어 속에 쓰이는 한자 어휘'라고 한다.
문명의 요람에도 들 정도로 역사가 오랜 문명의 문자인 만큼 그 역사도 굉장히 길고, 현대까지 꾸준히 변화해 왔다. 그러나 한자라는 문자가 구체적으로 언제 형성되기 시작했는지는 확실치 않다. 중국 신화에선 삼황오제기의 황제(중국신화) 대의 창힐(倉頡)[9]이 만들었다고 전해진다. 물론 전설상의 기록을 액면 그대로 믿기는 어렵다. 사기나 여씨춘추 같은 문헌에도 그 이름이 나오는 것을 보아 이 전설은 전국시대 말에는 널리 퍼진 듯하다.
고고학 연구에 의하면 이미 기원전 6천 년경 신석기 시대 전후로 중국 일부 지역에서 상형 기호들이 사용된 흔적이 보인다. 그 중 유명한 '한자의 기원일 지도 모르는 문자'는 허난 성 일대의 페이리강 문화 지역에서 발굴된 자후 계각 부호(贾湖契刻符号)이며, BC 6600년경에 형성된 것으로 보인다. '문자'가 아닌 '계각부호'라는 애매한 표현을 쓰는 이유가, 이 기호의 문자 체계가 제대로 글을 기록할 수 있는지조차 논란이 되기 때문이다. 쉽게 설명해서 글자가 아니라 고분 벽화같은 그림 그려놓은 것일 수도 있다는 얘기다. 덕분에 아직까지 제대로 해석되지 못하고 있지만, 후에 등장할 갑골 문자과 비슷한 자형도 존재하기 때문에 한자와 관련이 있을 가능성을 무시하지 못하고 있는 상황이다.
현대 한자의 원형이라고 확실히 말할 수 있는 최초의 문자는 그 유명한 갑골 문자다. 현재 발굴된 가장 오래 된 갑골문은 기원전 약 1200년경의 상나라의 왕 무정(武丁) 대의 기록이다. 반쯤 전설상의 국가로 여겨지던 상나라의 존재를 증명하고, 더불어 당대의 수많은 기록과 한자의 원형을 명확히 하는 등 중국 고대 역사학에 상당한 공헌을 한 기념비적인 발견이었다. 그리고 무엇보다 아직까지도 해독되지 못한 문자들이 상당수 존재하기 때문에 연구가 거듭되면 우리가 알지 못하던 사실들을 알아낼 수도 있다.
갑골문은 상나라 말기부터 주나라 대에 걸쳐서 청동기에 새겨졌다고 해서 명명된 금문(金文)로 이어졌다. 위의 갑골문과 비교적 잘 알려진 후대(진나라, 한나라 대)의 문자 사이에서 교량 역할을 하고 있고, 후대 문자에 비해 자형이 상당히 이질적인 갑골문을 해독하는 데 상당한 공헌을 하였다.
춘추전국시대에는 전서체가 등장하여, 제자백가 사상가들의 저서(그때는 종이가 없어서 죽간에 쓰여졌다.)도 전서로 쓰였다.
진시황의 시대에 이르면 필기체인 예서체가 등장하고 한나라대에 기존의 전서를 대체한다. 또 삼국시대(중국)에 이르면 우리에게 가장 친숙한 해서체가 등장하며, 본격적으로 우리가 아는 한자의 자형이 거의 완성된다. 해서체는 가장 많이 사용되고 완성도도 높기 때문에 아예 정체(正體)라고도 불린다. 하지만 남북조 시대 전까진 해서체가 그다지 널리 쓰이지 않았으며, 본격적으로 완성되고 널리 쓰이기 시작한 시기는 당나라 대이다.
이 무렵 당시 독자적인 문자가 없었던 한국, 베트남, 일본 지역에 한자가 전파되면서 한자문화권을 형성하게 된다. 한국의 경우는 대략 BC 2세기경에 받아들여졌다고 추정되며, 베트남은 약 BC 3세기에서 AD 1세기경, 일본은 약 5세기경에 받아들이게 된다.[10] 물론 한자만 받아들였지 각 국가별로 독자적인 언어를 사용하고 있었기 때문에, 한자의 음을 빌려서 자국말을 표현하는 등 한자를 이용해 자국의 언어를 표기하는 방식이 발달하게 된다. 대표적인 예로는 신라의 향찰, 고대 일본의 만요가나, 베트남의 쯔놈[11] 등이 있다.
그 외에도 한자를 사용하는 주변 국가들에서 자기네들 사정에 맞게 새로운 글자를 만들고 일부 한자를 개량하는 등 현지화를 거치거나, 서하 문자나 거란 문자처럼 한자를 모방해 새로운 문자를 만들어 내거나, 아니면 아예 히라가나나 가타가나처럼 한자 그 자체를 간소화시켜서 문자를 만드는 등 한자는 동아시아 문화에 엄청난 영향을 끼치게 된다.
후에 중국에선 청 말기, 20세기 초중반에 걸쳐 루쉰 등의 지식인들이 한자 폐기를 주장하기도 했으며, 후에 중국 공산당이 정권을 잡은 후 대대적인 문자 개혁을 벌일 뻔한 적도 있는 등 오히려 한자의 종주국인 중국에서 한자가 사라질 뻔한 적도 있었으나, 다행히도 중국 공산당 치하에서 기존 한자들을 좀 더 사용하기 쉽게 간체자로 간소화하는 선에서 그쳤다.[12]
현대에 들어서는 한국에선 한글을 이용한 표기가 완전히 정착했고, 베트남에서도 프랑스의 식민지배를 거치면서 쯔꾸옥응으 표기법이 정착하는 등 예전만큼 동아시아권에서 한자의 위상이 절대적이지는 않다. 하지만 아직까지도 중국, 일본, 대만, 싱가포르 및 해외 화교권 지역 등에서는 널리 쓰이고 있으며, 한국에서도 주류가 아닐 뿐이지 여전히 보조 문자로서 일상생활에서 사용되고 있다. 무엇보다도 중국 하나만으로도 사용자 수가 10억명을 넘고, 비단 인구수를 따지지 않더라도 1인당 GDP 자체가 낮은 북한과 인구수가 적은 몽골을 제외한 나머지 동북아시아 지역의 경제력이 크기때문에 세계적으로도 영향력 있는 문자 체계로 인정받고 있다.
한자 자원 연구
한자에 대한 체계적인 지식이 갖춰진 계기는 경학 연구로, 분서갱유로 인해 웬만한 경전이 통째로 사라진 뒤 다시 한대가 된 후 한동안 중국 학문계가 상당히 붕괴하고 혼란스러웠을 때 절반 정도는 학자가 몰래 숨겨왔던 경전이나 공자 집에 들어차 있던 경전에 적혀있던 고문을 해석하던 고문파, 하나는 끝까지 찾지 못해 입으로 전승돼오던 사실을 기록해 예서로 남겨놓은 금문파로 연구자가 나뉘었다. 이들은 연구방법이 달랐으므로 학풍 역시 달랐는데 고문파는 글자 해석부터 어려웠으므로 고답적으로 정론을 파고들었고, 금문파는 따로 해석할 거리는 없었고 내용의 이해에 어려움이 없어 현실적인 방향으로 발전했으나, 참위설이나 음양오행설을 가지고 억지 해설을 늘어놓는 등 영 안 좋은 방향으로 발전했다. 이를 고문파의 일원이었던 후한의 허신(許愼)이 문자의 구조를 분석하는 기법을 최초로 들고온 <설문해자(說文解字)>를 통해 소전체를 파고들어 의미를 분석하는 기법을 보여주며 논란이 종결되었으며, 이때 나온 기법의 하나가 바로 육서와 부수.
한자는 일정한 원리와 체계를 따라 만들어지거나 사용된다. 초창기에는 사물이나 기호를 본떠서 만든 단순한 글자들이 대부분이었으나, 시간이 지날수록 두 글자 이상의 글자들을 합쳐서 새로운 글자를 만드는 경우가 많아졌다. 운용적인 측면에서 볼 때, 동일한 뜻을 가진 한자가 여러 개 생기기도 하는 한편, 하나의 글자가 다양한 뜻을 새로 가지게 되기도 했다. 또 어떨 때는 글자를 새로 만드는 대신 기존의 한자에서 음만 따오는 방법도 사용되었다. 이런 일련의 체계를 중국에서는 전통적으로 여섯 가지로 분류하는데, 이를 육서(六書)라고 한다. 이 중에서 네 가지는 글자를 만드는 데 쓰이는 원리이고, 두 가지는 글자를 사용하는 데 쓰이는 원리다.
상형(象形) : 사물의 형태를 본따서 글자를 만드는 방법. 예 : 日(날 일), 月(달 월), 山(뫼 산), 木(나무 목)
지사(指事) : 추상적인 기호를 이용해서 글자를 만든 방법. 예 : 上(위 상), 下(아래 하), 一(한 일), 本(근본 본)
회의(會意) : 두 글자 이상의 글자를 합쳐서, 조합된 글자가 가지는 뜻들과 연관된 새로운 뜻의 글자를 만드는 방법. 예 : 男(사내 남), 見(볼 견), 好(좋을 호), 林(수풀 림)
형성(形聲) : 뜻과 관련된 글자와 소리를 나타내는 글자를 합쳐서 글자를 만드는 방법. 예 : 紅(붉을 홍), 海(바다 해), 歌(노래 가), 問(물을 문)
전주(轉注) : 하나로 딱 잘라 말하기 어려울 정도로 설이 다양하다.
가차(假借) : 어떤 뜻을 나타내는 한자가 없을 때 음이 같은 글자를 빌려 쓰는 방법. 음이 같은 글자를 빌려 쓰는 것 뿐만 아니라 그냥 발음만 나타낸 글자에 뜻을 붙이기도 한다.예 : 自(스스로 자), 亦(또 역), 無(없을 무), 來(올 래)
한자의 가장 큰 특징의 하나. 흔히 한자를 '뜻을 나타내는 글자'라고 하여 표의 문자라고 부르며, 표의 문자 중에서는 현재까지 사용되는 유일한 문자 체계인 것으로 알려져 있다. 사실 여기에는 어폐가 있다. 한자는 뜻만 아니라 발음도 가지기 때문이다. 그래서 문자학계에서는 한자를 표어문자라고 분류하기도 한다. 하지만 제7차 교육과정까지만 해도 교과서에서 한자는 표의 문자라고 가르쳤었기 때문에, 2010년 기준 20대까지 한자를 표의 문자라고 알고 있는 경우가 많으며, 일상생활에서는 그 정도로만 알고 있어도 무방하다.
어쨌든 한자의 표의성 때문에, 한자는 글자와 대응되는 소리 간의 긴밀성이 상대적으로 약하다. 이로 인해 한자의 본래 음과는 상관없이 자기 지역에서 그 글자와 뜻이 통하는 고유음으로 읽는 현상이 나타난다. 가령 國이라는 글자가 있으면 이 글자의 본래 음가는 '국'인데, 이걸 '나라'라고 읽는 것이다. 이것이 이른바 훈독이다. 흔히 일본에서 한자를 뜻으로 읽는 방식이라고 알려졌지만, 사실 이런 방식의 한자 읽기는 한자문화권을 통틀어 두루 볼 수 있다. 우리나라에서도 고대에는 향찰과 이두에서 흔하게 볼 수 있는 현상이었으며, 놀랍게도 아주 드물게 현재 한국 한자에도 훈독이 남아 있는데, 바로 '串'(곶)(꽂다). 이 한자의 원래 음은 '관' 혹은 '촨(→찬)'이다. 그 밖에도 훈주음종(訓主音從)의 원리로 만들어진 乭(돌), 㐘(쌀), 㐎(글), 㐢(뜰)이라는 훈독 한자가 있다. 자세한 내용은 훈독 문서 참조.
또한 한자라는 문자 체계를 공유하는 나라들끼리는 글로 쓰여 있는 문장을 보았을 때에 대충 의미를 파악할 수 있다. 예를 들어 간판에 '출입구'나 'でいりぐち'라고 쓰여있으면 각각 한국인, 일본인만 무슨 뜻인지 알겠지만 '出入口'라고 쓰여있으면 한중일 모두 무슨 뜻인지는 이해할 수 있는 식이다. '1, 2, 3'같은 숫자가 거의 전세계적으로 통하는 것과 마찬가지인 셈. 이런 이유로 옛날에 동남아시아(베트남, 싱가포르 및 화교) 및 동북아시아 국가에서 필담이 성행했으며, 현재도 어느 정도 통용이 된다.
한자는 뜻글자가 기원이므로, 하나의 단어나 형태소 당 하나의 글자가 배당된다. 따라서 기존에 없던 새로운 개념이 생겨나면 그에 맞게 새로운 글자가 추가될 수가 있었다. 게다가 한자에는 일정한 조자 원리가 있다 보니, 마음만 먹으면 누구나 새로운 한자를 쉽고 간편하게 만들 수 있다. 실제로 중국의 유일한 여황제 측천무후는 자신의 치세를 과시하기 위해 측천문자라는 고유의 한자를 만들었다. 측천문자는 측천의 치세가 끝난 후 대부분 사용 빈도가 줄어들었지만, 일부 글자는 기존의 한자 체계로 편입되었다. 이런 식으로 소규모 집단이나 정말 짧은 기간에만 사용된 문자, 심지어는 두 사람끼리 왕래한 편지에서만 사용된 그들만이 자체적으로 만들어 사용했던 글자가 있으므로 문헌 연구를 하다가 이런 글자가 튀어나오게 되면 전공자들이 두통을 일으키는 것이다.
물론 이런 식으로 글자 수가 무지막지하게 늘어나는 건 고대의 일이다. 개념이 생길 때마다 새 글자를 계속 만들어내면 글자를 배우는 데 지장이 가니, 시간이 흐를수록 자연히 글자수 증가에 강한 압력을 받을 수밖에 없었다. 대신 두 개 이상의 한자를 조합해서 개념을 확장시키는 방식, 즉 한자어가 발전하게 되었다. 게다가 근대 이후에는 공공 기관이 주도하여 상용한자의 범위나 한자의 표준자형을 정하므로, 누군가가 사적으로 만든 한자가 기존의 한자 체계로 공식으로 편입되기란 불가능에 가깝다. 근대에 새로 추가된 한자라고 하면, 주기율표 상의 원소나 중국의 여러 방언을 표현하기 위해 만들어진 글자 정도다. 또한 현대에 와서는 디지털 부호 처리의 표준화 및 폰트 제작 등의 문제점[13] 때문에, 공공 기관에서도 새로 글자를 만드는 일은 극히 제한하고 있다.
한자의 수는 여러 한자 사전에 따르면 다음과 같다. 참고로 5만 자가 넘어가는 자료가 있다면, 그 중 절반 이상은 이체자(異體字)라고 여겨도 좋다.
한자의 총 개수 갱신 일람 | |||
년도 | 나라 | 문헌 | 글자수 |
BC 1500년 | - | 갑골 문자 | 약 4000자 |
100년 | 후한 | 설문해자(説文解字) | 9,353자 |
3세기 | 위(삼국시대) | 성류(聲類) | 11,520자 |
4세기 | 진 | 자림(字林) | 12,824자 |
543년 | 양(남조) | 옥편(玉篇) | 16,917자 |
1069년 | 송 | 유편(類編) | 31,319자 |
1615년 | 명 | 자휘(字彙) | 33,179자 |
1716년 | 청 | 강희자전(康熙字典) | 47,035자 |
1915년 | 중화민국 (대륙) | 중화대자전(中華大字典) | 48,200자 |
1960년 | 일본 | 대한화사전(大漢和辭典) | 48,902자 |
1962년 | 중화민국 (대만으로 후퇴 후) | 중문대사전(中文大辭典) | 49,880자 |
1964년 | 한국 | 대한한사전(大韓漢辭典) | 41,386자 |
1984년 | 한국 | 명문한한대자전(明文漢韓大字典) | 51,853자 |
1986년 | 중화인민공화국 | 한어대자전(漢語大字典) | 54,678자 |
1994년 | 중화인민공화국 | 중화자해(中華字海) | 85,568자 |
2004년 | 중화민국 | 이체자자전(異體字字典) | 106,230자 |
2006년 | 일본 | 금석문자경(今昔文字鏡) | 150,366자 |
2008년 | 한국 | 한한대사전(漢韓大辭典) | 53,667자 |
2017년 | - | 유니코드 10.0 CJK(한중일) 통합 한자[14] | 87,882자 |
- | 중화인민공화국 | 베이징(北京) 궈안(国安)자문설비공사의 한자뱅크 | 91,251자 |
이 중에서 일반 중국·일본인이 읽고 사용할 줄 아는 글자는 약 2,000~3,000자 정도이며, 한자를 사용하는 국가들은 이 정도 숫자의 한자를 지정 한자로 정해서 사용하고 있다. 총 개수가 몇만 자라고는 하지만, 그 가운데 2,000자의 사용률이 거의 90%를 넘고, 5,000자 정도 알면 대단한 것이다. 그 나머지는 옥편이나 대한한사전 같은 두툼한 자전에 똬리를 틀고 있는 갖가지 괴악한 벽자들로 일반인들은 평생 쓸 일이 없다.
다음은 나라별로 따로 지정해 놓은 상용한자의 글자 수이다.
한자는 원칙적으로 1자·1음·1의의 구조를 가지고 있으며, 형태소 하나를 글자 하나로 표현한다. 이로 인해 한자어는 대부분 2음절~3음절로 이루어져 있어 압축성이 매우 크다.
예를 들어 '교대(법원·검찰청)역'을 풀어써서 여러 언어로 번역해보자.
국립서울교육대학교(법원·검찰청)역 | 한글 | 15 | |
國立서울敎育大學校(法院·檢察廳)驛 | 한자 | 15 | |
國立首爾教育大學校(法院·檢察廳)站 | 한자(정) | 15 | |
国立首尔教育大学校(法院·检察厅)站 | 한자(간) | 15 | |
国立ソウル教育大学校(法院・検察庁)駅 | 한자+가나 | 16 | |
Ga場大學敎育國家Seoul(座案·院檢察) | 한자+로마자 | 19 | |
こくりつソウルきょういくだいがっこう(ほういん・けんさつちょう)えき | 가나 | 31 | |
Ga Trường đại học giáo dục quốc gia Seoul(tòa án ・ viện kiểm sát) | 로마자 | 49 | |
Gungnip Seoul gyoyuk daehakgyo(beobwon·gyeongchalcheong)yeok | 로마자 | 54 | |
Stasiun Universitas Nasional Pendidikan Seoul(Pengadilan dan Kejaksaan) | 로마자 | 63 | |
สถานีรถไฟมหาวิทยาลัยแห่งชาติกรุงโซลของการศึกษา(ศาลและกรมอัยการ) | 태국 문자 | 63 | |
Σταθμός Εθνική πανεπιστημιακή εκπαίδευση της Σεούλ (Δικαστήριο και Εισαγγελία) | 그리스 문자 | 70 | |
Seoul National University of Education(Court and Public Prosecutors Office) Station | 로마자 | 72 | |
Bahnhof Staatliche Pädagogische Universität Seoul(Gericht und Staatsanwaltschaft) | 로마자 | 73 | |
Seul Devlet Eğitim Üniversitesi (Mahkeme ve Cumhuriyet Savcılar Dairesi) İstasyonu | 로마자 | 73 | |
Station Université Nationale de Pédagogie de Séoul(Bureaux de la Cour et du procureur public) | 로마자 | 78 | |
Estación Universidad Nacional de Educación de Seul (Palacio de Justicia y la Oficina de Fiscal) | 로마자 | 81 | |
Stazione Università Nazionale dell'Educazione di Seul(Uffici della Corte e il pubblico ministero) | 로마자 | 84 |
한자어로 표기했을 때가 다른 언어로 비해서 4배 이상 짧으며, 같은 한자어 표기도 한자나 한글[16]로 표현했을 때 가장 짧다. 그리고 위 예시에서 한글도 글자수는 똑같지만, 이건 한자의 음을 그대로 옮긴것이므로 뜻을 풀어서 쓴다면 상당히 길어진다. 예를 들어 '교육->가르치고 기르는' 이런 식으로 풀어쓰자면, 일단 순우리말로 대체 가능한 단어가 적어 힘들지만 어쨌든 다른 언어하고 비슷하게 늘어나는 걸 볼 수 있다.
따라서, 통제실 상황판 모니터나 컨닝페이퍼 같이 물리적인 공간의 제약이 있는 곳에 가능한 많은 정보를 넣어야 하는 경우, 다른 문자 체계와 비교하면 압도적으로 강력하다. 낮음, 높음, 큼, 작음, 많음, 적음, 빠름, 보통, 느림, 없음 같은 상황을 많이 표시해야 하는 곳에 低저, 高고, 大대, 小소, 多다, 少소, 速속, 普보, 緩,완 無무 같이 색과 한자를 겸비해서 적어놓으면 매우 많은 양의 정보를 압축하면서 직관적으로 표시할 수 있다. 한자를 €나 £ 같은 뜻이 명확한 기호처럼 사용하는 것이다. 여기에 역시나 압축성이 좋고 의미가 명확한 수학기호를 추가하면 더욱 강력하다. 이런 이유 때문에 트위터가 글자 수의 한도를 140자에서 280자로 늘렸음에도 한국어, 중국어, 일본어는 글자 수 한도가 140자 그대로이다.
같은 원리로 국명 역시 한자로 쓸 수 있으면 단 한 글자만으로 특정할 수 있다. 언론에서 많이 쓰이는 것을 한자음 가나다 순서대로 나열해보면 加가, 尼니, 臺대, 獨독, 蘭란, 聯련, 露로, 蒙몽, 美미, 佛불, 比비, 西서, 埃애, 英영, 墺오, 越월, 伊이, 印인, 日일, 中중, 泰태, 葡포, 韓한, 濠호, 希희 등이 있다.
한자 초기의 흔적은 양사오 문화의 도기 기호에서도 찾아볼 수 있으나, 현재까지 밝혀진 중국의 '성숙한'(즉 '한자'의 형태를 가지고 있는) 문자체계 중에서 가장 오래된 것은 은나라대의 갑골문자다. 갑골문자에서 현재의 해서체 한자에 이르기까지, 한자의 자형은 크게 갑골문→금문→전서→예서→해서의 총 다섯 단계를 거쳐 변화했는데, 이렇게 한자가 현재 우리에게 익숙한 자형을 갖추기까지는 자그마치 1500년이라는 시간이 걸렸다. 관습적으로 한자의 자체는 크게 둘로 구분할 수 있다. 갑골문·금문·전서 및 과두문·조충문 같이 그 사이에 있던 자잘한 글자체들은 비교적 고대의 자체에 해당하므로 '고문자(古文字)'라고 부르고, 예서·해서·행서·초서 등의 문자는 '금문자(今文字)'라고 부른다.
서체 | 말 마 | 수레 차 | 물고기 어 | 티끌 진 | 볼 견 |
한자는 처음에서 상형 문자인 갑골문으로부터 비롯되었다. 한자 자체의 조상 격이라고 할 수 있는 갑골문(甲骨文)은 중국 은나라 때 거북이 등딱지나 동물의 뼈에 새겨진 문자로, 주로 점을 칠 때 사용되었다. 갑골문을 살펴보면, 나타내고자 하는 대상의 굴곡을 따라 형태가 비교적 명확하게 그려져 있다. 위 표를 예로 들자면, 馬·車·魚·塵·見의 갑골문은 각각 말, 수레, 물고기, 흙+사슴[17], 사람+눈 모양을 그린 글자라는 것을 한 눈에 알 수 있다. 한편 갑골 문자는 기본적으로 등딱지나 뼈다귀에 새긴 거라, 필획이 상당히 가늘고 거치며, 나무판에 글씨를 새기면 삑사리가 나기 쉽듯 글자가 기본적으로 매우 삐뚤빼뚤하다. 또한 글자의 크기나 자형, 구조도 일정하지 않다. 예를 들어 여기서 马를 검색해 보면 식별 가능한 다른 형태의 말이 10개가 넘고, 塵자의 갑골문은 위 표에 있는 것 말고도 흙 없이 사슴 두 마리가 뛰어다니는 형태도 있다. 심지어는 같은 글자의 좌우를 뒤집어 쓰거나, 부속 성분의 위치를 바꿔버리는 일도 허다했다. 게다가 글자를 쓸 때 간격이나 쓰는 방향도 들쑥날쑥인 것들이 많았다. 그래서 갑골문은 한마디로 말하자면 초딩 낙서 같다. 오죽하면 학자들에게 발견되기 전만 해도 사람들이 갑골문을 뼈다귀에 있는 문양이나 흠집 같은 것으로 인식했으랴.
금문(金文)은 상나라, 주나라 때 주로 청동기에 주조의 방식으로 새긴 문자이다. 종정문(鐘鼎文), 명문(銘文)이라고도 하며, 주로 제사, 왕의 책명·훈계·하사, 전쟁, 계약과 같은 내용이 기록되었다. 금문은 청동기에 새겨진 일종의 '장식적인' 기능도 가지고 있었고, 가공을 거쳐 정교하게 새겨진 문자이기 때문에, 갑골문에 비해 글자가 둥글둥글하며, 굵기도 굵으면서도 균일하다. 글자의 구조도 비교적 안정되어서 갑골문처럼 글자의 상하좌우가 뒤죽박죽인 사례가 많이 줄어들었다. 그러나 표를 보면 알 수 있듯이 이때까지만 해도 글씨체의 급격한 변화는 거의 없었으며, 대상의 형태도 비교적 알아볼 수 있게 보존되어 왔다.
이후 춘추전국시대라는 격변의 시대를 거치면서 문자도 급격하게 분화가 일어나기 시작했다. 문자에 대한 표준이 없다 보니, 나라·지방마다 글자가 달라지는 문제가 생긴 것이다. 그리고 당시에는 양쯔강이나 민남, 광둥 일대를 비롯한 중국 남부지방에서 쓰이던 언어는 중원지방의 언어와 말 자체가 안 통하는 수준을 넘어 어족자체가 다르고 문화 같은 것도 달랐으니, 아무리 중원의 문화를 받아들였다고 해도 문자가 달라지는 것은 필연이었을 것이다. 이러다 진시황이 다른 나라를 다 때려잡은 후 여러 기준을 통일할 때 '우리가 제일 힘이 강하니까 다들 우리의 기준을 따라 쓰시오.' 하면서 진나라에서 쓰던 공식 서체로 서체를 통일해 버렸는데, 이것이 전서의 일종인 소전(小篆)이다. 이때부터는 자형이 매우 안정화되었으며, 글자의 너비·높이가 일정해지고 기본 틀이 사각형으로 고정되어 훗날 방괴형(方塊型)이라고 하는 한자의 형태의 원형이 된다. 그리고 글자의 추상화가 이때부터 본격적으로 진행되기 시작하여, 자연 상태의 굴곡을 그대로 따른 선이 점·직선·곡선과 같은 기하학적인 도형으로 변형되었다. 갑골문·금문에서 볼 수 있었던 고대 문자의 상형성이 대폭 약화된 대신 문자로서의 특징을 완벽하게 갖추게 된 것이다. 이 시기부터 지역에 따라 조금씩 모양만 달랐던 글자들이 아예 다른 글자로 취급되면서 글자의 수가 폭발적으로 늘어났다.
진시황 때에 정막(程邈)이라는 사람이 만든 예서(隸書)는 한나라 때부터 유행하기 시작했는데, 예서는 소전체보다도 훨씬 더 과감하게 빠른 필기를 위한 선을 도입했다. 소전체의 구불구불하면서도 부드럽게 이어진 곡선은 빳빳한 직선으로 대체되었으며, 쓸 때의 편의성을 위해서라면 글자의 생략이나 왜곡도 서슴지 않았다. 일부 부수들(水·火·心·手 등등)이 위치에 따라 형태가 달라지게 된 것도 바로 이 때다. 이와 정반대로 奉(받들 봉), 奏(아뢸 주), 春(봄 춘), 泰(클 태)와 같이 이전에는 모양이 달랐던 글자들이 통합되기도 했다. 이쯤 되면 갑골문에서 나타내고자 했던 대상의 원형은 이미 온데간데 없어진 상태다.
중국 삼국시대부터는 위나라의 관료 종요에 의해 해서(楷書)가 예서에서 분화되었고, 248년 축조된 오나라 주연의 무덤에서 가장 오래된 해서체 명각이 발견된다. 비슷한 시기에 장지(張芝)라는 사람에 의해 장초(章草)는 역시 예서에서 분화되어 이후 초서(草書)로 진화한다. 유덕승이 만들었다고 전해지는 행서(行書)는 해서와 초서의 중간격 서체에 해당하며, 이 역시 해서나 초서와 비슷한 시기에 등장했다고 여겨진다.
해서와 초서는 같은 서체에서 나왔는데도 불구하고 상당한 차이를 보인다. 해서는 예서의 기본 틀은 유지한 채 필획만 조금 다듬은 서체로, 자형은 해서가 좀 더 세로로 긴 것을 제외하고는 예서와 크게 차이나지 않으나, 전체적으로 예서보다 필획이 정갈하여 여러모로 인쇄본에서 쓰기 적절한 규격화된 글자체다. 반면에 초서는 '속기'에 초점을 맞춘 서체로, 승정원일기와 같이 필사본에서 빠르게 필기를 해야 되는 상황에서는 유용하다. 그러나 너무 지나치게 흘려쓴 나머지 글자 자체의 자형만 봐서는 알 수 없고 반드시 앞뒤의 문맥을 통해서만 그 글자의 정체가 무엇인지 알 수 있는 경우도 많다. 결국 예서 이후로는 글을 기록할 때 해서가 주도적으로 쓰였고, 현재 우리가 사용하는 대다수의 한자폰트도 해서에서 비롯된 것이 많다. 다만 초서는 히라가나와 간체자를 만들 때 어느 정도 참고되기도 하였다.
이와 같이 상형문자에서 출발한 한자는 오랜 시간을 지나는 동안 더 편리하고 깔끔하게 쓸 수 있는 방식으로 발전하였고, 그림을 추상화하는 과정에서 본래에 가지고 있던 상형성을 상실했다고 할 수 있다.
한자 중에는 모양[18]이 비슷한 글자들이 많아 글자를 잘못 읽을 가능성이 상대적으로 높다. 이러한 특성은 과거에는 조판 과정에서 오탈자를 유발하기도 했으며, 현대에는 OCR에서 서구권 글자에 비해 낮은 인식률로 드러나기도 한다.[19] 다음은 모양이 비슷하여 자칫하면 오인할 수 있는 글자들의 일부다. 한자에 익숙한 정도에 따라 비슷하다고 느끼는 정도의 차이가 극명하므로, 심심하면 이 중에 몇 글자나 구별해 낼 수 있는지 테스트해보자.
土 土 | 士 士 |
天 天 | 夭 夭 |
辛 辛 | 幸 幸 |
光 光 | 兴 兴 |
未 未 | |
日 日 | 曰 曰 |
七 七 | 亡 亡 |
水 水 | 木 木 |
金 金 | 全 全 |
書 書 | 晝 晝 |
晝 晝 | 畫 畫 |
鳥 鳥 | 烏 烏 |
戌 戌 | 戍 戍 |
汩 汩 | 汨 汨 |
春 春 | 舂 舂 |
于 于 | 干 干 |
牛 牛 | 午 午 |
拘 拘 | 狗 狗 |
夾 夾 | 㚒 㚒 |
己 己 | 已 已 |
已 已 | 巳 巳 |
袮 袮 | |
栗 栗 | 粟 粟 |
沓 沓 | 畓 畓 |
그래서 큰 대(大)와 개 견(犬)을 헷갈려 대통령을 견통령으로 잘못 내보낸 신문사가 곤욕을 치른 적도 있고, 이보희는 수상식에서 넓을 박(博) 쓰는 김재박을 전할 전(傳)으로 잘못 보고 김재전으로 읽었다가 무식 이미지를 뒤집어쓰는 등 해프닝도 많았다.<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/30fd82aba16da120cc36fcdaea38b6904d9c666923b4af395736857ef5587666796662849eff65cd44b5153fc34692be647a8f9273859f46f8151314129c5668a6e76504bcdbb30d1b67100aeca18187?e=1522400520&amp;k=ToQBSTOMqBcez1ADAolESQ' alt='파일:chineseri4.png'>
<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/fae070f28c8f96d5bbbd843fe0c20bd23a2ff0e111588980ceeffa61954ed7efd961b91276193224d4223c8e4af756f8dcc2e6118cadb81af1a39030534f164bf785d0ceb8e72671c3c28eab9c637da1?e=1526731752&amp;k=6Os31oIrHmGB0ZlSoqWLXA' alt='파일:chineseyue1.png'>
<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/be8839ff1153bfc4c4e7662148220aed24635c2eb071e6d295e189d4ff99f538f4f4dc960f86437e45b07e6bcf9d946525f2c1481e7ac8094095051d8a5410914188d2e8986ec74a9b4d90bd99fb3c00?e=1525930236&amp;k=D41mSd19evzD8Xrow9NKrQ' alt='파일:chineseji3.png'>
<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/10192af8162c580aa5a72d0e77051c05259de86bd1109262018df699629573450829363b655a81f0b6dec5ec0d3e98310fd4420aeae1bc55244097227e22f41d286252fc4daf2ae21c6f592617eea52b?e=1527460110&amp;k=7MAFcSYl95DuBlXlxjOmlw' alt='파일:chineseyi3.png'>
한자들 간에 모양이 비슷한 글자들이 대량으로 많아진 시기는 전서에서 예서로 전환될 때이다. 필기의 편의성을 위해 굴곡을 없애고 글자를 생략하거나 왜곡하다 보니 모양이 다들 비슷해진 것이다. 예를 들어 모양이 비슷한 글자들 중에 대표격이라고 할 수 있는 日과 曰은 소전체에서는 지금보다 좀 더 명확하게 구별이 가능했다. 日 자의 경우 현재와 크게 차이가 없지만, 曰 자는 가로세로의 길이가 다른 것은 물론, 口(입 구)처럼 생긴 부분 위쪽의 획이 삐져 나와 있다. 또 己 자와 已 자는 대체 이 둘이 어떻게 수렴할 수 있었는지 싶을 정도로 매우 다르다.
간혹 별개의 글자가 완전히 모양이 같아지는 경우도 있다. 亘은 '걸칠 긍', '펼 선' 두 가지 음훈이 있는데, 사실 걸칠 긍은 二+舟고 펼 선은 二+回로 일차적으로는 亙과 𠄢으로 간략해진 것이 아예 한 모양으로 수렴했다.
한자도 다른 문자와 마찬가지로 획순이 있다. 모든 한자는 저마다의 필순이 있지만, 그걸 일일이 외우다고 있다가는 머리가 터지므로, 보통 한자학습서는 많은 한자가 공통으로 따르고 있는 규칙을 실어놓는다. 이 규칙을 영자팔법(永字八法)이라고 한다.
위에서 아래로 쓴다.
왼쪽에서 오른쪽으로 쓴다.
가로획을 세로획보다 먼저 쓴다.
삐침을 파임보다 먼저 쓴다.
왼쪽과 오른쪽이 대칭일 때, 가운데부분을 먼저 쓴 다음 왼쪽과 오른쪽을 쓴다.
몸을 안보다 먼저 쓴다.
우측이 터진 경우는 위에서 아래의 순서로 안쪽을 쓰고, 왼쪽과 아래쪽의 순서로 막는다.
상하로 꿰뚫는 세로획은 가장 나중에 쓴다.
좌우로 꿰뚫는 가로획은 가장 나중에 쓴다.
오른쪽 위의 점은 맨 나중에 찍는다.
받침은 가장 나중에 쓴다. 단 받침이 독립적인 한자로 존재할 수 있을 때는 받침을 먼저 쓴다.
간단히 표현하면 대부분 ↘ 방향으로 쓰며, 세부적으로는 → ↓ 방향으로 쓴다고 외우면 되겠다.
비슷한 모양의 글자임에도 획순이 다른 경우가 있다. 이들은 소전체까지는 다른 모양이었으나 예서체로 넘어가면서부터 모양이 비슷해진 것의 잔재인 경우가 많다. 몇 가지 예를 들면 다음과 같다.
왼 좌(左)와 오른 우(右): 앞의 두 획이 서로 같지만 왼 좌는 一丿 순서로 되지만 오른 우는 그 반대(丿一)이다.
원래 형태는 왼 좌(左)의 경우 왼손(屮)으로 도구(工)를 들고 있는 모습을, 오른 우(右)의 경우 오른손으로 밥을 먹는(口) 모습을 본떠 만든 글자였다. 소전체까지는 오른 우의 손 방향이 왼 좌와 반대로 되어 있었지만 예서체에서 손 방향이 왼 좌와 같은 방향이 되었다. 오른 우의 첫 두 획이 왼 좌아 반대인 것은 아마도 이것의 잔재로 보인다. 만약 헷갈린다면, 오른 우의 획순은 또 우(又)의 획순과 같다고 외울 수 있다.
마음 심(心)과 반드시 필(必): 마음 심의 획순은 왼쪽 점-파임-가운뎃점-오른쪽 점이지만, 마음 심의 획순을 1-2-3-4로 놓고 삐침을 5라고 한다면 반드시 필의 획순은 3-5-2-1-4가 된다. 가운데에 점 찍고 그 밑에 X자를 /\ 순으로 그린 다음에 좌우로 점 하나씩 찍는 거로 생각하면 된다.
원래 마음 심(心)은 심장의 모양을 본뜬 상형문자이지만 반드시 필(必)은 여덟 팔(八) 사이에 주살 익(弋)이 있는 글자였는데 세월이 지나 모양이 변하면서 오늘날의 必 모양으로 정착되었다. 소전체까지는 저 앞에서 예로 든 己와 已처럼 대체 이 둘이 어떻게 수렴할 수 있었는지 싶을 정도로 글자 모양이 이질적이라서 확실히 구별되었으나 예서체로 넘어가면서부터 두 글자의 모양이 확 바뀌면서 서로 비슷해졌다. 모양은 분명히 心에 丿 하나 추가했을 뿐인데 획순이 心과 확연하게 다른 건 옛날에 八+弋의 조합으로 쓰던 것의 잔재로 여겨진다.
신하 신(臣)과 클 거(巨): 신하 신의 획순은 ㅡㅣㄱㅡㅣㄴ 이렇게 가지만 클 거의 획순은 ㅡㅣㄱㅡㅡ 이렇게 간다.
왼쪽의 ㄷ자 모양에 해당하는 부분을 신하 신은 ㅡㄴ 순으로 2획으로 쓰지만 클 거는 ㅡㅣㅡ 순으로 3획으로 쓴다. 본래 신하 신(臣)은 눈(目)을 세로로 회전시킨 모양에서 유래하였다. 클 거(巨)는 장인이 쓰는 커다란 자의 모양을 본떠 만든 글자였다. 금문체에서는 그리스 문자 Φ처럼 장인 공(工)의 세로획 위에 동그라미가 올려져 있고 대전체에서는 그것을 사람이 들고 있는 모양으로 되어 있었는데 소전체에 와서 그 부분이 コ 모양으로 간략화되었다. 이 コ 모양 때문에 工의 세로획이 왼쪽으로 옮겨가다 보니 예서체부터 아예 工에 해당하는 부분이 ㄷ과 비슷한 모양으로 변한 것. 신하 신은 소전체에서 ㄷ 모양에 해당하는 부분이 C자와 비슷하게 되어 있어 이 때까지도 클 거와 확실히 구별되었는데 예서체부터 ㄷ 모양으로 바뀌어 클 거와 비슷해졌다. 한자 폰트 중 일부는 이러한 점을 의식해서인지 클 거에서 工에 해당하는 부분을 미세하게 살려놓기도 한다.
한자는 다른 문자보다 획수가 많고 복잡하기 때문에, 글자를 반듯하고 예쁘게 쓰기 위해서는 획순을 지키는 것이 중요하다. 획순을 지키지 않고 내키는 대로 쓰면 서양인들처럼 글씨를 쓰는 게 아니라 그림을 그리고 있는 꼴이 될 가능성이 매우 높다. 그러나 반대로 생각하면, 글씨를 알아볼 수 있게 쓸 수만 있다면 모든 한자마다 획순을 그렇게 외우고 있을 필요는 없다. 게다가 이 필순이라는 게 생각보다 절대적이지 않아서, 같은 한자가 나라 별로 필순이 다른 경우도 있다. 예를 들어 田(밭 전) 자 가운데에 있는 十 자는 한국과 중국에서는 가로획을 먼저 긋지만, 일본에서는 세로획을 먼저 긋는다. 그리고 위에서 예로 든 必 자는 중국, 일본, 대만의 필순이 다 다르다! 참조. 때문에 처음에는 정석 필순으로 쓰다가도 시간이 흐르면 자신만의 필순대로 쓰는 경우도 많다.
한자는 글자끼리 조합해서 새로운 글자를 만드는 것이 가능하다. 예를 들어 一(한 일), 人(사람 인), 木(나무 목), 日(날 일)이라는 글자만으로 休(쉴 휴), 从[67](따를 종), 众·眾·衆(무리 중)[68], 晶(밝을 정), 杳(아득할 묘), 杲(밝을 고), 本(근본 본), 末(끝 말), 未(아닐 미), 林(수풀 림), 森(빽빽할 삼), 旦(아침 단), 但(다만 단) 등의 다양한 글자를 만들 수 있다. 전자와 같이 하나의 부속요소로만 이루어져 있어 그 자체만으로 완전한 글자를 형성하는 글자를 독체자(獨體字)라고 하고, 독체자를 조합해서 만든 글자를 합체자(合體字)라고 한다.
한자 중에서 독체자가 차지하는 부분은 극히 일부분이고, 대부분의 글자는 두 글자가 좌우로, 혹은 위아래로 붙어 있는 형태를 띠고 있다. 그러나 众, 晶, 森의 사례에서 볼 수 있듯이 같은 글자가 세 개 중첩되어 한 글자를 만드는 경우도 있고, 眾·衆(众+日), 但(人+旦)과 같이 이미 두 글자 이상이 합쳐진 글자에 또 다른 글자가 합쳐지는 경우도 있으며, 壽(목숨 수, 老+𠭵), 禽(새 금, 今+离)과 같이 구성요소들이 결합하는 과정에서 뭉개져서 어떻게 쪼개야 하는지 감이 안 잡히는 난감한 글자들도 있다. 거기에 글자를 몇 개까지를 합칠 수 있는지에 대한 제한도 딱히 없기 때문에, 비공식 글자들 중에는 뱡뱡면 뱡과 같은 걷잡을 수 없이 미친 글자들이 나오기도 한다.<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/2d577cf2c4b6a277d1541f794f4cd09febf9ed7a0ad7b5577e062d88b9a559c326f2ff02d7949c38d3059ebb45a20b461824bb587d8d34bb1b157f10485285fbd284658a3411a30f3d0241406853b1fd?e=1522683547&amp;k=7-kW1p52JcKzTWk8DSs-TQ' alt='파일:chinesestrokefreq.png'>
이러한 특성 때문에 한자는 현재 사용되는 문자체계 중에 획수가 가장 많고 복잡한 글자가 되었다. 한글을 제외한 다른 문자는 아무리 획수가 많아봤자 10획을 안 넘는데,[69] 한자는 최빈값이 11획이다.
컴퓨터와 핸드폰의 보급으로 인해 중화권이나 일본에서는 한자를 읽을 수는 있는데 손으로 쓰는 방법을 까먹는 현상을 종종 볼 수 있는데 중국에서는 이를 '제필망자(提筆忘字; 펜을 들었는데 글자가 생각나지 않는다)'라 한다.
도트와 같은 해상도가 낮은 환경에서는 글자가 제대로 보이지 않거나 모양이 비슷한 글자를 구분하기 어렵다는 문제점이 있으나, 요즘은 벡터글꼴을 사용하는 곳이 많아짐에 따라 그나마 나은 편.
한편 중국 대륙과 일본에서는 각각 간체자와 신자체라고 부르는 약자를 사용하고 있어 이런 문제들을 어느 정도 해소해 주고 있다.
구조 | 기호 | 예시 | 부수 | 명칭(韓) | 명칭(日) | 명칭(中) |
좌우형 | ⿰ | 休, 明, 林, 江, 計... | 변 | 偏(へん) | 旁(páng)[70] | |
取, 利, 頂, 助, 次... | 방 | 旁(つくり) | 边(biān) | |||
⿲ | 樹, 謝, 倒, 膨, 微[71]... | |||||
術, 街, 衛, 衡, 衍... | ||||||
상하형 | ⿱ | 苗, 步, 雲, 箕, 家... | 머리 | 冠(かんむり ) | 头(tóu)[72] | |
志, 背, 焦, 貧, 益... | 발 | 脚(あし) | 底(dǐ) | |||
⿳ | 哀, 衰, 裏, 裵, 亘... | |||||
愛, 莫, 晝... | ||||||
菩, 意, 亨... | ||||||
반만 감쌈 | ⿸ | 序, 病, 房, 厄, 尾... | 엄 | 垂(たれ) | 旁(páng) | |
⿺ | 道, 建, 起, 魅, 麵... | 받침 | 繞(にょう) | 底(dǐ) | ||
⿵ | 問, 周, 同, 鬪, 冋... | 框(kuàng) | ||||
⿶ | 凶, 函... | |||||
⿷ | 區, 匡, 匣, 匹, 匪... | |||||
⿹ | 式, 可, 句, 武, 司... | 头(tóu) | ||||
완전히 감쌈 | ⿴ | 國, 因, 囚, 困, 回... | 몸, 담 | 構(かまえ) | 框(kuàng) | |
겹쳐짐 | ⿻ | 坐, 喪, 爽, 夾... |
표의문자 특성상 압축해 여러 가지 뜻을 구사할 수 있으며, 발음과 조합하여 각종 말장난을 시전할 수 있기 때문에 한시의 전문가들(예 : 김시습 또는 김삿갓)의 작품을 보면 놀라운 것들이 많다. 그러나 이러한 점은 과거에 한자로 서술된 문헌들의 해석을 어렵게 하는 원인이 되기도 한다.
또한 여느 문자보다 시각 이미지가 강렬하다는 점도 특징이다. 쉬운 예로 무협지에서 별 의미도 없이 남발하는 龍이나 魔 자를 보자. 그 외 한자와 한자의 조합을 이용하여 스토리 텔링을 자주 하기도 한다. 외국인들에게는 엄청 크고 무서워 보인다고 한다
<img class='wiki-image' width='100%' src='//cdn.namuwikiusercontent.com/s/4f1f33684829673ce95f94bbc69030805762e81f510e7d4fbd0d7b11af83cc70b20a76d34e85a8e8a7d96c3c4a2b1cedaac4aacc0e453fb92b521d77fb567288d9fb91efe1ef66307db65fb3baf48171?e=1525996890&amp;k=BpLFh0Y2xMCphkYCLHvXUw' alt='파일:hanjabyeoncheon.jpg'>
왼쪽에서부터 한국과 대만, 홍콩, 마카오에서 사용하는 정체자, 일본 전후 시대에 발표된 신자체, 그리고 중국 공산당이 제정한 간화자이다. 한자의 사용빈도는 중화권(대만, 중국, 홍콩, 마카오, 싱가포르 등) > 일본 >넘사벽> 한국 > 베트남, 북한 순이다. 한자가 동아시아 문화권 전체에서 폭넓게 쓰이는 문자이다 보니, 예전에 국가 간을 드나들 때도 고전 중국어 문어체인 한문을 통해 필담을 할 수 있었다.
자세한 내용은 한자문화권 참조.
한국과 일본에서는 인명용 한자를 정해 쓰고 있고, 출생 신고나 개명 시에 이 인명용 한자만을 쓰도록 하고 있다.
한국의 경우 한문 교육용 기초 한자 1,800자와 추가 한자[73], 일본의 경우 상용한자 2,136자와 추가 한자 861자를 인명용 한자로 정해 두었다.
인명에 쓰이는 한자에 제한을 둔 것은 행정 전산화를 편하게 하려는 조치이다. 만약 제한 없이 아무 한자나 허용한다면 행정 처리에 상당한 불편함을 초래할 것이다.
가족관계의 등록 등에 관한 법률 제44조(출생신고의 기재사항) |
한국 인명용 한자표의 최신 버전은 여기(2015년 1월 1일자)서 볼 수 있다. 그런데 한자를 죄다 이미지(!)로 만들어 놓았기 때문에 검색이나 복사가 불가능하다. 그러나 교토 대학교의 야스오카(安岡) 교수가 한국 인명용 한자표의 글자들을 한 글자 한 글자 일일이 입력해서 텍스트 버전으로 만들었으며, 이 텍스트 버전은 한자/인명용 한자표에도 양식 수정만 약간 한 채로 그대로 실려 있다.
참고로 모든 한자를 이미지(!)로 만들어 놓은 대법원의 공식 PDF 문서와는 달리 각 한자를 직접 검색 및 복사할 수 있는 PDF 문서도 존재한다. 어떤 사람이 위의 야스오카 교수가 만든 텍스트 버전에 한자가 속하는 문자 집합/영역에 따라 색을 입혔고[74], 각 한자의 유니코드 코드 포인트까지 일일이 병기했고,[75] 유니코드에서 일반적으로 표현할 수 없는 차이까지 글꼴을 바꿔 가면서 구분해 놓았으며,[76] 유니코드에 없는 ⿰氵恩은 아예 별도의 글꼴을 사용해서(!) 적어도 제대로 보이게는 만들어 놓았다.[77] 또한 PDF는 글꼴을 아예 내장하므로, 모든 글자를 제대로 확인하기 위해 별도의 특수한 한자 글꼴을 찾을 필요도 없어서 아주 편하다. 그리고 잘 보면 한 줄에 들어가는 한자의 수도 대법원의 공식 PDF 문서와 똑같게 만들어 놓았다는 것을 알 수 있다.
게다가 이 PDF 문서의 첨부 파일을 보면 각 한자를 어떤 음으로 등록 가능한지 정리해 놓은 txt 파일(kHangul.txt)도 있다.[78] 일반적인 인명용 한자 목록이 음 → 한자, 즉 특정 음에 대해 어떤 한자를 사용할 수 있는지 보여 주는 데 반해, 이 txt 파일은 한자 → 음, 즉 특정 한자를 어떤 음으로 등록할 수 있는지 보여 준다. 예를 들어 이 txt 파일을 보면 禔(U+7994)[79] 는 '시', '제', '지' 세 가지 음 중 하나로 등록할 수 있다는 것을 알 수 있다(그리고 실제로도 음 → 한자 형태로 된 목록에서 '시'와 '제'와 '지'를 보면 세 가지 음 모두에 禔가 등장한다). 이 PDF 문서는 엄청나게 유용한 정보들이 많은, 여러모로 굉장히 유용한 문서이니 참고할 것.
다만 이 PDF 문서(안의 txt 파일 포함)는 대법원이 아니라 개인들이 만든 비공식 자료이므로, 사용 시 조금 주의해야 할 수 있다.
일본 호적법 제50조 ① 자(子)의 이름에는 상용 평이한 문자(常用平易な文字)를 사용하여야 한다. |
중국의 경우 인명에 쓰이는 한자에 제한을 두지 않았으나, 2000년대 중반쯤에 인명용 한자를 정했다. 한국, 일본과 다른 점이라면, 한국과 일본은 인명용 한자가 정해지기 전에 인명용 한자가 아닌 한자를 포함한 이름은 개명하지 않아도 되는 데 비해, 중국은 그런 한자가 있으면 개명하게 한다는 것(…). 실제로 중국에는 특이한 글자를 이름에 쓰는 사람들이 꽤 많은데, 중국 정부에서 신분증을 전산화하면서 컴퓨터로 표현할 수 없는 글자들을 이름에 쓰는 사람들에게 이름을 바꾸라고 하기도 했다[80](참고).
초기 한국어를 비교언어학적으로 연구하기 힘들게 만들었다. 특히 고대어 연구에 중요한 고유어가 많이 실종되었는데, 한글이 없을 때는 우리말도 모두 한자로만 적다 보니[81] 어원이 우리말인데도 한자어와 혼동되는 경우가 생긴다. 생각을 生覺이라고 적어 놓고 살면서 깨닫는 것이라고 그럴듯하게 풀이한다든가… 이는 한글이 만들어진 이후에도 이어져 조선시대에 펴낸 어원 연구서들은 심지어 실학자에 속하는 사람들까지도 하나같이 모든 것을 한자 뜻으로 때려 맞추려는 경향(부회)을 보여주었다. 오늘날로 말하자면 택시(taxi)를 宅侍라고 쓰고 '집으로 모셔다드리는 것', 백신(vaccine)을 白新이라고 쓰고 '몸을 깨끗하고 새롭게 해 주는 것'과 같은 식으로 풀이하는 것과 같다. 일본에서도 아테지(当て字)라 하여 이런 부회 표기가 있었는데 이쪽은 음독뿐 아니라 훈독도 같이 쓰므로 낚일 확률이 그래도 좀 덜하다. 특히 단어 중 가장 보수적이라 고유어를 가장 잘 보존하는 지명에서의 피해가 큰데, 한국의 고유어 지명을 한자로 갈아치우는 과정에서 고유어 지명이 거의 사라졌기 때문에 원어가 무엇인지 알기 힘들게 되었다. 몇몇 고유어 지명만 한밭, 미추홀, 달구벌, 온고을, 빛고을 식으로 보조적으로 쓰이고 있다. 그나마도 원래의 고유어 지명이 아니라 한자를 뜻풀이해서 급조해서 만든 고유어 지명(특히 온고을(전주, 全州)과 빛고을(광주, 光州))일 수도 있어서 옛날의 고유어 지명이 어떤 식으로 되어 있는지 알 길이 거의 없다.
게다가 한자는 소리글자가 아니라서 언어의 발음변화를 문자에 반영하지 않기 때문에 어떤 단어의 고대 발음을 정확히 알기가 매우 어려워서 비교언어학 연구에서 다루기 매우 까다롭다. 라틴어나 산스크리트어로 적힌 고대 문헌은 실제 발음과 표기상의 괴리를 고려하더라도 그 오차가 적은데 한자는 음운구조가 간단한 언어가 아니면 정확한 발음을 보증할 수 없다.
여기 참고바람. 세상에 저게 한자라고?
<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/3dd37e5117b520cebd04be53c0e96e07f80334dfc3e9802449dab94779e255034db2762efb9fc53c03da96d071843c879aee3f7ba71564d118696c748eda54fbdb1d8939e2ba9b5afe2fbb8cf38a867b?e=1524052075&amp;k=OqAfQcMtuZiYi8BXJztzhQ' alt='파일:external/upload.wikimedia.org/200px-Zh%C3%A9.svg.png'>
말 많을 절. 용 용을 4개 합친 모양이다.
현재 옥편에 등록되어 있는 한자 중 가장 획이 많은 한자는 𪚥(말 많을 절) 자로, 총 64획이다. 유니코드에는 U+2A6A5로 등록되어 있다. 자세한 것은 𪚥 문서 참고.<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/36fc77b9fca2e71306a30f76570f0983ee375bc3646ffc598d335ae1a91be367e4585e953c9170ec613b2e27d51cf97f5a046e5a54e4496eb047eaf9d31cdc1677ee587aaaf8ca2c3cb001a87cd6627a?e=1523898360&amp;k=i4RQTaaNpZonoNpylNqWvQ' alt='파일:external/upload.wikimedia.org/200px-Zh%C3%A8ng.svg.png'>
興(흥할 흥) 이 4개로 만들어진 𠔻 라는 한자도 존재하는데, 똑같이 64획이다. 이 글자는 오음편해(五音篇海)에서 음만 '정'(音政)이라고 설명된 것이 전부라서 그리 유명하지 않다.<img class='wiki-image' width='100%' src='//cdn.namuwikiusercontent.com/s/ff5c09b4f0ea92059b42d4f5f32860bbf8ac946eae90fea0834fa75dc57385bbf0bd1d7d77ae27c957e242ea0f09b777c2529d02add863417468570ab26026c484eb05fa48eac501cedf070134e5dca3?e=1526942885&amp;k=4faZ8AxQAtDPQ9YbOZ6D5Q' alt='파일:Biang.png'>
국수 이름 뱡
또한 뱡뱡면이란 국수 이름을 쓸 때 쓰이는 한자도 복잡하기로 정평이 나있다. 총획수 57획. 말 많을 절 자보다 획수가 적지만, 그 대신 용 용만 4번 쓰면 되는 말 많을 절과 달리 9종이나 되는 한자가 섞여 들어가서 구조가 더욱 난잡하다. 이 글자는 아직 유니코드에도 없다.<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/3d2b7d8da3eee74aa621b21794a2f88a3cd7012309bea29beb5e513279621a3531041721f0c3d5fa7ff3a58e11786ca3ba73f3dcf2911e4e7236513e225d9b5072b1894f5611bd07d9e9ff04a91e1227?e=1520757444&amp;k=_M_apsRKNbBpC_prmm4G3g' alt='파일:external/ko.glyphwiki.org/u4a3b.png'>
<img class='wiki-image' src='//cdn.namuwikiusercontent.com/s/6817720cf0d299c1c5812ea05fafe03bb75234a3e75979f076226bdd8d4d2a76a5c43d5b116138eadf5c119ee1f16f15c71a16d17e6a188c06e7d6f162b7a1d80ef9a2b72ab0355181c138177ad55da2?e=1527334872&amp;k=8VGaBwV3bh7eCcNi2kCZNw' alt='파일:external/www.geocities.jp/img2.gif'>
'우렛소리 병'의 현재 글자와 古字. 古字는 128획이다.
한자의 고자(古字)로 넘어가면 훨씬 더 복잡한 한자를 만날 수 있다. 일단 雷(우레 뢰)의 옛 글자는 𤴐로 田 4개에 回 2개가 모여있는 형태(32획)이다. 䨻(우렛소리 병)자는 雷가 네 개 모여서 만들어 진다. 이 글자만 해도 52획이다. 이 글자의 고자는 따라서 𤴐가 네 개 모여있는 글자가 됨을 짐작할 수 있다. 무려 128획이나 된다. 왜 바뀌었는지 쉽게 짐작할 수 있다. 이것도 아직 유니코드에 없다.
괴상한 발음의 한자들도 많은데, 이런 한자중에서는 일반적으로 쓰이는 경우도 많지만 일부는 한국 한자음의 형성과정을 무시하고 단순히 반절에서 기계적으로 음을 대입해 등재한 경우도 많다. 대표적으로 치음(치경 파열음, 치경비음)에서는 개음[u]가 탈락하는게 일반적인데 그걸 그대로 적용하거나{예: 豽 놜(→날),雫 놔(→나)} 한국한자음에서는 서로 합쳐지지 않는 글자들(䬌,𩙡. 각각 반절로는 푸,퓨지만 반절의 현실음은 부,표, 湴, 䥑등의 경우 양순음과 覃운 咸운이 만날때는 현실음이 엄으로 나는게 일반적.)등도 있으므로 자전마다 실린 음이 다를 수 있다.
눈동자꺼질 겹(䁍)
땅이름 곶(串)[83]
울릴 굉(轟)[85]
클 굉(宏)[86]
꿩 궉(鴌)[87]
먹고마실 끽(喫)[90]
누를 날(捺)[91]
찍을 날(捏)[92]
밟을 냑(蹃)
개흙 녈(涅)[94]
막을 녑(敜)
물방울 놔(雫)
어린아이 살 통통히 찔 놜(妠)
짐승 이름 놜(豽)
어릴 눈(嫩)[95]
말더듬을 눌(訥)[96]
끈 뉴(紐)[97]
그리마 뉵(䖡)
빠질 닉(溺)[99]
숨길 닉(匿)[100]
친할 닐(昵)
훔쳐갈 닙(㘝)
음역자 똥(㖯)(...)
매울 랄(辣)[101]
말머리 장식 맘(䥑)[103]
구결자 며(厼)
소매 몌(袂)[104]
빠질 몰(沒)[105]
수렁 밤(湴)[106]
담금질 쉬(焠)
남을 싱(䞉)
쌍 쌍(雙)
성낼 에(恚)[108]
우뚝할 올(兀)[109]
싹 줄(茁)[110]
빗 즐(櫛)[111]
어찌 즘(怎)[112]
모을 촬(撮)[113]
맛볼 쵀(啐)
숨을 칩(蟄)[115]
종족이름 카(佧) [116]
무게단위 톤(噸)[120]
성씨 퉁(佟)
엿볼 틈 (闖)[121]
버팀나무 팅(㯑)
괴팍할 퍅(愎)[122]
떨어뜨릴 폄(貶)[123]
땅 이름 폴(乶)
돌고래 퓨(䱐)
병림 답답할 픽(腷)
물건 부딪치는 소리 핑(乒) / 물건 부딪치는 소리 팡(乓)[124]
쉴 헐(歇)[125]
문득 훌(欻)
죽을 훙(薨)[126]
기를 휵(搐)
불쌍할 휼(恤)[127]
한숨쉴 히(㕧)[128]
꾸짖을 힐(詰)[129] 등.
참고로 화폐 단위인 円(엔/えん)은 圓(둥글 원)의 약자다.
옥 이름 타(㻔)는 네이버 한자사전에서 '카'로 나와있는데, 강희자전과 현재 중국 발음을 생각하면 '타'가 맞다. 침을 한자로 타액(唾液)이라고 부르는 점을 생각해보자. 唾는 당연히 '침 타'다.
상당히 독특하게 느껴질 수 있는 뜻을 가진 한자도 있다. 다만 한자의 훈이란 것은 자전에 따라 자세히 풀기도 하고 간략하게 풀기도 하므로 표현이 고정된 것이 아니다. 예컨대 '바퀴가 빠져나가지 않게 하려고 굴대 머리에 내리꽂는 큰 못 할(轄)'이라고 풀이하는 일부 자전이 있는데 국어사전에서 '비녀장'을 찾아보면 '바퀴가 벗어나지 않도록 굴대 머리 구멍에 끼우는 큰 못'이라고 나와 있다. 따라서 '비녀장 할'이라고 풀이하는 것이 더 적당하다.[130][131] 자주 쓰이는 글자는 굵게 표시.
해가 뜰 때 햇빛이 빛나는 모양 간(倝)[132]
오랑캐 임금 이름 극(可)[133]
물이 깊고 넓을 갈 (㵧)
길이 험하여 수레가 가기 힘들 감 (轗)
돌이 부딪히는 소리 개 (磕)
허겁지겁 달릴 격 (䞦)
눈 맞아 새끼 배는 새 견(鳽)
망령되이 말할 겹 (䛟)
발 고운 비단 계 (綮)
거리낌 없이 말할 계 (訐)[134]
무두질한 가죽 곽 (鞹)
눈동자가 없을 광 (矌)
여유가 없을 괄 (恝)
엇갈리게 친 줄 괘 (罫)[135]
입이 비뚤어질 괘 (咼/喎)[136]
산 뾰족하게 높을 교 (嶠)
달리며 돌아보는 모양 구 (䞤)
삼가고 공경하는 모양 궁 (匔)
벼가 서로 가까이 붙은 모양 권 (䅚)
손 얼어터질 균 (龜)
웃음을 그치지 않을 극 (㘌)
뼈 사이의 살 긍 (肎)
피변 꾸미개 옥 기 (璂)
취하여 춤추는 모양 기 (僛)
소나무 겨우살이 나 (蘿)
배를 매는 닷줄 납 (笝)
깨지락거리며 먹을 녁 (䭆)
머리가 기울 녈 놋 (夨)
손재주가 날렵할 녑(帇)
손으로 잡은 모양 녑 (㩶)
앞발 없는 짐승 놜 (貀)
너무 익어 무른 외 뇌 (㼏)
조나라의 서울 단 (鄲)
피부가 부어 오를 달 (㿹)
귓바퀴가 없을 담 (聃)
등이 누런 검은 말 담/점 (驔)
물고기가 성할 답 (䲜)
눈이 쌍커풀질 도 (䀞)
귀갑 지지는 불 돈 (焞)
물이 방울져 떨어질 류 (溜)[137]
무늬 없는 비단 만 (縵)
말 대가리의 장식 맘 (鋄)
눈을 가늘게 뜨고 멀리 볼 매 (䀛)
밀리메트로 모 (粍)
그릇에 가득 찬 모양 몽 (䀄)
수면 아득하게 넓을 묘 (淼)
물 소용돌이쳐 흐를 무 (盓)
분명하지 않을 무 (嘸)
착하고 아름다울 미 (媺)
물이 빨리 흐르는 모양 밀 (滵)
넘치는 물의 모양 밀 (㴵)
물이 철철 넘쳐 흐를 밀 (㵥)
살갗이 부어오를 박 (㿺)
돌 떨어지는 소리 방(磅)
옷이 치렁치렁할 배(裵)[139]
되풀어서 풀이할 번 (繙)
물이 돌아서 흐를 변 (㵷)
풀이 더부룩할 보 (葆)
바람에 흔들리는 모양 부 (䬌)[140]
옷에 그림을 그릴 분 (黺)
물결이 서로 부딪히는 소리 붕 (漰)
머리털이 흐트러질 붕 (鬅)
눈 펄펄 내릴 비 (霏)
종지뼈를 도려내는 형벌 빈 (臏)[141]
아름다운 눈 삭 (䁻)
수염이 많은 모양 새 (䰄)
눈에 백태 낄 생 (眚)
눈 아름다운 모양 선 (䁢)
대답하려다 멈출 섭 (囁)[142]
눈빛 번쩍이는 모양 섬 (䁡)
거슬러 올라갈 소 (泝)
죽음을 앞두고 두려워하는 모양 속(殐)
말의 안장을 꾸미는 물건 쇠 (䪎)
천천히 걸을 쇠 (夊)[143]
푸석푸석한 흙 쇄 (埣)
제사하고 남은 고기 수(隋)[144]
아무 생각이 없는 것 숙(㜚)
휘파람 부는 소리 술 (㖅)
소 귀가 움직이는 모양 습 (䏉)
수레 앞턱 가로 나무 식 (軾)[145]
눈이 움푹한 모양 알 (䁊)
코대답하며 말할 앙 (𠮴, 下+口)
종묘의 제사이름 약 (禴)
벼가 썩어 나지 않을 업(䅖)
우유의 찌꺼기 역 (䤙)
물을 따라 내려갈 연(沿)[146]
짐승이 코로 물건 움직일 와(齀)
하늘의 뜻을 어길 와(迗)
물 깊고 넓을 왕 (瀇)
배냇귀머거리 외 (聩)
가지런히 달리지 못할 우(𩥋, 馬를 위아래로 2번)
짐승이 놀라 달아날 월 (狘)
얼굴 비뚤어진 모양 윤 (䪳)
흙더미가 우뚝할 을 (圪)
돼지가 성나 털 일어날 의(豙)
계집 성품 너그럽고 순할 자 (嬨)
안장 얹지 않은 말 잔 (驏)
새가 떼지어 모일 잡 (雥)
눈에 예막이 생길 장 (瞕)
흉노 왕의 칭호 저(屠)[147]
물 속의 작은 언덕 전 (䧖)
재빠르게 나아갈 점 (鏩)
배로 실어나를 조 (漕)[149]
면류관 드림 옥 조 (璪)
걸음 빠른 모양 준 (䞭)
소리가 나오는 모양 즐 (㘉)
벼가 처음 익을 지 (秪)
수레 뒤턱 나무 진 (軫)[150]
놀라 흩어져 달아날 찬 (趱)
미쳐서 날뛸 창 (猖)[151] 猖고 있습니다
풀 성하게 우거진 모양 처 (萋)
킬로그램 천 (瓩)
킬로메트로 천 (粁)
산 높고 험한 모양 최 (磪)
일에 차질이 생길 층 (蹭)
산세 들쭉날쭉한 모양 치/우뚝 솟을 차(嵯)
손발에 쥐가 날 치 (痓)
무늬 있는 돌 탕 (碭)
올무를 던져 잡을 탑 (䌈)
연기나는 모양 태 (燤)
말이 문을 나오는 모양 틈 (闖)
여덟 살 된 말 팔(𩡩, 馬+八)
물건을 부딪히는 소리 팡/변 (乓)[152]
말을 교묘하게 할 편 (諞)
돌로 물을 막을 폐 (砩)
통째로 구운 고기 포 (炮)
말 여러 필이 달아날 표(驫)
샘물 흐르는 모양 필/비 (泌)[153]
물고기 많은 모양 합(哈)[154]
우연히 만날 해(邂)[155]
몸을 숨겼다가 갑자기 나와서 사람을 놀라게 하는 소리 혹/획(閄)
풍류가 조화로울 화 (龢)
눈 부릅뜨고 볼 확(矆)
작은 산이 큰 산 보다 높을 환(峘)
뼈와 살이 분리되는 소리 획(砉)
깜짝 놀라는 소리 획(嚄)
질 낮은 명주실 흘 (紇)
물 빨리 흐르는 소리 흡 (潝)
VOCALOID 오리지널 곡 중에 이러한 한자를 소재로 삼은 なんだかとっても!いいかんじ(어쩐지 정말! 좋은 한자/느낌)라는 노래가 있다.
한자의 훈 가운데 '물 이름', '땅 이름', '사람 이름'이라고 나오는 것은 고유 명사인 지명과 인명을, '풀 이름', '나무 이름', '짐승 이름', '벌레 이름', '물고기 이름' 등은 특정한 생물 종을 가리킨다. 예를 들어 인명에 자주 쓰이는 '물 이름 수(洙)'는 공자가 도를 닦던 사수(泗水)의 지류를 가리키고[156], '옥 이름 순(珣)'은 의무려산에서 나오는 순우기라는 옥을 쓸 때 쓰인다. '신선 이름 전(佺)'도 있는데 '악전'(偓佺)이라는 고대 전설 속의 신선 이름에 쓰이는 글자이다. 악전은 당요(唐堯) 때 중국 괴산(槐山)[157]에서 약을 캐먹고 살았다는 신선 이름인데, 이것을 한자 훈에서 설명할 수는 없기 때문에 '신선이름 악'과 '신선이름 전'으로 풀이할 수 밖에 없게 되는 것이다. 마찬가지로 여러 동식물명도 우리말도 대응하는 것이 없거나 상상 속의 존재이거나 문헌 상에만 나와 무엇인지 알 수 없는 경우 등에 'OO 이름'으로 훈이 달려 있다.
독특한 뜻을 넘어서 아예 뜻이 불분명한 한자도 있다(...). 이는 보통 용례를 알 수 없는 한자이거나 유령 문자인데 駲, 彁 같이 한자사전에 뜻이 아예 미상이라고 뜨는 경우도 많다. 유령 문자 문서에 소개되어 있는 대부분의 한자들은 미상이라고 뜬다.
한편, 뜻과 음을 따로 놓고 본다면 그냥 평범한데 둘이 합치면 뭔가 절묘한 의미가 되는 한자도 있다.
실수로 추가된 한자도 있다. 일본에서는 표준 한자를 정해서 전산화하는 과정에서 작업 인력들이 획을 틀리거나 실수를 하는 바람에 출처를 알 수 없는 한자들이 양산되고 말았다. 조사 끝에 이들 한자 중 아직까지도 그 출처가 밝혀지지 않은 彁를 제외하고, 대다수가 실수로 만들어졌거나 인명, 지명 등에 쓰이는 벽자라는 것이 밝혀졌다. 유령 문자 참고. 중국에서도 이런 한자가 있는데, 𡸫 문서 참고.
한자는 또한 다양한 변종이 많기로 유명. 특히 손으로 쓴 옛날 문서는 쓰는 사람 편의에 따라 획을 줄이거나 바꾸거나, 또는 베끼다가 잘못 베껴서 '새로운' 글자가 탄생하기도 한다. 그러한 한자 정자와 약간씩 다른 글자를 통틀어 이체자라고 한다. 따라서 고문서 해독에는 약자나 이체자 정리가 필수이며, 사전으로도 나와 있다.
한자로 쓰이는 단어의 어원이 반드시 중국어 어휘라고 볼 수는 없는데, 가령 불(佛)이나 승(僧), 마(魔) 같은 글자들은 인도에서 불경을 번역할 때, 산스크리트어(Sanskrit)에 있는 단어들을 개별 한자로 만든 것이다. 포도, 사자 등도 원래 서역 등 비중국 지역에서 흘러들어온 한자어들이다. 산스크리트 표기를 위해 쓰이는 한자들도 있는데, 예컨대 반야심경에 나오는 anuttara-samyak-sambodhi[160]는 아뇩다라삼먁삼보리(阿耨多羅三藐三菩堤)로 음역한다. 여기서 '뇩'이나 '먁'같은 특이한 한자를 한국어 IME로 입력하려면 각각 '누', '막'으로 입력해야 한자로 변환할 수 있다.
한자는 중국 황하 지역에서 만들어진 글자지만 한자를 문자 체계로 받아들인 한국과 일본에서도 각 지역의 고유 개념을 나타내거나 고유어를 음차하기 위해 한자의 제자 원리를 이용해 독자 한자를 만들어 쓰기도 했다. 한국과 일본에서는 이를 각각 '국자(國字)', 'こくじ(国字)'라고 한다. 이러한 한자는 당연히 한국이나 일본을 벗어나면 쓰이지 않는다.
한국에서 만들어진 한자로는 '畓(논 답)', '椧(홈통 명)', '欌(장롱 장)', '囍(쌍희 희)' 등이 있고, 고유어 이름 등을 음차하고자 만든 '乭(이름 돌)', '㐒(음역자 솔)' 같은 훈독 한자들도 있다.
일본에서 만들어진 한자로는 '峠(とうげ, 고개)', '畑(はたけ, 밭)', '辻(つじ, 사거리)' 등이 있다.
베트남에서는 이렇게 만들어진 '고유 한자'들이 매우 많다. 이들을 쯔놈이라 하여 베트남어를 표기하기 위해 쓰였는데, 지금은 쯔꾸옥응으로 대체되어 실제 생활에서 쓰이지 않는다.
중국에서도 각 지방의 방언을 방언 그대로 표기하기 위해, 즉 한문이 아닌 방언의 백화문에 쓰기 위해 만들어진 한자(방언자)들이 있다. 이런 한자들 역시 한국이나 일본은 물론 중국의 다른 지역에서도 쓰이지 않는다. 예를 들면 광동어에서 보이는 㗎, 乜, 嘢, 喺, 氹, 冇, 嘅, 哋, 嚟, 啲, 𡃁 등이나 대만어에서만 찾아볼 수 있는 埕[161], 𨑨, 迌, 𣍐 등이 있다.
만 자가 넘는 한자를 기껏해야 100자 정도의 키밖에 없는 키보드에 욱여넣는 건 불가능하기 때문에, 한자를 입력할 때는 다른 글자를 먼저 입력한 다음 조작을 가해 한자로 변환하는 간접적인 방법이 사용된다. 이때 중화권, 일본, 한국의 문자생활이 매우 다르기 때문에, 한자를 입력하는 방식에도 나라마다 현저한 차이를 보인다.
중화권 : 입력방법이 굉장히 다양하다. 한어병음이나 주음부호와 같은 표음문자를 입력한 다음 변환하는 방식이 있는가 하면, 한자의 '모양'을 보고 그 구성요소를 연속적으로 입력하여 변환하는 창힐수입법이나 오필법(五筆)도 있다. 자세한 내용은 위키백과(영문판) 및 중국어/입력기 참조.
일본 : 우선 일본 고유문자인 가나로 입력한 다음 한자로 변환하는 방법을 쓴다. 자세한 내용은 키보드 참조.
한국 : 한글로 입력한 다음 한자로 변환한다. 다만 현대 한국에서는 일상생활에서 한자를 입력할 일이 거의 없기 때문에, 한자를 필요할 때만 따로 입력할 수 있도록 입력기가 만들어져 있다. 즉, 중국·일본어는 변환 키가 없거나 사용할 필요가 없고, 단어·문장 단위로 한자 변환이 매끄럽게 이어지는 반면, 한국에서는 한자를 입력하려면 변환 키를 반드시 사용해야 하고, 그 조차도 한 번에 한 글자씩밖에 변환하지 못한다. 그리고 일본어와는 달리 고유어 뜻으로는 한자를 찾을 수 없다. 다만 macOS의 기본 한글 입력기(구 파워입력기)는 옵션 조정을 통해 단어 단위 한자 변환이 가능하며, 구름 입력기나 Windows용 새나루 입력기 등 서드파티 IME 소프트웨어의 경우 고유어 뜻을 통한 한자 입력 기능을 지원하기도 한다. 자세한 내용은 키보드 참조. 휴대폰의 경우, 스마트폰이 등장하기 이전에는 한자 변환 기능을 지원하는 폰이 없었으나, 스마트폰이 등장하고 나서는 글자 단위로 한자 변환이 가능한 한자키가 제공되기도 한다.
한자에서 영향을 받은 독자적 문자 체계가 있다.
서하 문자
서하 왕조의 초대 황제 이원호 시대에 제정한 문자. 거란 문자나 여진족 문자와는 달리 한자의 구조를 덜 차용하였다.<img class='wiki-image' width='100%' src='//cdn.namuwikiusercontent.com/s/5bb25c9f49072973931377a0dd3587a05570330f65c031b569a3a5c0be036a48ac65c413ad092cf355ed3009b6ae32c16789700ce265fc4522e01f9e5bc3879900c226cb1ad1070073abfa5f0622945a?e=1518728550&amp;k=M6UmC8AyduqBIdE5mB9oLg' alt='파일:external/upload.wikimedia.org/Tangut_script_2.png'>
왼쪽부터 '물', '흙', '진흙'을 뜻하는 글자. 물을 뜻하는 자와 흙을 뜻하는 자의 요소를 합쳐서 진흙을 뜻하는 문자를 만드는 것이다.
거란 문자 중 거란 대자
거란 문자는 거란 대자와 거란 소자로 나뉘는데 이 중 거란 소자는 표음 문자의 요소를 포함하고 있다.
여진 문자
금나라에서 썼던 문자. 1119년 금 태조 아골타의 명에 따라 완안희우가 만들었고 1145년 반포되었다. 이후 여진의 후신인 만주족은 표음 문자를 도입하였다.
한자검정시험 참고.
나무위키의 문서들 중 한자 자체가 문서명으로 되어 있는 문서의 메타문서다.
유니코드/3000~3FFF (한자 외의 문자 포함)
유니코드/F000~FFFF (한자 외의 문자 포함)
한자/목록 (가나다순)
백괴사전의 윤희코드 특수 문자 도움말에서 유니코드를 기반으로 다수의 한자를 지원하는 글꼴들이 소개되어 있으니 참조하기 바람.
특히 이 하나조노 폰트는 한자 글꼴계의 최고봉이다. 이 글꼴만 있으면 유니코드의 모든 한자를 표시할 수 있다! 하나조노 명조에 대해도 참고. 백괴사전의 한자 사전 백괴옥편에서 밀어주는(?) 글꼴이기도 하다.[162] 다만 한자 자형이 일본식이여서 한국어에서 쓰이는 한자를 쓰기에는 부적절하니 주의.
이 글꼴을 정체자(구자체) 식으로 만든 글꼴 醍醐書體A(제호서체A, DaigoMinteuA)가 존재한다. 하나조노 폰트처럼 유니코드의 모든 한자를 지원하지는 않지만 번체자 중국어를 보는 데에는 문제 없다. 글리프위키
글리프위키라는 위키 형식의 웹사이트에서 한자 글리프를 제작, 편집한다. 한자 글리프 디자인에 특화된 글리프 제작툴이 만들어져 있기 때문에, 글꼴 디자인 지식이 별로 없어도 한자 글리프를 쉽게 디자인할 수 있다. 글리프위키에 대해도 참고. 일본어 사이트이지만 한국어, 영어, 중국어(간체/번체)도 지원하고 있다.
잘 알려지지 않은 사실이지만, 한글과컴퓨터에서 제작한 함초롬폰트 또한 모든 한자를 표시할 수 있고, 더 나아가 소수 민족의 문자를 포함해서 웬만한 언어의 문자는 다 표시할 수 있다.