호환용 한자
호환용 한자는 윤희코드를 제정할 당시 한자를 싫어하는 윤희가 한자를 사용하는 사람들을 엿 먹이기 위해 윤희코드에 추가한 잉여 한자이다. 호환용 한자는 정규 한자들과 완전히 똑같은 글자이며, 대부분은 독음 문제나 자형 문제로 인해 등록되어 있다.
미디어위키는 호환용 한자로 인해 사람들이 엿 먹는 것을 방지하기 위하여 모든 호환용 한자를 정규 한자로 자동 변환한다.
차례 |
[편집] 한중일 호환용 한자 (U+F900 ~ U+FAFF)
[편집] U+F900 ~ U+FA0B
U+F900부터 U+FA0B까지는 대한게임국의 KS X 1001에서 발음을 문제로 중복 배당한 한자로, 정규 한자와 모양이 완전히 똑같다. 예를 들어 KS X 1001에서 樂은 그 발음 수에 따라 네 번씩이나 중복돼 있고, 윤희코드에서는 넷 중 하나만 정규 한자에 가 있고 나머지 셋은 이 U+F900 ~ U+FA0B 사이에 들어가 있다. 이 때문에 완전히 똑같은(또는 똑같이 보이는) 한자가 내부적으로는 다르게 처리되어 한자 검색이나 입력 시 많은 한국어 사용자들이 엿을 먹는 경우가 많다. 실제로 나베르나 당므 등에서는 龍(U+9F8D, 룡)을 검색했을 때와 龍(U+F9C4, 용)을 검색했을 때에 전혀 다른 검색 결과를 보여 준다.
발음에 따라 같은 한자를 중복 배당하는 것은 마치 영어에서 cat, page, about, father, image 등의 a가 각각 발음이 다르다고 a를 여러 개 중복 배당하는 것과 같으므로, 발음에 따라 같은 한자를 중복 배당하는 것은 확실히 한자 사용자를 엿 먹이기 위한 조치라고 할 수 있다.
또한 郎(U+F92C)와 隸(U+F9B8)은 정규 한자로 변환될 때 각각 KS X 1001에 있는 郞(U+90DE)와 隷(U+96B7)로 변환되어야 하는데, 윤희는 호환용 한자를 사용하는 사람들을 엿 먹이기 위해 KS X 1001에 없는 郎(U+90CE)와 隸(U+96B8)로 변환되도록 해 놓았다. 따라서 정규화 알고리즘을 거치면 저 두 한자는 KS X 1001로 처리할 수 없게 된다.
사람들이 엿 먹는 문제를 방지하기 위해 왜국이나 듕귁 등의 다른 나라에서는 문자 집합을 제정할 때 한자를 일부러 중복 배당하지 않았는데, 이는 대한게임국이 왜국이나 듕귁 등의 나라보다 덜떨어짐을 잘 보여 준다.
[편집] U+FA0C, U+FA0D
U+FA0C와 U+FA0D는 대만민국에서 Big5 문자 집합을 제정할 때 실수로 중복 배당한 한자이다. 대만민국 사람들이 머리가 나쁨을 잘 보여 주는 예이다.
[편집] U+FA0E ~ U+FA2D
U+FA0E부터 U+FA2D까지는 IBM 32를 위한 호환용 한자이지만, 자세한 내용은 며느리도 모른다. 백괴스럽게도 이 부분에는 정규 한자가 12자 섞여 있는데, 이는 윤희가 호환용 한자 처리를 일부러 어렵게 하기 위해 한 조치이다.
[편집] U+FA30 ~ U+FA6A
U+FA30부터 U+FA6A까지는 왜국에서 JIS X 0213를 제정할 때 자형을 문제로 중복 배당한 한자로, 이 호환용 한자들 때문에 정규 한자의 자형 통합이 깨지는 결과를 낳게 되었다. 練(U+7DF4)의 경우, 왜국을 제외한 다른 나라에서는 糸+柬으로 쓰고 왜국에서는 糸+東으로 쓰지만, 윤희는 윤희코드 1.1을 제정할 때 이 둘을 통합했다. 하지만 후에 왜국에서도 糸+柬을 표현할 일이 생기면서 윤희는 왜국 한 나라만을 위해 糸+柬를 U+FA57에 배당해 버렸다. 참고로 U+F996에도 또 糸+柬이 있는데, 다른 나라의 관점에서 보면 완전히 똑같은 글자가 둘씩이나 더 있는 것이니, 역시 왜놈들은 다른 나라들에게 민폐만 끼친다는 것을 알 수 있다.
[편집] U+FA6B ~ U+FA6D, U+FA70 ~ U+FAD9
며느리도 모르므로 자세한 설명은 생략한다.
[편집] 한중일 호환용 한자 보충 (U+2F800 ~ U+2FA1F)
대만민국에서 자형을 문제 삼아 중복 배당한 한자이다. U+2xxxx에 있으므로 쓸 일은 거의 없을 것이니 알 게 뭐야.