Skip to content

Pusnow/Sortable-Hangul

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Sortable-Hangul

정렬 가능한 한글(옛한글) 인코딩/인코더

기존 한글 인코딩의 문제점

정렬의 어려움

정렬 구현의 부재

해결 방안

새로운 인코딩

Unicode PUA 사용

PUA 할당

  • Supplemental Private Use Area-A 를 사용
  • 16비트
  • 상위 1비트에 따라 두 블록로 나눠 사용
  • KS X 1026-1An Order Table for Johab Hangul Consonant/Vowel Letters Table 을 사용하여 미리 정렬된 코드 포인트를 사용

초성-중성 코드

191817161514131211109876543210
11110 (Block)초성 정렬 코드 (8bits)중성 정렬 코드 (7bits)

종성-타입 코드

191817161514131211109876543210
11111 (Block)종성 정렬 코드 (8bits)00방점 (2bits)타입 정보 (3bits)

타입 정보

  • 000 : 일반 한글 코드
  • 001 : 반각 코드
  • 010 : 한글 호환 자모
  • 011 : 괄호 기호
  • 100 : 원 기호
  • 101 ~ 111 : 미할당

방점

  • 00 : 평성 (방점 없음)
  • 01 : 거성 (방점 하나)
  • 10 : 상성 (방점 둘)
  • 11 : 미할당

한국어 유니코드

유니코드에는 한국어 단어로 되어 있는 몇 기호가 있다. ex) (오전) 321D

Korean 과 Hangul의 차이로 Korean 코드는 지원하지 않는다.

About

정렬 가능한 한글 인코딩/인코더

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages