루비, 유니코드, 한글

위키피디아에 의하면 한글 글자(Hangul Syllabus)의 유니코드는 AC00에서 D7AF까지 11184글자가 배당되어 있습니다. 이를 한글로 나타내면 '가'(AC00)가 첫번째 글자이고, '힣'(D7A3)이 표현할 수 있는 마지막 글자가 되는군요.

그외 'ㄱ'(1100)부터 11FF까지 256개의 한글 자모(Hangul Jamo)외 3130부터 318F까지의 호환용 한글 자모가 있네요. OSX의 한글 입력기 바람을 사용하는 경우 'ㄱ'이 3131을 사용합니다.

(0xAC00..0xD7A3).to_a.pack('U*') # 한글글자 모두 포함한 문자열
('가'..'힣').to_a.join.unpack('U*') # 한글 글자를 다시 unicode(숫자)로

댓글

이 블로그의 인기 게시물

터미널에서 스칼라 파일 직접 컴파일, 실행

로잉 머신 운동 2달째

curses 라이브러리 간단한 정리