유니코드가 사용되기 전 사용되어지던 인코딩, ANSI 1
ASCII에 들어 있는 문자(알파벳, 숫자, 특수문자, 제어문자)를 제외한 문자들을 각국 마다 만들어 사용했다. 그리고, 그것은 ANSI에 의해서 각 국의 문자셋에 코드페이지가 주어지게(?) 된다 2
그것은 아래와 같은 결과를 내게 된다.
각국은 각국의 문자셋만 지원한다(보는 인코딩을 바꿀 수 없다)는 전제하에
우리 나라에서
왜 사냐건 웃지요
라는 글을 보내면
각 국에서는 이렇게 보일 것이다.
단, 일본어의 경우 뒤의 두 글자 정도는 출력이 되지 않고 빈 공간 처럼 나거나 ASCII의 해당 문자코드에 해당하는 문자가 나올 것으로 생각됨(여기 화면에 보이는 문자는 일본문자에 없는 문자이죠)
코드페이지 936 (중국어 간체)로 설정했을 때
코드페이지 950 (중국어 번체)로 설정했을 때
코드페이지 932 (일본어)로 설정했을 때
한국어 '왜' 라는 문자에 할당한 문자코드와 중국, 일본에서 자국어 문자에 할당한 문자 코드가 위 갈무리 샷에서 보이는 첫 문자와 같다는 것이죠.
그냥 재미삼아 한글로 입력한 다음, 뷰어에서 인코딩 문자셋을 동양 삼국이라는 중국, 일본으로 바꾸어서 보았습니다.
혹시 텍스트 파일 문자가 깨져 보인다면
1. 인코딩 : 인코딩 선택의 실수
2. 파일 : 실제로 깨어진 파일 또는 텍스트 파일이 아니다
3. 글꼴 1 : 해당 인코딩 문자셋을 지원하는 글꼴이 없거나 손상되었다
4. 글꼴 2 : 글꼴 캐시가 손상되었다
덤 : 한글 텍스트 깨어져 보일 때
한글 텍스트인데 제대로 보이지 않는다 (깨어진 파일이 아니라는 가정하에)면 인코딩 선택을 해당 텍스트의 원래 인코딩 문자셋에 맞추면 된다.
국내에서는 대부분 51949, 949, UTF-8 정도가 쓰인다. 3
해당 프로그램에서 문자셋(또는 인코딩) 선택을 EUC-KR, KSC5601, 또는 UTF-8 정도로 바꾸어 보면 한글이 제대로 표시되는 것이 있을 것이다.
앞 번 글 옛한글을 사용하려다가 를 쓰고, 문자 인코딩에 대해(조합형, 완성형, 유니코드 / 된다면 글꼴도) 쓰려다가 그만 두었다. 워낙 아는 게 부족해서 그리고, 그냥 이렇게 유니코드가 나오기 전의 상황을 잠시 보여주는 글을 쓰는 것으로 방향을 전환했고 쓰다 보니 스마트폰 텍스트 문서를 보면서 문자가 깨진다는 이들이 생각나서 또 좀 덧 붙여보았다.
ES 파일 탐색기에 있는 텍스트 편집기에 대한 생각
1. 유니코드를 지원하지 않는다.
2. 인코딩 선택 옵션이 없다.
그러하므로 자국어의 ANSI 코드로 보여준다. (추측, CP936 <중국어 간체>)
이런 이유로 한국어 텍스트가 보여지지 않는 것임.
내가 KH5200 폰을 사용하던 초창기에 메모하던 앱의 텍스트 저장이 유니코드로 되었다. 당연히 파일 탐색기의 편집기에서는 글자가 깨져 보였다. (ES 최신 버전에서는 바뀌었나? 해서 실행해보았지만 여전하군요)
참고로 이 블로그에서 쓰이는 인코딩은 UTF-8 이므로, 이 곳의 글이 깨어져 보인다면 인코딩을 UTF-8로 선택하시면 됨.
'생활/문화 > 한글, 한국어' 카테고리의 다른 글
소리를 그리다 - 훈민정음, 한글 (0) | 2011.06.26 |
---|---|
옛한글을 사용 (4) | 2011.05.31 |
한글 조합형, 그리고 음성합성 (0) | 2009.09.25 |