차이
문서의 선택한 두 판 사이의 차이를 보여줍니다.
양쪽 이전 판이전 판다음 판 | 이전 판 | ||
tech:unicode [2016/10/02 14:39] – ↷ 링크가 옮기기 작업으로 인해 적응했습니다 V_L | tech:unicode [2021/07/23 11:06] (현재) – [big-endian VS little-endian] V_L | ||
---|---|---|---|
줄 1: | 줄 1: | ||
- | {{tag> | + | {{tag> |
======유니코드 (Unicode)====== | ======유니코드 (Unicode)====== | ||
- | 우분투와 같은 리눅스에서는 파일이름에도 UTF-8을 사용할 수 있는데 윈도우는 UTF-8파일 이름을 지원하지 않는다. [[macos]]에서는 문서내용에는 일반적인 유니코드를 쓰지만, 파일시스템에는 [[unicode_nfd_dokuwiki|Unicode NFD]]를 쓴다. | + | 우분투와 같은 리눅스에서는 파일이름에도 |
* Win-Rar은 3.80부터 유니코드 이름을 갖는 파일을 지원한다. | * Win-Rar은 3.80부터 유니코드 이름을 갖는 파일을 지원한다. | ||
줄 35: | 줄 35: | ||
|UTF-16(big-endian)|FE FF| | |UTF-16(big-endian)|FE FF| | ||
- | UTF-8 코드는 원래 그 자체로 구별이 가능하기 때문에 괜히 BOM이 필요없다고 함. UTF-8에는 BOM이 **없는 것이 보통**인데, | + | UTF-8 코드는 원래 그 자체로 구별이 가능하기 때문에 괜히 BOM이 필요없다. |
- | 윈도우의 메모장에서 UTF-8 로 저장을 하면 항상 BOM을 붙이다. 그런데 인터넷에 올려서 리눅스 서버에서 사용될 HTML/ | + | 윈도우의 메모장에서 UTF-8 로 저장을 하면 항상 BOM을 붙인다. 그런데 인터넷에 올려서 리눅스 서버에서 사용될 HTML/ |
* 울트라에디트의 헥사 모드(Ctrl+H)로 UTF-8 파일을 보면, 16비트 유니코드처럼 보이고 BOM이 있든 없든 항상 FF FE 라는 엉뚱한 BOM이 나타난다. 이것은 울트라에디터가 유니코드를 편집할 때, 내부적으로 ' | * 울트라에디트의 헥사 모드(Ctrl+H)로 UTF-8 파일을 보면, 16비트 유니코드처럼 보이고 BOM이 있든 없든 항상 FF FE 라는 엉뚱한 BOM이 나타난다. 이것은 울트라에디터가 유니코드를 편집할 때, 내부적으로 ' | ||
줄 44: | 줄 44: | ||
=====big-endian VS little-endian===== | =====big-endian VS little-endian===== | ||
- | MS윈도에서 내부적으로 사용되는 유니코드(UTF-16LE)는 16비트 즉 2바이트로 하나의 글자를 표현합니다. 바이트가 2개니까 이 바이트에 순서가 정해져 있어야 | + | MS윈도에서 내부적으로 사용되는 유니코드(UTF-16LE)는 16비트 즉 2바이트로 하나의 글자를 표현함. 바이트가 2개니까 이 바이트에 순서가 정해져 있어야 |
- | MS윈도의 유니코드는 리틀 엔디안 little-endian이 기본값입니다. 빅 엔디안 유니코드는, | + | MS윈도의 유니코드는 리틀 엔디안 little-endian이 기본값임. 빅 엔디안 유니코드는, |
=====같이 보기===== | =====같이 보기===== |