Big5
다른 뜻에 대해서는 빅 파이브 문서를 참고하십시오.
Big-5 또는 Big5는 타이완, 홍콩, 마카오에서 정체자에 쓰이는 중국어 문자 인코딩 방식이다.
언어 | 중국어 정체자 |
---|---|
분류 | EASCII,[a][b] 가변 너비 인코딩, DBCS, CJK 인코딩 |
상위 인코딩 | ASCII[b] |
확장 버전 | Windows-950, Big5-HKSCS 등 |
그 밖의 관련 인코딩 | CNS 11643 |
간체자를 사용하는 중국 대륙은 GB 문자 집합을 대신 사용한다.
Big5는 이를 개발한 타이완 내 5개 기업의 컨소시엄에서 나온 이름이다.[1] 2016년 2월 기준 모든 웹 페이지 중 0.1%가 Big5를 사용한다.[2][3]
구조
편집오리지널 Big5 문자 집합의 정렬 순서는 사용 주기, 획순, 그리고 강희자전 순이다.
오리지널 Big5 문자 집합은 흔히 사용되는 수많은 문자들이 빠져있었다. 이 문제를 해결하기 위해 각 벤더는 자체 확장을 개발하였다. ETen 확장은 대중화를 통해 현재의 Big5 표준의 일부로 되었다.
Big5의 구조는 ISO 2022 표준을 준수하지 않으며, Shift JIS 인코딩과 어느 정도 유사하다. 다음 구조의 더블 바이트 문자 집합(DBCS)로 되어 있다.
첫 바이트 ("리드 바이트") | 0x81 ~ 0xfe (사용자 정의에 속하지 않은 문자들의 경우 0xa1 ~ 0xf9) |
두 번째 바이트 | 0x40 ~ 0x7e, 0xa1 ~ 0xfe |
(앞의 0x는 16진수를 의미한다)
확장
편집벤더의 확장
편집- ETen(倚天)
- 코드 페이지 950
- ChinaSea(中國海字集)
- 사쿠라 폰트
- Unicode-at-on(Unicode補完計畫, 과거 이름: BIG5 확장)
- OPG
공식 확장
편집- Taiwan Ministry of Education font(臺灣教育部造字檔)
- Taiwan Council of Agriculture font(臺灣農委會常用中文外字集)
- Big5+
- Big-5E
- Big5-2003
- CDP(Chinese Data Processing font, 漢字構形資料庫)
- HKSCS(Hong Kong Supplementary Character Set)
같이 보기
편집각주
편집- ↑ “chinese mac Character Sets”. 2017년 8월 12일에 원본 문서에서 보존된 문서. 2017년 5월 25일에 확인함.
- ↑ Historical trends in the usage of character encodings, December 2016
- ↑ Frequenty Asked Questions
외부 링크
편집- Mozilla and the Big5 Family of Encodings: an overview of Big5 encodings with code charts for each extension and relevant Firefox bugs. (Traditional Chinese)
- Big5 character code table Archived 2002년 5월 4일 - 웨이백 머신