GB 18030[编辑]

GB 18030
	GB 18030 字节分配。“半码"（Half codes）指成对使用的四字节部分。
MIME / IANA	GB18030
别名	代码页 54936
语言	国际，但以中文为主
标准	GB 18030-2022, GB 18030-2005, GB 18030-2000
分类	Unicode转换格式、扩展ASCII、变长编码、CJK
拓展自	EUC-CN, GBK
变换/编码	ISO 10646（Unicode）
前用	GBK, GB2312
	查; 论; 编;

GB 18030（全称《信息技术　中文编码字符集》）是中华人民共和国国家标准简体中文字符集，由中华人民共和国信息产业部提出、信息产业部电子工业标准化研究所归口。其向后兼容并替代GB 2312-1980、GBK和CP936传统编码，并支持Unicode（GB 13000）的所有码位。GB 18030采用变长多字节编码，每个字可以由1个、2个或4个字节组成。其编码空间庞大，最多可定义161万个字元。由于GB 18030完全支持Unicode，无需动用造字区即可支持中日韩统一表意文字、中国国内的少数民族文字以及emoji等字符。GB 18030在微软Windows系统中的代码页为54936。

除编码方法外，GB 18030还包含其他文字和语言以及本标准适用对象的要求。不过，GB 18030不是一个汉字规范，不定义汉字的正式字形；字形由《通用规范汉字表》进行规范。

版本

本标准的第一版 GB 18030-2000《信息技术　信息交换用汉字编码字符集　基本集的扩充》由中华人民共和国信息产业部电子工业标准化研究所、北京大学计算机技术研究所、北大方正集团、北京方正新天地信息网络科技有限责任公司、四通集团公司、中国科学院软件研究所、长城软件公司、四通利方公司、中国软件与技术服务股份有限公司、金山软件公司和联想集团起草，由国家质量技术监督局于2000年3月17日发布和实施。此版本兼容Unicode 3.0的中日韩统一表意文字扩展区A，共收录27,533个汉字。

本标准的第二版 GB 18030-2005《信息技术　中文编码字符集》由国家质量监督检验检疫总局和中国国家标准化管理委员会于2005年11月8日发布，并于2006年5月1日实施。此版本兼容Unicode 3.1的中日韩统一表意文字扩展区B，并刊载少数民族包括朝鲜文、蒙古文（包括满文、托忒文、锡伯文、阿礼嘎礼文）、德宏傣文、藏文、维吾尔文／哈萨克文／柯尔克兹文和彝文的文字。共有70,244个汉字。此标准内的单字节编码部分、双字节编码部分，和四字节编码部分收录的少数中日韩统一表意文字扩展区A的汉字，为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品，都需要支持这个同时包含单字节、双字节和四字节编码的规格。^[1]^:4

本标准的第三版 GB 18030-2022《信息技术　中文编码字符集》由国家市场监督管理总局和中国国家标准化管理委员会于2022年7月19日发布，并于2023年8月1日实施^[2]。此版本兼容到Unicode 11为止的中日韩统一表意文字扩展区C、D、E和F，并新增康熙部首，以及滇东北苗文、傈僳文、西双版纳新傣文、西双版纳老傣文、德宏傣文等少数民族文字以及蒙古文 BIRGA 符号，共收录汉字87,887个和汉字部首228个，比上一版增加录入了1.7万余个生僻汉字。此版本在保留总体结构的基础上，从条文强制改为全文强制，但增加了“实现的级别”一章，定义了三个实现级别：

级别1：支持中日韩统一表意文字和中日韩统一表意文字扩展区A的汉字（所有具备中文信息处理和交换功能的产品均应满足此级别。与上一版的“部分强制”相比，实际要求“增加四字节编码部分的CJK统一汉字”的 66 字。）
级别2：在级别1的基础上额外支持资料性附录E中明确的《通用规范汉字表》中没有包含在级别1之内的 8105 个汉字（操作系统、数据库管理系统、中间件等系统软件和支撑软件均应满足此级别。）
级别3：支持GB 18030-2022中所规定的全部汉字以及康熙部首（GB/T 4754《国民经济行业分类》中任何用于政务服务和公共服务的信息技术产品和信息系统应均满足此级别。）

Unicode支持

不同GB 18030版本中Unicode码位的映射更动
GB 字节串	Unicode 码位
GB 字节串	GB 18030-2000	GB 18030-2005
A8 BC (ḿ)	`U+E7C7`	U+1E3F ḿ
81 35 F4 37	U+1E3F ḿ	`U+E7C7`

GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode，其变换和UTF-8相比要复杂得多。在日常实现上，常常会直接使用一个偏移量表^[3]。

GB 18030-2005与GB 18030-2000、GBK相比，去除了很多原来映射在PUA中的编码；后来剩余的24个PUA码位也在Unicode 4.1中加上。

在GB 18030-2022中，剩余的24个PUA码位已经被去除或更改对应，所有有意义字符都已经映射到正式的 Unicode 码位上。^[4]

国标码码表中私有区码位的演变
GB 字节串	Unicode 码位 ^[a]
GB 字节串	GBK 1.0^[5]	GB 18030-2005	Unicode 4.1	GB 18030-2022^[4]
A6 D9^[6]^:108		`U+E78D`	U+FE10 ︐
A6 DA		`U+E78E`	U+FE12 ︒
A6 DB		`U+E78F`	U+FE11 ︑
A6 DC		`U+E790`	U+FE13 ︓
A6 DD		`U+E791`	U+FE14 ︔
A6 DE		`U+E792`	U+FE15 ︕
A6 DF		`U+E793`	U+FE16 ︖
A6 EC		`U+E794`	U+FE17 ︗
A6 ED		`U+E795`	U+FE18 ︘
A6 F3		`U+E796`	U+FE19 ︙
A8 BC	`U+E7C7`	U+1E3F ḿ
A8 BF	`U+E7C8`	U+01F9 ǹ
A9 89	`U+E7E7`	U+303E 〾
A9 8A	`U+E7E8`	U+2FF0 ⿰
A9 8B	`U+E7E9`	U+2FF1 ⿱
A9 8C	`U+E7EA`	U+2FF2 ⿲
A9 8D	`U+E7EB`	U+2FF3 ⿳
A9 8E	`U+E7EC`	U+2FF4 ⿴
A9 8F	`U+E7ED`	U+2FF5 ⿵
A9 90	`U+E7EE`	U+2FF6 ⿶
A9 91	`U+E7EF`	U+2FF7 ⿷
A9 92	`U+E7F0`	U+2FF8 ⿸
A9 93	`U+E7F1`	U+2FF9 ⿹
A9 94^[6]^:173	`U+E7F2`	U+2FFA ⿺
A9 95	`U+E7F3`	U+2FFB ⿻
FE 50	`U+E815`	U+2E81
FE 51	`U+E816`		U+20087 𠂇 ^[b]	`U+E816`
FE 52	`U+E817`		U+20089 𠂉 ^[c]	`U+E817`
FE 53	`U+E818`		U+200CC 𠃌 ^[d]	`U+E818`
FE 54	`U+E819`	U+2E84
FE 55	`U+E81A`	U+3473 㑳
FE 56	`U+E81B`	U+3447 㑇
FE 57	`U+E81C`	U+2E88
FE 58	`U+E81D`	U+2E8B ⺋
FE 59	`U+E81E`		U+9FB4 龴
FE 5A	`U+E81F`	U+359E 㖞
FE 5B	`U+E820`	U+361A 㘚
FE 5C	`U+E821`	U+360E 㘎
FE 5D	`U+E822`	U+2E8C ⺌
FE 5E	`U+E823`	U+2E97
FE 5F	`U+E824`	U+396E 㥮
FE 60	`U+E825`	U+3918 㤘
FE 61	`U+E826`		U+9FB5 龵
FE 62	`U+E827`	U+39CF 㧏
FE 63	`U+E828`	U+39DF 㧟
FE 64	`U+E829`	U+3A73 㩳
FE 65	`U+E82A`	U+39D0 㧐
FE 66	`U+E82B`		U+9FB6 龶
FE 67	`U+E82C`		U+9FB7 龷
FE 68	`U+E82D`	U+3B4E 㭎
FE 69	`U+E82E`	U+3C6E 㱮
FE 6A	`U+E82F`	U+3CE0 㳠
FE 6B	`U+E830`	U+2EA7 <control-2EA7>
FE 6C	`U+E831`		U+215D7 𡗗 ^[e]	`U+E831`
FE 6D	`U+E832`		U+9FB8 龸
FE 6E	`U+E833`	U+2EAA ⺪
FE 6F	`U+E834`	U+4056 䁖
FE 70	`U+E835`	U+415F 䅟
FE 71	`U+E836`	U+2EAE ⺮
FE 72	`U+E837`	U+4337 䌷
FE 73	`U+E838`	U+2EB3 <control-2EB3>
FE 74	`U+E839`	U+2EB6 <control-2EB6>
FE 75	`U+E83A`	U+2EB7 <control-2EB7>
FE 76	`U+E83B`		U+2298F 𢦏 ^[f]	`U+E83B`
FE 77	`U+E83C`	U+43B1 䎱
FE 78	`U+E83D`	U+43AC 䎬
FE 79	`U+E83E`	U+2EBB ⺻
FE 7A	`U+E83F`	U+43DD 䏝
FE 7B	`U+E840`	U+44D6 䓖
FE 7C	`U+E841`	U+4661 䙡
FE 7D	`U+E842`	U+464C 䙌
FE 7E	`U+E843`		U+9FB9 龹
FE 80	`U+E844`	U+4723 䜣
FE 81	`U+E845`	U+4729 䜩
FE 82	`U+E846`	U+477C 䝼
FE 83	`U+E847`	U+478D 䞍
FE 84	`U+E848`	U+2ECA ⻊
FE 85	`U+E849`	U+4947 䥇
FE 86	`U+E84A`	U+497A 䥺
FE 87	`U+E84B`	U+497D 䥽
FE 88	`U+E84C`	U+4982 䦂
FE 89	`U+E84D`	U+4983 䦃
FE 8A	`U+E84E`	U+4985 䦅
FE 8B	`U+E84F`	U+4986 䦆
FE 8C	`U+E850`	U+499F 䦟
FE 8D	`U+E851`	U+499B 䦛
FE 8E	`U+E852`	U+49B7 䦷
FE 8F	`U+E853`	U+49B6 䦶
FE 90	`U+E854`		U+9FBA 龺
FE 91	`U+E855`		U+241FE 𤇾 ^[g]	`U+E855`
FE 92	`U+E856`	U+4CA3 䲣
FE 93	`U+E857`	U+4C9F 䲟
FE 94	`U+E858`	U+4CA0 䲠
FE 95	`U+E859`	U+4CA1 䲡
FE 96	`U+E85A`	U+4C77 䱷
FE 97	`U+E85B`	U+4CA2 䲢
FE 98	`U+E85C`	U+4D13 䴓
FE 99	`U+E85D`	U+4D14 䴔
FE 9A	`U+E85E`	U+4D15 䴕
FE 9B	`U+E85F`	U+4D16 䴖
FE 9C	`U+E860`	U+4D17 䴗
FE 9D	`U+E861`	U+4D18 䴘
FE 9E	`U+E862`	U+4D19 䴙
FE 9F	`U+E863`	U+4DAE 䶮
FE A0	`U+E864`		U+9FBB 龻
备注 a.^ 蓝色代表私用区码位 b.^ GB 18030-2022将U+20087 𠂇映射至`0x95329031` c.^ GB 18030-2022将U+20089 𠂉映射至`0x95329033` d.^ GB 18030-2022将U+200CC 𠃌映射至`0x95329730` e.^ GB 18030-2022将U+215D7 𡗗映射至`0x9536B937` f.^ GB 18030-2022将U+2298F 𢦏映射至`0x9630BA35` g.^ GB 18030-2022将U+241FE 𤇾映射至`0x9635B630`

字节结构

GB 18030包含三种长度的编码：单字节的ASCII、双字节的GBK（略带扩展）、以及用于填补所有Unicode码位的四字节UTF区段。GBK双字节部分通过查表定义，而四字节部分则根据之前两个部分没有提到的通用字符集码位顺序填补。由于和GBK兼容，GB 18030在搜索ASCII字符时也需要使用特别代码进行判断。

GB 18030编码^[7]^:3^[8]^:252^[9]
GB 18030				码位数	Unicode^[b]
字节1（最高位）	字节2	字节3	字节4	码位数	Unicode^[b]
`00` – `7F`				128	`0000` – `007F`
`80`				—	错误^[c]
`81` – `FE`	`40` – `FE` 除去 `7F`^[d]			7004239400000000000♠23940	`0080` – `FFFF` 除去 `D800` – `DFFF`^[e]
`81` – `84`	`30` – `39`	`81` – `FE`	`30` – `39`	7004394200000000000♠39420	`0080` – `FFFF` 除去 `D800` – `DFFF`^[e]
`85`				— (7004126000000000000♠12600)	（未来字符拓展）
`86` – `8F`				— (7005126000000000000♠126000)	（未来汉字拓展）
无				—	`D800` – `DFFF`^[f]
`90` – `E3`	`30` – `39`	`81` – `FE`	`30` – `39`	7006104857600000000♠1048576	`1 0000` – `10 FFFF`
`E4` – `FC`				— (7005315000000000000♠315000)	（未来标准拓展）
`FD` – `FE`				— (7004252000000000000♠25200)	（用户造字区域）
`FF`				—	错误
总计				7006111206400000000♠1112064

一、二字节区段基本就是GBK编码，另外加上了专门的欧元字符、竖排版本的标点符号，以及造字区对Unicode造字区的对应。四字节区段可以视作两段形似GBK二字节区段结构的部分，每段的第一字节可以为0x81到0xFE，第二字节为0x30到0x39。由于结构类似，能够安全于GBK的字符串搜索程序对于GB 18030来说也基本安全（正如基于字节（英语：byte-oriented）的搜索程序对于EUC、UTF-8也基本安全一般。）

四字节区段总共可以表达1,587,600（126×10×126×10）种字符，足以覆盖Unicode的1,112,064（17×65536 − 2048个代理对）个有效码位。

由于四字节区段通过填空定义，要写出处理这段转换的程序需要同时知道GBK的覆盖范围，并不简单：

U+00DE (Þ) → 81 30 89 37
U+00DF (ß) → 81 30 89 38
U+00E0 (à) → A8 A4
U+00E1 (á) → A8 A2
U+00E2 (â) → 81 30 89 39
U+00E3 (ã) → 81 30 8A 30

WHATWG和W3C的GB 18030实现通过一张“位置偏移表”记录GB 18030四字节区中连续的几块碎片，以便高效处理转换。^[11]ICU^[9]和glibc也都对大块连续的区域使用了类似的策略。

参见

注釋

^ 严格来说不是，因为ASCII字节会出现在GBK拓展二字节部分的后半字
^ 包含66个“非字符”
^ 虽然两个版本的GB 18030都认为此码位不正确（指正式发布的，GB 18030-2000的报批稿却同时有单双字节欧元^[10]），但是ICU的定义错误称其为有效码位。出于GBK兼容性考虑，WHATWG的GBK/GB 18030二合一解码器将此字节视作欧元符号。
^ 参见汉字内码扩展规范条目细分。
^ 上一行的码位使用二字节GBK编码，下一行的码位按照顺序以四字节编码补全覆盖面。此段最后一个实际用上的编码为U+FFFF的84 31 A4 39（2005版239页），不过划区时画到了84 39 FE 39。
^ 这些为代理对字符（英语：surrogate code point），在UTF-16之外没有实际意义。

参考资料

^ CESI. GB18030 符合性问与答 [GB18030 compliance FAQ]. CESI Certification Center. 2009-07-08 [2016-10-12]. （原始内容存档于2016-09-28）. Page 4 同时达到以下两个要求的产品，为符合GB 18030-2005强制部分的产品：①产品可以正确输入、输出、处理GB 18030-2005强制部分规定的全部汉字字符；②产品可以正确识别GB 18030-2005强制性部分规定的全部汉字字符对应的编码。 [A product compliant with the mandatory part of GB 18030 must be able to correctly a) input, output and process all Chinese characters defined in the mandatory set; b) recognize encodings for characters in the mandatory set.]
^ GB 18030—2022《信息技术中文编码字符集》发布并出版. 微信公众平台. 2022-08-12 [2024-01-28]. （原始内容存档于2024-01-28）（中文）.
^ Encoding Standard # gb18030-index. WHATWG. [2016-09-11]. （原始内容存档于2015-02-04）.
^ 跳转到： ^4.0 ^4.1 Lunde, Dr Ken. The GB 18030-2022 Standard. Medium. 4 August 2022 [7 August 2022]. （原始内容存档于2022-08-07）（英语）.
^ Group:GBK外字. GlyphWiki. [11 September 2016]. （原始内容存档于2019-02-16）.
^ 跳转到： ^6.0 ^6.1 Lunde, Ken. CJKV Information Processing. O'Reilly Media, Inc. December 2008 [11 September 2016]. ISBN 978-0-596-51447-1.
^ Standardization Administration of China (SAC). GB 18030-2005: Information Technology—Chinese coded character set. 2005-11-18.
^ Standardization Administration of China (SAC). GB 18030-2000: Information Technology—Chinese coded character set for information interchange — Extension for the basic set. 2000-03-17.
^ 跳转到： ^9.0 ^9.1 Authoritative mapping table between GB18030-2000 and Unicode （页面存档备份，存于互联网档案馆）. ICU – International Components for Unicode. 2001-02-21. Accessed 2016-09-04.
^ GB 18030-2000报批稿 (PDF). [2017-08-15]. （原始内容 (PDF)存档于2017-08-15）.
^ Encoding Standard # gb18030-index. WHATWG. [2016-09-24]. （原始内容存档于2015-02-04）.

外部連結

新浪网：关于GB18030汉字编码标准集（页面存档备份，存于互联网档案馆）
新浪网：电脑汉字不够用计算机也要“扫盲”（页面存档备份，存于互联网档案馆）
Update on GB 18030:2005, Ken Lunde, 2006-11-13（页面存档备份，存于互联网档案馆）
http://source.icu-project.org/repos/icu/data/trunk/charset/data/xml/gb-18030-2000.xml（页面存档备份，存于互联网档案馆）
ICU Converter Explorer: GB18030（页面存档备份，存于互联网档案馆）（英语）
微软有关GB18030编码的介绍（英语）
微软：老旧软体可能发生的兼容问題（页面存档备份，存于互联网档案馆）（英语）
微软 Win2000 GB18030 支持包（页面存档备份，存于互联网档案馆）
GB18030与Unicode对照表（页面存档备份，存于互联网档案馆）

[1] 严格来说不是，因为ASCII字节会出现在GBK拓展二字节部分的后半字

[11] 包含66个“非字符”

[icu-80-glitch-13] 虽然两个版本的GB 18030都认为此码位不正确（指正式发布的，GB 18030-2000的报批稿却同时有单双字节欧元^[10]），但是ICU的定义错误称其为有效码位。出于GBK兼容性考虑，WHATWG的GBK/GB 18030二合一解码器将此字节视作欧元符号。

[14] 参见汉字内码扩展规范条目细分。

[15] 上一行的码位使用二字节GBK编码，下一行的码位按照顺序以四字节编码补全覆盖面。此段最后一个实际用上的编码为U+FFFF的84 31 A4 39（2005版239页），不过划区时画到了84 39 FE 39。

[16] 这些为代理对字符（英语：surrogate code point），在UTF-16之外没有实际意义。

[CESI-FAQ-2] CESI. GB18030 符合性问与答 [GB18030 compliance FAQ]. CESI Certification Center. 2009-07-08 [2016-10-12]. （原始内容存档于2016-09-28）. Page 4 同时达到以下两个要求的产品，为符合GB 18030-2005强制部分的产品：①产品可以正确输入、输出、处理GB 18030-2005强制部分规定的全部汉字字符；②产品可以正确识别GB 18030-2005强制性部分规定的全部汉字字符对应的编码。 [A product compliant with the mandatory part of GB 18030 must be able to correctly a) input, output and process all Chinese characters defined in the mandatory set; b) recognize encodings for characters in the mandatory set.]

[3] GB 18030—2022《信息技术中文编码字符集》发布并出版. 微信公众平台. 2022-08-12 [2024-01-28]. （原始内容存档于2024-01-28）（中文）.

[4] Encoding Standard # gb18030-index. WHATWG. [2016-09-11]. （原始内容存档于2015-02-04）.

[gb18030-2022-kenlunde-5] 跳转到： ^4.0 ^4.1 Lunde, Dr Ken. The GB 18030-2022 Standard. Medium. 4 August 2022 [7 August 2022]. （原始内容存档于2022-08-07）（英语）.

[6] Group:GBK外字. GlyphWiki. [11 September 2016]. （原始内容存档于2019-02-16）.

[cjkv-info-proc-7] 跳转到： ^6.0 ^6.1 Lunde, Ken. CJKV Information Processing. O'Reilly Media, Inc. December 2008 [11 September 2016]. ISBN 978-0-596-51447-1.

[gb18030-2005-8] Standardization Administration of China (SAC). GB 18030-2005: Information Technology—Chinese coded character set. 2005-11-18.

[gb18030-2000-9] Standardization Administration of China (SAC). GB 18030-2000: Information Technology—Chinese coded character set for information interchange — Extension for the basic set. 2000-03-17.

[ICU-10] 跳转到： ^9.0 ^9.1 Authoritative mapping table between GB18030-2000 and Unicode （页面存档备份，存于互联网档案馆）. ICU – International Components for Unicode. 2001-02-21. Accessed 2016-09-04.

[12] GB 18030-2000报批稿 (PDF). [2017-08-15]. （原始内容 (PDF)存档于2017-08-15）.

[17] Encoding Standard # gb18030-index. WHATWG. [2016-09-24]. （原始内容存档于2015-02-04）.

[a]

[1]

[2]

[3]

[4]

[a]

[5]

[6]

[b]

[c]

[d]

[e]

[f]

[g]

[7]

[8]

[9]

[b]

[c]

[d]

[e]

[f]

[11]

[10]

查论编字符编码
早期電信	電報電碼（英语：Telegraph code）庫克與惠斯通（英语：Cooke and Wheatstone telegraph）摩斯非拉丁字母（英语：Morse code for non-Latin alphabets）日文（英语：Wabun code）中文西里爾字母（英语：Russian Morse code）韓文（英语：SKATS）博多與莫瑞 Fieldata（英语：Fieldata） ASCII ISO/IEC 646 BCDIC（英语：BCD (character encoding)）電傳文訊（英语：Teletex）與電傳視訊（英语：Videotex）／電視資訊 T.51/ISO/IEC 6937（英语：T.51/ISO/IEC 6937） ITU T.61（英语：ITU T.61） ITU T.101（英语：Videotex character set）世界系統電傳文訊（英语：World System Teletext）字元集（英语：Teletext character set）
ISO/IEC 8859	現行 -1（西歐語言） -2（中歐語言） -3（馬爾他文／世界文） -4（北歐語言） -5（西里爾字母） -6（阿拉伯文） -7（希臘文） -8（希伯來文） -9（土耳其文） -10（北日耳曼語支） -11（泰文） -13（波羅的語族） -14（凱爾特語族） -15（新西歐語言） -16（羅馬尼亞文）廢止 -12（梵文）提議 KOI-8西里爾字母（英语：ISO-IR-111）薩米文（英语：ISO-IR-197）改編威爾斯文（英语：ISO-IR-182）巴倫支西里爾字母（英语：ISO-IR-200）愛沙尼亞文（英语：Code page 922）烏克蘭西里爾字母（英语：Code page 1124）
書目	MARC-8（英语：MARC-8） ANSEL（英语：ANSEL）中文資訊交換碼 ISO 5426（英语：ISO 5426） ISO 5427（英语：ISO 5427） ISO 5428（英语：ISO 5428） ISO 6438 ISO 6862（英语：ISO 6862）
國家標準	ArmSCII BraSCII（英语：BraSCII）中文標準交換碼 DIN 66003（英语：DIN 66003） ELOT 927（英语：ELOT 927） GOST 10859（英语：GOST 10859） GB 2312 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212（英语：JIS X 0212） JIS X 0213（英语：JIS X 0213） KOI-7（英语：KOI-7） KPS 9566 KS X 1001 KS X 1002（英语：KS X 1002） LST 1564（英语：LST 1564） LST 1590-4（英语：LST 1590-4） PASCII Shift JIS SI 960（英语：SI 960） TIS-620（英语：Thai Industrial Standard 620-2533） TSCII VISCII（英语：VISCII） VSCII YUSCII（英语：YUSCII）
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367（英语：ISO/IEC 10367） EUC ISO-IR-165
macOS代码页	亞美尼亞文（英语：Mac OS Armenian）阿拉伯文巴倫支西里爾字母（英语：Mac OS Barents Cyrillic）凱爾特語族（英语：Mac OS Celtic）中歐語言克羅埃西亞文（英语：Mac OS Croatian encoding）西里爾字母（英语：Mac OS Cyrillic encoding）梵文波斯文（英语：MacFarsi encoding）字體X（英语：Macintosh Font X encoding）蓋爾文（英语：Mac OS Gaelic）喬治亞文（英语：Mac OS Georgian）希臘文（英语：MacGreek encoding）古吉拉特文（英语：Mac OS Gujarati）古木基文（英语：Mac OS Gurmukhi）希伯來文（英语：Mac OS Hebrew）冰島文（英语：Mac OS Icelandic encoding）因紐特文（英语：Mac OS Inuit）鍵盤（英语：Mac OS Keyboard encoding）拉丁文（英语：Macintosh Latin encoding）馬爾他文／世界文（英语：Mac OS Maltese/Esperanto encoding）歐甘字母（英语：Mac OS Ogham）羅曼語族羅馬尼亞文（英语：Mac OS Romanian encoding）薩米文（英语：Mac OS Sámi）土耳其文（英语：Mac OS Turkish encoding）土耳其西里爾字母（英语：Mac OS Turkic Cyrillic）烏克蘭文（英语：Mac OS Ukrainian encoding） VT100（英语：VT100 encoding）
DOS代碼頁	437 668（英语：Code page 668） 708（英语：Code page 708） 720（英语：Code page 720） 737（英语：Code page 737） 770（英语：Code page 770） 773（英语：Code page 773） 775（英语：Code page 775） 776（英语：Code page 776） 777（英语：Code page 777） 778（英语：Code page 778） 850（英语：Code page 850） 851（英语：Code page 851） 852（英语：Code page 852） 853（英语：Code page 853） 855（英语：Code page 855） 856（英语：Code page 856） 857（英语：Code page 857） 858（英语：Code page 858） 859（英语：Code page 859） 860（英语：Code page 860） 861（英语：Code page 861） 862（英语：Code page 862） 863（英语：Code page 863） 864（英语：Code page 864） 865（英语：Code page 865） 866（英语：Code page 866） 867（英语：Code page 867） 868（英语：Code page 868） 869（英语：Code page 869） 897（英语：Code page 897） 899（英语：Code page 899） 903（英语：Code page 903） 904（英语：Code page 904） 932（英语：Code page 932 (IBM)） 936（英语：Code page 936 (IBM)） 942（英语：Code page 942） 949（英语：Code page 949 (IBM)） 950 951（英语：Code page 951） 1040（英语：Code page 1040） 1042（英语：Code page 1042） 1043（英语：Code page 1043） 1046（英语：Code page 1046） 1098（英语：Code page 1098） 1115（英语：Code page 1115） 1116（英语：Code page 1116） 1117（英语：Code page 1117） 1118（英语：Code page 1118） 1127（英语：Code page 1127） 3846（英语：Code page 3846） ABICOMP（英语：ABICOMP character set） CS Indic（英语：CS Indic character set） CSX Indic（英语：CSX Indic character set） CSX+ Indic（英语：CSX+ Indic character set） CWI-2（英语：CWI-2）伊朗系統（英语：Iran System encoding）卡梅尼茨（英语：Kamenický encoding）馬索維亞（英语：Mazovia encoding） MIK（英语：MIK (character set)）
IBM AIX代碼頁	895（英语：Code page 895） 896（英语：Code page 896） 912（英语：Code page 912） 915（英语：Code page 915） 921（英语：Code page 921） 922（英语：Code page 922） 1006（英语：Code page 1006） 1008（英语：Code page 1008） 1009（英语：Code page 1009） 1010（英语：Code page 1010） 1012（英语：Code page 1012） 1013（英语：Code page 1013） 1014（英语：Code page 1014） 1015（英语：Code page 1015） 1016（英语：Code page 1016） 1017（英语：Code page 1017） 1018（英语：Code page 1018） 1019（英语：Code page 1019） 1124（英语：Code page 1124） 1133（英语：Code page 1133）
Microsoft Windows代碼頁（英语：Windows code page）	CER-GS（英语：CER-GS） 932（英语：Code page 932 (Microsoft Windows)） 936 GBK 950 1169（英语：Code page 1169） Extended Latin-8（英语：Extended Latin-8） 1250（英语：Windows-1250） 1251（英语：Windows-1251） 1252 1253（英语：Windows-1253） 1254（英语：Windows-1254） 1255（英语：Windows-1255） 1256（英语：Windows-1256） 1257（英语：Windows-1257） 1258（英语：Windows-1258） 1270（英语：Windows-1270）西里爾字母+芬蘭文（英语：Windows Cyrillic + Finnish）西里爾字母+法文（英语：Windows Cyrillic + French）西里爾字母+德文（英语：Windows Cyrillic + German）希臘語變音符號（英语：Windows Polytonic Greek）
EBCDIC代碼頁	37（英语：Code page 37） EBCDIC中的日文（英语：Japanese language in EBCDIC） DKOI（英语：DKOI）
DEC終端機（VTx（英语：VT220））	MCS（英语：Multinational Character Set） NRCS（英语：National Replacement Character Set）加拿大法文（英语：Code page 1020）瑞士文（英语：Code page 1021）西班牙文（英语：Code page 1023）英國英文（英语：Code page 1101）荷蘭文（英语：Code page 1102）芬蘭文（英语：Code page 1103）法文（英语：Code page 1104）挪威文／丹麥文（英语：Code page 1105）瑞典文（英语：Code page 1106）挪威文／丹麥文（替代）（英语：Code page 1107） 8位元希臘文（英语：Code page 1287） 8位元土耳其文（英语：Code page 1288） SI 960（英语：SI 960）希伯來文（英语：DEC Hebrew）特殊圖形（英语：DEC Special Graphics）技術（英语：DEC Technical Character Set）
特定平臺	1057（英语：Code page 1057） Acorn（英语：RISC OS character set） Adobe標準（英语：PostScript Standard Encoding） Adobe Latin 1（英语：PostScript Latin 1 Encoding） Amstrad CPC（英语：Amstrad CPC character set） Apple II（英语：Apple II character set）雅達利資訊交換標準碼（英语：ATASCII）雅達利ST（英语：Atari ST character set） BICS（英语：Bitstream International Character Set）卡西歐計算機（英语：Casio calculator character sets） CDC（英语：CDC display code） Compucolor II（英语：Compucolor II character set） CP/M+（英语：Amstrad CP/M Plus character set） DEC RADIX 50（英语：DEC RADIX 50） DEC MCS（英语：Multinational Character Set）/NRCS（英语：National Replacement Character Set） DG國際（英语：DG International） Fieldata（英语：Fieldata） GEM（英语：GEM character set） GSM 03.38（英语：GSM 03.38） HP Roman（英语：HP Roman） HP FOCAL（英语：FOCAL character set） HP RPL（英语：RPL character set） SQUOZE（英语：SQUOZE） LICS（英语：Lotus International Character Set） LMBCS（英语：Lotus Multi-Byte Character Set） MSX（英语：MSX character set） NEC APC（英语：NEC APC character set） NeXT（英语：NeXT character set） PETSCII（英语：PETSCII） SEGA SC-3000（英语：Sega SC-3000 character set）夏普計算機（英语：Sharp pocket computer character sets）夏普MZ（英语：Sharp MZ character set）辛克萊QL（英语：Sinclair QL character set）符號電傳文訊（英语：Teletext character set）德州儀器計算機（英语：TI calculator character sets） TRS-80（英语：TRS-80 character set）文圖拉國際（英语：Ventura International） WISCII（英语：Wang International Standard Code for Information Interchange） XCCS（英语：Xerox Character Code Standard） ZX80（英语：ZX80 character set） ZX81（英语：ZX81 character set） ZX Spectrum（英语：ZX Spectrum character set）
Unicode及通用字符集	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC（英语：UTF-EBCDIC） GB 18030 BOCU-1 CESU-8 SCSU TACE16（英语：Tamil All Character Encoding） Unicode編碼比較（英语：Comparison of Unicode encodings）
TeX排版系統	科克（英语：Cork encoding） LY1（英语：LY1 encoding） OML（英语：OML encoding） OMS（英语：OMS encoding） OT1（英语：OT1 encoding）
其他代碼頁	ABICOMP（英语：ABICOMP character set） ASMO 449（英语：ASMO 449）大五碼 APL符號數位編碼（英语：Digital encoding of APL symbols） ISO-IR-68（英语：ISO-IR-68） ARIB STD-B24 HZ（英语：HZ (character encoding)） IEC-P27-1（英语：IEC-P27-1） INIS 7位元（英语：INIS character set） INIS-8（英语：8位元） ISO-IR-169（英语：ISO-IR-169） ISO 2033（英语：ISO 2033） KOI -R -RU（英语：KOI8-RU） -U 今昔文字鏡 SEASCII（英语：Stanford Extended ASCII） Stanford/ITS（英语：Stanford/ITS character set） TRON（英语：TRON (encoding)）統合韓文代碼（英语：Unified Hangul Code）
控制字符	摩斯電碼專用代碼（英语：Prosigns for Morse code） C0与C1控制字符 ISO/IEC 6429 JIS X 0211（英语：JIS X 0211） Unicode控制字符空白字元
相關條目	CCSID（英语：CCSID） HTML字符编码字符集探测中日韓統一表意文字硬體代碼頁（英语：Hardware code page）磁性墨水字元識別碼（英语：Magnetic ink character recognition）亂碼中文乱码可变宽度编码
字元集