中文資訊交換碼

CCCII / EACC
	漢字圓在CCCII中的位置和字型，包含了正體字、簡體字、異體字、日本漢字的寫法
语言	漢語、日語、韓語
标准	MARC-8（英语：MARC-8）（機讀編目格式標準）、ANSI/NISO Z39.64
现状	主要為圖書館系統使用
分类	基於ISO/IEC 2022結構用於中日韓文字的三位元組字元集（TBCS）; 機讀編目格式標準的日、阿拉伯、中、韓、波斯、希伯來、意第緒文字（JACKPHY ）
	查; 论; 编;

中文資訊交換碼（Chinese Character Code for Information Interchange，簡稱CCCII），又名全漢字標準交換碼^[1]，是由中華民國政府發展的字符集和編碼方案，由獲得中研院中美科學學術合作委員會與文建會（後升格為文化部）贊助的「國字整理小組」（全名為：資訊應用國字整理小組）所提出^[2]。開發目的是將其作為中文交換碼，使中文資訊交換更加便利。

此交換碼每個字用三個位元組存儲，在節約空間方面不如大五碼，又不像中文標準交換碼成為官方標準，所以未被電腦業界廣泛採納^[3]。香港各大學圖書館在2003年由舊有的CCCII系統換成UTF-8^[4]^[5]。故現僅臺灣和美國仍在使用，且只用於大學圖書館的線上目錄檢索系統。

簡介

1979年，加州史丹佛大學召開一場籌劃東亞圖書館自動化的會議，希望訂定中文交換碼的標準作為自動化之根據，以解決使用電腦處理東亞語文資料的問題。那時的漢字碼標準只有日本產業規格訂定的JIS C6226，但由於日本漢字的數目、字型皆與中文有相當程度的差異，難以作為代表，經臺灣和美國東亞圖書館華裔與會者強力反對後，決定先擱置決議，由臺灣代表謝清俊在次年三月亞洲研究學會年會，提出臺灣方面的漢字編碼方案互作比較^[6]^[1]。

謝清俊教授返國後，上書政務委員李國鼎及國科會、中研院中美科學學術合作委員會（簡稱中美會）等單位，集合國內一批文字學家、圖書館學家及電腦科學家，組成「中文資訊處理研究用字小組」（1985年其國字整理組從中美會轉至文建會，改名為資訊應用國字整理小組），共同整理中文文字，並解決中文資訊處理的技術問題。其中，字碼編定的部份由謝清俊、張仲陶、楊鍵樵、黃克東教授負責，文字審查工作則有潘重規、周駿富、周何、何佑森、金祥恆等教授參與，並由王振鵠、張鼎鍾等教授擔任中文資訊交換碼審查小組的成員^[7]。

臺灣於次屆亞洲學會年會上，提出共4,808字的「中文資訊交換碼」；「中文資訊交換碼」的架構為美方接受，但要求擴大編碼字集。「國字整理小組」在1981年完成第二批，包括17,032個正體字、11,517個異體字；1987年再發表第三批，包括20,583個正體字。前後二次共計擴編至53,940個漢字字碼，並完成64×64，32×32的機讀字型；此外，為了方便電腦上的文字處理，又編製了「中國文字資料庫」(Chinese Character Database，簡稱CCDB)，其中列出每個字屬性如部首、筆畫、讀音以及各種對應和輸入碼^[6]。

CCCII後來獲得美國國會圖書館認可，稱為東亞文字碼（East Asian Character Code，EACC），並於1989年納入美國國家標準（編號：ANSI/NISO Z39.64）。CCCII並已被OCLC和RLIN（Research Libraries Information Network）用作中日韓文的書目字碼標準^[8]。

「國字整理小組」從1979至1989十年間，共計整理、蒐集了75,684個漢字（正體字44,167、異體字31,517）^[7]。隨著張仲陶教授在1997年去世，以及謝清俊教授將發展方向轉往漢字構形資料庫，CCCII已停止維護、更新^[9]^[10]。

編碼結構

該編碼以三個位元組來代表一個中文字，每位元組為7位元，並根據ISO 2022規格以94×94×94的編碼空間安放字符，最多可收納830,584個。

一個94×94的編碼空間稱為面（Plane）。CCCII共有94個面。以6個面組合成為1個層（Layer）。因此CCCII共有16個層，除第16層僅含4面外，其餘各層均含有6個面（即15×6+4=94）。這16個層相疊，形成一個向下延伸的三度空間，由此形成關聯。

第1個層放置正體字（正體字按常用、備用、罕用的順序分群並依序排列，各字群再按先部首、次筆畫數、最後筆順的次序排列）；第2至第13個層，放置異體字，其中第2層專放簡體字，第13層放置日文漢字。這樣的三度空間設計使檢索某一漢字的異體字變得容易，如：強、强、彊三字的後兩個位元組是一樣的^[11]。

另見

注释

^ ^1.0 ^1.1 中文字集字碼簡介/ 編目組 - 東吳大學圖書館 (PDF). [2022-12-18]. （原始内容存档 (PDF)于2022-12-26）.
^ 謝清俊; 黃克東. 國字整理小組十年. 資訊應用國字整理小組. 1989: 29-34.
^ 多管齊下，徹底解決罕用字問題. ithome. [2022-12-20]. （原始内容存档于2022-12-20）.
^ （英文） Unicode Project（Library, City University of Hong Kong）（页面存档备份，存于互联网档案馆）
^ （英文） Unicode Migration（Library, Chinese University of Hong Kong）（页面存档备份，存于互联网档案馆）
^ ^6.0 ^6.1 認識全字庫- 中文碼介紹. [2022-12-18]. （原始内容存档于2021-05-14）.
^ ^7.0 ^7.1 宋建成. 國家圖書館故事. 卷二, 館藏發展與整理. 2020: 113 [2022-12-18]. （原始内容存档于2022-12-18）.
^ 曾世熊. 中文資訊交換碼 Chinese Character Code for Information Interchange，簡稱CCCII. 圖書館學與資訊科學大辭典. [2022-12-18]. （原始内容存档于2022-12-18）.
^ Ken Lunde. CJKV Information Processing. O'Reilly Media. 2009: 123 [2022-12-20]. （原始内容存档于2022-12-20）.
^ 中央研究院資訊科學研究所 20 週年慶特刊謝清俊先生之簡介與訪談簡要. [2022-12-20]. （原始内容存档于2020-10-20）.
^ 來源參考：（中文）中文資訊交換碼，國字計劃小組，主編人張仲陶

外部連結

[東吳大學圖書館-1] 1.0 ^1.1 中文字集字碼簡介/ 編目組 - 東吳大學圖書館 (PDF). [2022-12-18]. （原始内容存档 (PDF)于2022-12-26）.

[國字整理小組-2] 謝清俊; 黃克東. 國字整理小組十年. 資訊應用國字整理小組. 1989: 29-34.

[3] 多管齊下，徹底解決罕用字問題. ithome. [2022-12-20]. （原始内容存档于2022-12-20）.

[4] （英文） Unicode Project（Library, City University of Hong Kong）（页面存档备份，存于互联网档案馆）

[5] （英文） Unicode Migration（Library, Chinese University of Hong Kong）（页面存档备份，存于互联网档案馆）

[全字庫-6] 6.0 ^6.1 認識全字庫- 中文碼介紹. [2022-12-18]. （原始内容存档于2021-05-14）.

[宋建成-7] 7.0 ^7.1 宋建成. 國家圖書館故事. 卷二, 館藏發展與整理. 2020: 113 [2022-12-18]. （原始内容存档于2022-12-18）.

[曾世熊-8] 曾世熊. 中文資訊交換碼 Chinese Character Code for Information Interchange，簡稱CCCII. 圖書館學與資訊科學大辭典. [2022-12-18]. （原始内容存档于2022-12-18）.

[9] Ken Lunde. CJKV Information Processing. O'Reilly Media. 2009: 123 [2022-12-20]. （原始内容存档于2022-12-20）.

[10] 中央研究院資訊科學研究所 20 週年慶特刊謝清俊先生之簡介與訪談簡要. [2022-12-20]. （原始内容存档于2020-10-20）.

[11] 來源參考：（中文）中文資訊交換碼，國字計劃小組，主編人張仲陶

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

查论编字符编码
早期電信	電報電碼（英语：Telegraph code）庫克與惠斯通（英语：Cooke and Wheatstone telegraph）摩斯非拉丁字母（英语：Morse code for non-Latin alphabets）日文（英语：Wabun code）中文西里爾字母（英语：Russian Morse code）韓文（英语：SKATS）博多與莫瑞 Fieldata（英语：Fieldata） ASCII ISO/IEC 646 BCDIC（英语：BCD (character encoding)）電傳文訊（英语：Teletex）與電傳視訊（英语：Videotex）／電視資訊 T.51/ISO/IEC 6937（英语：T.51/ISO/IEC 6937） ITU T.61（英语：ITU T.61） ITU T.101（英语：Videotex character set）世界系統電傳文訊（英语：World System Teletext）字元集（英语：Teletext character set）
ISO/IEC 8859	現行 -1（西歐語言） -2（中歐語言） -3（馬爾他文／世界文） -4（北歐語言） -5（西里爾字母） -6（阿拉伯文） -7（希臘文） -8（希伯來文） -9（土耳其文） -10（北日耳曼語支） -11（泰文） -13（波羅的語族） -14（凱爾特語族） -15（新西歐語言） -16（羅馬尼亞文）廢止 -12（梵文）提議 KOI-8西里爾字母（英语：ISO-IR-111）薩米文（英语：ISO-IR-197）改編威爾斯文（英语：ISO-IR-182）巴倫支西里爾字母（英语：ISO-IR-200）愛沙尼亞文（英语：Code page 922）烏克蘭西里爾字母（英语：Code page 1124）
書目	MARC-8（英语：MARC-8） ANSEL（英语：ANSEL）中文資訊交換碼 ISO 5426（英语：ISO 5426） ISO 5427（英语：ISO 5427） ISO 5428（英语：ISO 5428） ISO 6438 ISO 6862（英语：ISO 6862）
國家標準	ArmSCII BraSCII（英语：BraSCII）中文標準交換碼 DIN 66003（英语：DIN 66003） ELOT 927（英语：ELOT 927） GOST 10859（英语：GOST 10859） GB 2312 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212（英语：JIS X 0212） JIS X 0213（英语：JIS X 0213） KOI-7（英语：KOI-7） KPS 9566 KS X 1001 KS X 1002（英语：KS X 1002） LST 1564（英语：LST 1564） LST 1590-4（英语：LST 1590-4） PASCII Shift JIS SI 960（英语：SI 960） TIS-620（英语：Thai Industrial Standard 620-2533） TSCII VISCII（英语：VISCII） VSCII YUSCII（英语：YUSCII）
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367（英语：ISO/IEC 10367） EUC ISO-IR-165
macOS代码页	亞美尼亞文（英语：Mac OS Armenian）阿拉伯文巴倫支西里爾字母（英语：Mac OS Barents Cyrillic）凱爾特語族（英语：Mac OS Celtic）中歐語言克羅埃西亞文（英语：Mac OS Croatian encoding）西里爾字母（英语：Mac OS Cyrillic encoding）梵文波斯文（英语：MacFarsi encoding）字體X（英语：Macintosh Font X encoding）蓋爾文（英语：Mac OS Gaelic）喬治亞文（英语：Mac OS Georgian）希臘文（英语：MacGreek encoding）古吉拉特文（英语：Mac OS Gujarati）古木基文（英语：Mac OS Gurmukhi）希伯來文（英语：Mac OS Hebrew）冰島文（英语：Mac OS Icelandic encoding）因紐特文（英语：Mac OS Inuit）鍵盤（英语：Mac OS Keyboard encoding）拉丁文（英语：Macintosh Latin encoding）馬爾他文／世界文（英语：Mac OS Maltese/Esperanto encoding）歐甘字母（英语：Mac OS Ogham）羅曼語族羅馬尼亞文（英语：Mac OS Romanian encoding）薩米文（英语：Mac OS Sámi）土耳其文（英语：Mac OS Turkish encoding）土耳其西里爾字母（英语：Mac OS Turkic Cyrillic）烏克蘭文（英语：Mac OS Ukrainian encoding） VT100（英语：VT100 encoding）
DOS代碼頁	437 668（英语：Code page 668） 708（英语：Code page 708） 720（英语：Code page 720） 737（英语：Code page 737） 770（英语：Code page 770） 773（英语：Code page 773） 775（英语：Code page 775） 776（英语：Code page 776） 777（英语：Code page 777） 778（英语：Code page 778） 850（英语：Code page 850） 851（英语：Code page 851） 852（英语：Code page 852） 853（英语：Code page 853） 855（英语：Code page 855） 856（英语：Code page 856） 857（英语：Code page 857） 858（英语：Code page 858） 859（英语：Code page 859） 860（英语：Code page 860） 861（英语：Code page 861） 862（英语：Code page 862） 863（英语：Code page 863） 864（英语：Code page 864） 865（英语：Code page 865） 866（英语：Code page 866） 867（英语：Code page 867） 868（英语：Code page 868） 869（英语：Code page 869） 897（英语：Code page 897） 899（英语：Code page 899） 903（英语：Code page 903） 904（英语：Code page 904） 932（英语：Code page 932 (IBM)） 936（英语：Code page 936 (IBM)） 942（英语：Code page 942） 949（英语：Code page 949 (IBM)） 950 951（英语：Code page 951） 1040（英语：Code page 1040） 1042（英语：Code page 1042） 1043（英语：Code page 1043） 1046（英语：Code page 1046） 1098（英语：Code page 1098） 1115（英语：Code page 1115） 1116（英语：Code page 1116） 1117（英语：Code page 1117） 1118（英语：Code page 1118） 1127（英语：Code page 1127） 3846（英语：Code page 3846） ABICOMP（英语：ABICOMP character set） CS Indic（英语：CS Indic character set） CSX Indic（英语：CSX Indic character set） CSX+ Indic（英语：CSX+ Indic character set） CWI-2（英语：CWI-2）伊朗系統（英语：Iran System encoding）卡梅尼茨（英语：Kamenický encoding）馬索維亞（英语：Mazovia encoding） MIK（英语：MIK (character set)）
IBM AIX代碼頁	895（英语：Code page 895） 896（英语：Code page 896） 912（英语：Code page 912） 915（英语：Code page 915） 921（英语：Code page 921） 922（英语：Code page 922） 1006（英语：Code page 1006） 1008（英语：Code page 1008） 1009（英语：Code page 1009） 1010（英语：Code page 1010） 1012（英语：Code page 1012） 1013（英语：Code page 1013） 1014（英语：Code page 1014） 1015（英语：Code page 1015） 1016（英语：Code page 1016） 1017（英语：Code page 1017） 1018（英语：Code page 1018） 1019（英语：Code page 1019） 1124（英语：Code page 1124） 1133（英语：Code page 1133）
Microsoft Windows代碼頁（英语：Windows code page）	CER-GS（英语：CER-GS） 932（英语：Code page 932 (Microsoft Windows)） 936 GBK 950 1169（英语：Code page 1169） Extended Latin-8（英语：Extended Latin-8） 1250（英语：Windows-1250） 1251（英语：Windows-1251） 1252 1253（英语：Windows-1253） 1254（英语：Windows-1254） 1255（英语：Windows-1255） 1256（英语：Windows-1256） 1257（英语：Windows-1257） 1258（英语：Windows-1258） 1270（英语：Windows-1270）西里爾字母+芬蘭文（英语：Windows Cyrillic + Finnish）西里爾字母+法文（英语：Windows Cyrillic + French）西里爾字母+德文（英语：Windows Cyrillic + German）希臘語變音符號（英语：Windows Polytonic Greek）
EBCDIC代碼頁	37（英语：Code page 37） EBCDIC中的日文（英语：Japanese language in EBCDIC） DKOI（英语：DKOI）
DEC終端機（VTx（英语：VT220））	MCS（英语：Multinational Character Set） NRCS（英语：National Replacement Character Set）加拿大法文（英语：Code page 1020）瑞士文（英语：Code page 1021）西班牙文（英语：Code page 1023）英國英文（英语：Code page 1101）荷蘭文（英语：Code page 1102）芬蘭文（英语：Code page 1103）法文（英语：Code page 1104）挪威文／丹麥文（英语：Code page 1105）瑞典文（英语：Code page 1106）挪威文／丹麥文（替代）（英语：Code page 1107） 8位元希臘文（英语：Code page 1287） 8位元土耳其文（英语：Code page 1288） SI 960（英语：SI 960）希伯來文（英语：DEC Hebrew）特殊圖形（英语：DEC Special Graphics）技術（英语：DEC Technical Character Set）
特定平臺	1057（英语：Code page 1057） Acorn（英语：RISC OS character set） Adobe標準（英语：PostScript Standard Encoding） Adobe Latin 1（英语：PostScript Latin 1 Encoding） Amstrad CPC（英语：Amstrad CPC character set） Apple II（英语：Apple II character set）雅達利資訊交換標準碼（英语：ATASCII）雅達利ST（英语：Atari ST character set） BICS（英语：Bitstream International Character Set）卡西歐計算機（英语：Casio calculator character sets） CDC（英语：CDC display code） Compucolor II（英语：Compucolor II character set） CP/M+（英语：Amstrad CP/M Plus character set） DEC RADIX 50（英语：DEC RADIX 50） DEC MCS（英语：Multinational Character Set）/NRCS（英语：National Replacement Character Set） DG國際（英语：DG International） Fieldata（英语：Fieldata） GEM（英语：GEM character set） GSM 03.38（英语：GSM 03.38） HP Roman（英语：HP Roman） HP FOCAL（英语：FOCAL character set） HP RPL（英语：RPL character set） SQUOZE（英语：SQUOZE） LICS（英语：Lotus International Character Set） LMBCS（英语：Lotus Multi-Byte Character Set） MSX（英语：MSX character set） NEC APC（英语：NEC APC character set） NeXT（英语：NeXT character set） PETSCII（英语：PETSCII） SEGA SC-3000（英语：Sega SC-3000 character set）夏普計算機（英语：Sharp pocket computer character sets）夏普MZ（英语：Sharp MZ character set）辛克萊QL（英语：Sinclair QL character set）符號電傳文訊（英语：Teletext character set）德州儀器計算機（英语：TI calculator character sets） TRS-80（英语：TRS-80 character set）文圖拉國際（英语：Ventura International） WISCII（英语：Wang International Standard Code for Information Interchange） XCCS（英语：Xerox Character Code Standard） ZX80（英语：ZX80 character set） ZX81（英语：ZX81 character set） ZX Spectrum（英语：ZX Spectrum character set）
Unicode及通用字符集	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC（英语：UTF-EBCDIC） GB 18030 BOCU-1 CESU-8 SCSU TACE16（英语：Tamil All Character Encoding） Unicode編碼比較（英语：Comparison of Unicode encodings）
TeX排版系統	科克（英语：Cork encoding） LY1（英语：LY1 encoding） OML（英语：OML encoding） OMS（英语：OMS encoding） OT1（英语：OT1 encoding）
其他代碼頁	ABICOMP（英语：ABICOMP character set） ASMO 449（英语：ASMO 449）大五碼 APL符號數位編碼（英语：Digital encoding of APL symbols） ISO-IR-68（英语：ISO-IR-68） ARIB STD-B24 HZ（英语：HZ (character encoding)） IEC-P27-1（英语：IEC-P27-1） INIS 7位元（英语：INIS character set） INIS-8（英语：8位元） ISO-IR-169（英语：ISO-IR-169） ISO 2033（英语：ISO 2033） KOI -R -RU（英语：KOI8-RU） -U 今昔文字鏡 SEASCII（英语：Stanford Extended ASCII） Stanford/ITS（英语：Stanford/ITS character set） TRON（英语：TRON (encoding)）統合韓文代碼（英语：Unified Hangul Code）
控制字符	摩斯電碼專用代碼（英语：Prosigns for Morse code） C0与C1控制字符 ISO/IEC 6429 JIS X 0211（英语：JIS X 0211） Unicode控制字符空白字元
相關條目	CCSID（英语：CCSID） HTML字符编码字符集探测中日韓統一表意文字硬體代碼頁（英语：Hardware code page）磁性墨水字元識別碼（英语：Magnetic ink character recognition）亂碼中文乱码可变宽度编码
字元集