代碼頁437
外觀
代碼頁437(Code page 437)是始祖IBM PC(個人電腦)或MS-DOS使用的字元編碼。又名為CP437、OEM 437[1] PC-8[2]、或MS-DOS Latin US[3]。該字集包含ASCII由32–126的字碼、附加符號、一些希臘字母、圖示以及製圖符號。其有時也稱為「OEM字型」或「high ASCII」或「extended ASCII」[2](互不相容的眾多ASCII擴充字集之一)。
嚴格來說,此字元集並非打算用來做什麼「代碼頁」;而只不過是在當時的IBM PC用來圖像化的表現字形而已。此字元集仍然是所有EGA以及VGA相容顯示卡核心的主要字型。當電腦開機時,在載入任何儲存媒體之前所使用的就是此「代碼頁」。[4]。大多數在IBM PC時代開發的檔案格式,例如.nfo,都是內定以此為預設編碼。
顯示卡
[編輯]最初的IBM PC以每個字元9×14像素的形式儲存在MDA顯示卡旳唯讀記憶體,以及以每個字元8×8像素的形式儲存在CGA顯示卡。EGA包含的是8×14像素的版本,而VGA包含的是9×16像素的版本。
此等顯示卡全都有文字模式,當中每個字元方塊包含8位元的字元碼位,亦即提供一共256個字元。所有256個碼位都分配予唯讀記憶體中的圖像字元,當中0至31的碼位保留予ASCII用作非圖像控制字元。
代碼頁
[編輯]代碼頁有兩個主要功:
- 作為資訊交換碼(以檔案和電訊形式),當中0至127碼位擔當的角式與ASCII的相同,而128至175碼位代表國際文字字元(見下表);
- 作為用於螢幕和印表機的圖像資源(該字元可用於顯示或列印),整段256個碼位範圍都可用作圖像字元。
字元
[編輯]以下字表顯示代碼頁437的字元。每個字元同時顯示其對應的Unicode碼位及其十進位值。
1–31和127碼位的解讀
[編輯]1–31和127碼位(00–1Fhex和7Fhex)可用作控制或圖像字元,視情況而定。[5]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | ☺ 263A 1 |
☻ 263B 2 |
♥ 2665 3 |
♦ 2666 4 |
♣ 2663 5 |
♠ 2660 6 |
• 2022 7 |
◘ 25D8 8 |
○ 25CB 9 |
◙ 25D9 10 |
♂ 2642 11 |
♀ 2640 12 |
♪ 266A 13 |
♫ 266B 14 |
☼ 263C 15 | |
1_ | ► 25BA 16 |
◄ 25C4 17 |
↕ 2195 18 |
‼ 203C 19 |
¶ 00B6 20 |
§ 00A7 21 |
▬ 25AC 22 |
↨ 21A8 23 |
↑ 2191 24 |
↓ 2193 25 |
→ 2192 26 |
← 2190 27 |
∟ 221F 28 |
↔ 2194 29 |
▲ 25B2 30 |
▼ 25BC 31 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
7_ | ⌂ 2302 127 |
標準代碼頁
[編輯]_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 0 |
SOH 0001 1 |
STX 0002 2 |
ETX 0003 3 |
EOT 0004 4 |
ENQ 0005 5 |
ACK 0006 6 |
BEL 0007 7 |
BS 0008 8 |
HT 0009 9 |
LF 000A 10 |
VT 000B 11 |
FF 000C 12 |
CR 000D 13 |
SO 000E 14 |
SI 000F 15 |
1_ | DLE 0010 16 |
DC1 0011 17 |
DC2 0012 18 |
DC3 0013 19 |
DC4 0014 20 |
NAK 0015 21 |
SYN 0016 22 |
ETB 0017 23 |
CAN 0018 24 |
EM 0019 25 |
SUB 001A 26 |
ESC 001B 27 |
FS 001C 28 |
GS 001D 29 |
RS 001E 30 |
US 001F 31 |
2_ | SP 0020 32 |
! 0021 33 |
" 0022 34 |
# 0023 35 |
$ 0024 36 |
% 0025 37 |
& 0026 38 |
' 0027 39 |
( 0028 40 |
) 0029 41 |
* 002A 42 |
+ 002B 43 |
, 002C 44 |
- 002D 45 |
. 002E 46 |
/ 002F 47 |
3_ | 0 0030 48 |
1 0031 49 |
2 0032 50 |
3 0033 51 |
4 0034 52 |
5 0035 53 |
6 0036 54 |
7 0037 55 |
8 0038 56 |
9 0039 57 |
: 003A 58 |
; 003B 59 |
< 003C 60 |
= 003D 61 |
> 003E 62 |
? 003F 63 |
4_ | @ 0040 64 |
A 0041 65 |
B 0042 66 |
C 0043 67 |
D 0044 68 |
E 0045 69 |
F 0046 70 |
G 0047 71 |
H 0048 72 |
I 0049 73 |
J 004A 74 |
K 004B 75 |
L 004C 76 |
M 004D 77 |
N 004E 78 |
O 004F 79 |
5_ | P 0050 80 |
Q 0051 81 |
R 0052 82 |
S 0053 83 |
T 0054 84 |
U 0055 85 |
V 0056 86 |
W 0057 87 |
X 0058 88 |
Y 0059 89 |
Z 005A 90 |
[ 005B 91 |
\ 005C 92 |
] 005D 93 |
^ 005E 94 |
_ 005F 95 |
6_ | ` 0060 96 |
a 0061 97 |
b 0062 98 |
c 0063 99 |
d 0064 100 |
e 0065 101 |
f 0066 102 |
g 0067 103 |
h 0068 104 |
i 0069 105 |
j 006A 106 |
k 006B 107 |
l 006C 108 |
m 006D 109 |
n 006E 110 |
o 006F 111 |
7_ | p 0070 112 |
q 0071 113 |
r 0072 114 |
s 0073 115 |
t 0074 116 |
u 0075 117 |
v 0076 118 |
w 0077 119 |
x 0078 120 |
y 0079 121 |
z 007A 122 |
{ 007B 123 |
| 007C 124 |
} 007D 125 |
~ 007E 126 |
DEL 007F 127 |
8_ | Ç 00C7 128 |
ü 00FC 129 |
é 00E9 130 |
â 00E2 131 |
ä 00E4 132 |
à 00E0 133 |
å 00E5 134 |
ç 00E7 135 |
ê 00EA 136 |
ë 00EB 137 |
è 00E8 138 |
ï 00EF 139 |
î 00EE 140 |
ì 00EC 141 |
Ä 00C4 142 |
Å 00C5 143 |
9_ | É 00C9 144 |
æ 00E6 145 |
Æ 00C6 146 |
ô 00F4 147 |
ö 00F6 148 |
ò 00F2 149 |
û 00FB 150 |
ù 00F9 151 |
ÿ 00FF 152 |
Ö 00D6 153 |
Ü 00DC 154 |
¢ 00A2 155 |
£ 00A3 156 |
¥ 00A5 157 |
₧ 20A7 158 |
ƒ 0192 159 |
A_ | á 00E1 160 |
í 00ED 161 |
ó 00F3 162 |
ú 00FA 163 |
ñ 00F1 164 |
Ñ 00D1 165 |
ª 00AA 166 |
º 00BA 167 |
¿ 00BF 168 |
⌐ 2310 169 |
¬ 00AC 170 |
½ 00BD 171 |
¼ 00BC 172 |
¡ 00A1 173 |
« 00AB 174 |
» 00BB 175 |
B_ | ░ 2591 176 |
▒ 2592 177 |
▓ 2593 178 |
│ 2502 179 |
┤ 2524 180 |
╡ 2561 181 |
╢ 2562 182 |
╖ 2556 183 |
╕ 2555 184 |
╣ 2563 185 |
║ 2551 186 |
╗ 2557 187 |
╝ 255D 188 |
╜ 255C 189 |
╛ 255B 190 |
┐ 2510 191 |
C_ | └ 2514 192 |
┴ 2534 193 |
┬ 252C 194 |
├ 251C 195 |
─ 2500 196 |
┼ 253C 197 |
╞ 255E 198 |
╟ 255F 199 |
╚ 255A 200 |
╔ 2554 201 |
╩ 2569 202 |
╦ 2566 203 |
╠ 2560 204 |
═ 2550 205 |
╬ 256C 206 |
╧ 2567 207 |
D_ | ╨ 2568 208 |
╤ 2564 209 |
╥ 2565 210 |
╙ 2559 211 |
╘ 2558 212 |
╒ 2552 213 |
╓ 2553 214 |
╫ 256B 215 |
╪ 256A 216 |
┘ 2518 217 |
┌ 250C 218 |
█ 2588 219 |
▄ 2584 220 |
▌ 258C 221 |
▐ 2590 222 |
▀ 2580 223 |
E_ | α 03B1 224 |
ß 00DF 225 |
Γ 0393 226 |
π 03C0 227 |
Σ 03A3 228 |
σ 03C3 229 |
µ 00B5 230 |
τ 03C4 231 |
Φ 03A6 232 |
Θ 0398 233 |
Ω 03A9 234 |
δ 03B4 235 |
∞ 221E 236 |
φ 03C6 237 |
ε 03B5 238 |
∩ 2229 239 |
F_ | ≡ 2261 240 |
± 00B1 241 |
≥ 2265 242 |
≤ 2264 243 |
⌠ 2320 244 |
⌡ 2321 245 |
÷ 00F7 246 |
≈ 2248 247 |
° 00B0 248 |
∙ 2219 249 |
· 00B7 250 |
√ 221A 251 |
ⁿ 207F 252 |
² 00B2 253 |
■ 25A0 254 |
NBSP 00A0 255 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
除了0至31(00hex至1Fhex)可用作ASCII控制碼及圖像dingbat以外,某些字元也有多於一個意義。對應的Unicode有可能多於一個,視情況而定:
- 0和255(FFhex)都會產生空格;32(20hex)也是。將255用作U+00A0不換行空格(NBSP)在IBM PC時代的文書處理軟件已有先例。
- 176至223(B0hex至DFhex)為方框繪製字元
- 225(E1hex)是德文的sharp S(U+00DF, ß),也是希臘文的小階beta(U+03B2, β)。
- 227(E3hex)是希臘文小階的pi(U+03C0, π),但早期的字型,例如Terminal使用的字型並不明確,有可能是希臘文大階的pi(U+03A0, Π),也可以是「n次積符號」(U+220F, ∏)。
- 228(E4hex)是「n次疊加符號」(U+2211, ∑),也是希臘文大寫的sigma(U+03A3, Σ)。
- 230(E6hex)是微的符號(U+00B5, µ),也是希臘文小寫的mu(U+03BC, μ)。
- 234(EAhex)是歐姆符號(U+2126, Ω),也是希臘文大寫的omega(U+03A9, Ω)。(Unicode將歐姆符號等同大寫omega,並建議兩種情況都用後者)[7]).
- 235(EBhex)是希臘文小寫delta(U+03B4, δ),但也用作冰島文小寫的 eth(U+00F0, ð)和偏微分符號(U+2202, ∂)的替代品。
- 237(EDhex)應當用作希臘文小寫的phi,但現在主要用作空集符號(U+2205, ),還用作用來表示角度的斜體希臘文phi符號(U+03D5, )、直徑符號(U+2300, )以及拉丁文小寫「帶斜線的小寫O」(U+00F8, ø)的替代品。
- 238(EEhex)既是希臘文小寫的epsilon(U+03B5, ε),也是element-of符號(U+2208, ∈)。後來還用作歐元符號(U+20AC, €)。
另見
[編輯]參考資料
[編輯]- ^ 1.0 1.1 OEM 437. Go Global Developer Center. Microsoft. [22 Sep 2011]. (原始內容存檔於2016-06-09).
- ^ 2.0 2.1 OEM font. Encyclopedia. PCmag.com. [15 Nov 2011]. (原始內容存檔於2012-10-13).
- ^ Code Page 437 MS-DOS Latin US. Developing International Software. Microsoft. [14 Nov 2011]. (原始內容存檔於2016-03-17).
- ^ 東歐、阿拉伯以及亞洲使用的電腦可能會用不同的字集。「OEM」,即「原始裝置製造商(original equipment manufacturer)」代表該製造商在唯讀記憶體(ROM)提供的「原生」硬件字元集,以符合不同市場的要求。
- ^ 00437. Code pages by CPGID. IBM. [14 Nov 2011]. (原始內容存檔於2016-06-09).
- ^ cp437_DOSLatinUS to Unicode table (TXT). The Unicode Consortium. [14 Nov 2011]. (原始內容存檔於2016-06-09).
- ^ The Unicode Consortium, The Unicode Standard 4.0, Chapter 7, "European Alphabetic Scripts", p176. PDF version (頁面存檔備份,存於互聯網檔案館)
外部連結
[編輯]- IBM Code Page 437 reference chart[失效連結]
- IBM PC memory-mapped video graphics to Unicode(頁面存檔備份,存於互聯網檔案館) on official Unicode site