Windows-1252
Windows-1252またはコードページ1252 (Code Page 1252, CP1252) は、Microsoft Windowsの英語版および他の数種の西欧言語版で従来のコンポーネントが既定で使用するラテン文字の文字コードである。
概要
[編集]Windowsコードページのグループの一種である。LaTeXパッケージではansinewと呼ばれる。この文字コードはISO 8859-1の上位集合だが、0x80から0x9Fの範囲に制御文字ではなく図形文字を収録していることにより、IANAのISO-8859-1とは異なる。Windowsではコードページ番号1252およびIANA登録名 "windows-1252" という名前で知られる。このコードページはISO 8859-15に含まれる印字可能文字もすべて収録している (ただしいくつかは異なるコードポイントにマップされている)。
ISO 8859-1と比較して追加された文字としては、各種の欧文記号の他、フランス語のŒ、フィンランド語などで用いるŠとŽ、ユーロ記号、ISO 8859-1では小文字しか収録されていなかったŸがある。これらの文字は ISO/IEC 8859-15 でも定義されている。
多くのウェブブラウザがMIME charset ISO-8859-1をWindows-1252として扱い (ISO-8859-1の余分な制御コードはどのみちHTMLでは禁止されている)、そのため文字コードはISO-8859-1と宣言しているWebページにしばしばWindows-1252の符号が見られる。これは電子メールクライアントでも同様である。しかしこのような文字の使用には、とりわけ受信側がLinuxやMac OSなど、Windows以外のシステムであるときに、困難が伴う可能性がある。他のシステムは0x80から0x9Fの範囲に意味のある文字を割り当てていないかもしれないし、異なる独自拡張の文字を割り当てているかもしれない。
Windows-1252のような、Windowsで使われるコードページを参照するために「ANSIコードページ」という用語が使われることもある。Windows-1252はMicrosoft Windows用語ではANSIコードページとみなされているが、このコードページがANSIで標準化されたことはない。この名前は (後に変更されてISO-8859-1となった) 初期のANSI草案から取られた。このように、Windows-1252は非標準のコードページであり歴史的理由からANSIコードページと呼ばれている[1]。
Unicode (UTF-8形式であることが多い) がWindows-1252などの8ビット「コードページ」に代わって徐々に使われるようになりつつある。
コード表
[編集]以下の表にWindows-1252を示す。下線は制御文字、および制御文字と図形文字の中間的性質をもつ文字を表す。ISO-8859-1からの変更点は背景色を変え、十進表記を「太字・イタリック」にすることで強調している。
Windows-1252 (CP1252) | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | NUL 0 |
SOH 1 |
STX 2 |
ETX 3 |
EOT 4 |
ENQ 5 |
ACK 6 |
BEL 7 |
BS 8 |
TAB 9 |
LF 10 |
VT 11 |
FF 12 |
CR 13 |
SO 14 |
SI 15 |
1x | DLE 16 |
DC1 17 |
DC2 18 |
DC3 19 |
DC4 20 |
NAK 21 |
SYN 22 |
ETB 23 |
CAN 24 |
EM 25 |
SUB 26 |
ESC 27 |
FS 28 |
GS 29 |
RS 30 |
US 31 |
2x | SP 32 |
! 33 |
" 34 |
# 35 |
$ 36 |
% 37 |
& 38 |
' 39 |
( 40 |
) 41 |
* 42 |
+ 43 |
, 44 |
- 45 |
. 46 |
/ 47 |
3x | 0 48 |
1 49 |
2 50 |
3 51 |
4 52 |
5 53 |
6 54 |
7 55 |
8 56 |
9 57 |
: 58 |
; 59 |
< 60 |
= 61 |
> 62 |
? 63 |
4x | @ 64 |
A 65 |
B 66 |
C 67 |
D 68 |
E 69 |
F 70 |
G 71 |
H 72 |
I 73 |
J 74 |
K 75 |
L 76 |
M 77 |
N 78 |
O 79 |
5x | P 80 |
Q 81 |
R 82 |
S 83 |
T 84 |
U 85 |
V 86 |
W 87 |
X 88 |
Y 89 |
Z 90 |
[ 91 |
\ 92 |
] 93 |
^ 94 |
_ 95 |
6x | ` 96 |
a 97 |
b 98 |
c 99 |
d 100 |
e 101 |
f 102 |
g 103 |
h 104 |
i 105 |
j 106 |
k 107 |
l 108 |
m 109 |
n 110 |
o 111 |
7x | p 112 |
q 113 |
r 114 |
s 115 |
t 116 |
u 117 |
v 118 |
w 119 |
x 120 |
y 121 |
z 122 |
{ 123 |
| 124 |
} 125 |
~ 126 |
DEL 127 |
8x | € 128 |
129 |
‚ 130 |
ƒ 131 |
„ 132 |
… 133 |
† 134 |
‡ 135 |
ˆ 136 |
‰ 137 |
Š 138 |
‹ 139 |
Œ 140 |
141 |
Ž 142 |
143 |
9x | 144 |
‘ 145 |
’ 146 |
“ 147 |
” 148 |
• 149 |
– 150 |
— 151 |
˜ 152 |
™ 153 |
š 154 |
› 155 |
œ 156 |
157 |
ž 158 |
Ÿ 159 |
Ax | NBSP 160 |
¡ 161 |
¢ 162 |
£ 163 |
¤ 164 |
¥ 165 |
¦ 166 |
§ 167 |
¨ 168 |
© 169 |
ª 170 |
« 171 |
¬ 172 |
SHY 173 |
® 174 |
¯ 175 |
Bx | ° 176 |
± 177 |
² 178 |
³ 179 |
´ 180 |
µ 181 |
¶ 182 |
· 183 |
¸ 184 |
¹ 185 |
º 186 |
» 187 |
¼ 188 |
½ 189 |
¾ 190 |
¿ 191 |
Cx | À 192 |
Á 193 |
 194 |
à 195 |
Ä 196 |
Å 197 |
Æ 198 |
Ç 199 |
È 200 |
É 201 |
Ê 202 |
Ë 203 |
Ì 204 |
Í 205 |
Î 206 |
Ï 207 |
Dx | Ð 208 |
Ñ 209 |
Ò 210 |
Ó 211 |
Ô 212 |
Õ 213 |
Ö 214 |
× 215 |
Ø 216 |
Ù 217 |
Ú 218 |
Û 219 |
Ü 220 |
Ý 221 |
Þ 222 |
ß 223 |
Ex | à 224 |
á 225 |
â 226 |
ã 227 |
ä 228 |
å 229 |
æ 230 |
ç 231 |
è 232 |
é 233 |
ê 234 |
ë 235 |
ì 236 |
í 237 |
î 238 |
ï 239 |
Fx | ð 240 |
ñ 241 |
ò 242 |
ó 243 |
ô 244 |
õ 245 |
ö 246 |
÷ 247 |
ø 248 |
ù 249 |
ú 250 |
û 251 |
ü 252 |
ý 253 |
þ 254 |
ÿ 255 |
マイクロソフトとユニコードコンソーシアムのWebサイト上の情報によれば、符号位置 81, 8D, 8F, 90, および 9D は未使用である。しかし、コードページからUnicodeへ変換するためのWindows API呼び出しはこれらを対応するC1制御記号にマップしている。符号位置 80 のユーロ文字はキャロン (ハーチェク) 付きの S や Z と同様、このコードページの以前のバージョンでは存在していなかった。
英語版のWindowsでは、Windows-1252の文字はAltキーを押下したままゼロに続けて文字の3桁10進符号をテンキーで入力することにより挿入できる (ゼロを省略する点以外同様の方法で、古いコードページ437の文字も入力できる)。
脚注
[編集]関連項目
[編集]外部リンク
[編集]- Windows 1252の参照表 (英語)
- IANAの文字コード名登録簿 (英語)
- Windows 1252のUnicode対応表 (英語)
- "best fit"によるWindows 1252のUnicode対応表 (英語)