コンテンツにスキップ

ISO/IEC 6937

出典: フリー百科事典『ウィキペディア(Wikipedia)』

ISO/IEC 6937:2001, Information technology — Coded graphic character set for text communication — Latin alphabet(情報技術 — 文字コミュニケーションのためのコード化された図形文字集合 — ラテンアルファベット)は、ISO基本ラテンアルファベットにないラテン文字を表現するためにASCIIISO/IEC 646)をマルチバイト拡張したものである。ITU-T(当時はCCITT)によってテレマティクスのために開発され、T.51として勧告された。1983年にISO標準となった。

特定のバイトコードが、ダイアクリティカルマークつきの文字のためのバイトとして使われる。第1バイトの値がダイアクリティカルマークの種別を表し、ASCIIの値を持つ第2バイトが、ダイアクリティカルマークがつく文字を表す。第1バイトと第2バイトは特定の組み合わせのみが許容され、第1バイトの解釈は第2バイトによって例外がある。ISO/IEC 6937ではダイアクリティカルマークつきの組み合わせ後の文字は1つもコード化されていない。ダイアクリティカルマークその物を表したい場合は、第2バイトにASCIIのスペースを入れる。

ISO/IEC 6937はヒュージ・マックレガー・ロス英語版、ピーター・フェンウィック、ベルナルド・マルティフランス語版、レーク・ゼッケンドルフによって設計された。

ISO 6937/2ではラテン文字を使用する現代のヨーロッパの言語で使われている327の文字が定義されている。キリル文字ギリシャ文字などのラテン文字ではない文字は含まれていない。ダイアクリティカルマークつきのラテン文字でも、ルーマニア語Ș(Sコンマ)など一部は含んでいない。Sコンマについては、規格制定時にコンマビローとセディーユの区別をしていなかったので、コンマビローの代わりにセディーユを使用する。

IANAでは、ISO 6937/2のバージョンの違いに応じてISO_6937-2-25ISO_6937-2-addの2つの名称を与えている。ただし、この文字コードがインターネット上では使用されたことはない。

ISO/IEC 6937の右半分を指すISO/IEC 2022のエスケープシーケンスは ESC - R (十六進数 1B 2D 52)である[1]

1バイト文字

[編集]

ISO 6937/2の基本文字(0x00-0x7f)はISO 646に基づいているが、国際通貨記号(¤)に割り当てられていた0x24をドル記号($)に変更している。

	!"#¤%&'()*+,-./0123456789:;<=>?@
	ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`
	abcdefghijklmnopqrstuvwxyz{|}

補足文字(0x80-0xff)には、字幅のあるおよび字幅のないの図形文字、追加記号と、将来の追加のための予約領域が含まれている。

2バイト文字

[編集]

基本文字に含まれないアルファベットは2バイトでコード化する。第1バイトは「字幅のないダイアクリティカルマーク」(non spacing diacritical mark)で、第2バイトの基本アルファベットにそのダイアクリティカルマークをつける。例えば、アキュート・アクセントつきの小文字のe (é)は「[字幅のないアキュート・アクセント] + e」として表現される。

ISO 6937の「字幅のないダイアクリティカルマーク」は以下の13種類である。

種類 コード 第2バイト 生成結果
グレイヴ・アクセント 0xC1 AEIOUaeiou ÀÈÌÒÙàèìòù
アキュート・アクセント 0xC2 ACEILNORSUYZacegilnorsuyz ÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź
サーカムフレックス 0xC3 ACEGHIJOSUWYaceghijosuwy ÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ
チルダ 0xC4 AINOUainou ÃĨÑÕŨãĩñõũ
マクロン 0xC5 AEIOUaeiou ĀĒĪŌŪāēīōū
ブレーヴェ 0xC6 AGUagu ĂĞŬăğŭ
ドット 0xC7 CEGIZcegz ĊĖĠİŻċėġż
トレマ(ウムラウト) 0xC8 AEIOUYaeiouy ÄËÏÖÜŸäëïöüÿ
リング 0xCA AUau ÅŮåů
セディーユ 0xCB CGKLNRSTcklnrst ÇĢĶĻŅŖŞŢçķļņŗşţ
ダブルアキュート 0xCD OUou ŐŰőű
オゴネク 0xCE AEIUaeiu ĄĘĮŲąęįų
ハーチェク 0xCF CDELNRSTZcdelnrstz ČĎĚĽŇŘŠŤŽčďěľňřšťž

符号表

[編集]

UnicodeでU+0300—U+036Fの範囲にある結合文字は、ISO/IEC 6937では0xC1—0xCFにあり、第1バイト(lead byte)としてのみ使用される。この範囲にあるダイアクリティカルマークがついた文字は、組み合わせ済みの文字とさてはコード化されていない。ダイアクリティカルマークの組み合わせで表現できない文字については、コード化されている。

例外的に、「セディーユつきの小文字のg」はアキュート・アクセント(0xC2)を第1バイトとする。これは、「セディーユつきの小文字のg」は、Ģ ģのように「g」の上にカンマを逆にしたものを付けた形になるためである。

Unicodeでは大文字のĐ(ストローク付きD)とÐ(エズ)を区別しているが、ISO/IEC 6937では区別せずに0xE2を割り当てている。小文字は字形が異なるため、ストローク付きD(đ)に0xF2、エズ(ð)に0xF3と別のコードを割り当てている。


凡例:

 アルファベット
 制御文字
 数字
 記号
 拡張記号
 図形文字
 国際
 未定義
ISO/IEC 6937 (Latin)
16進の1の位が_0 16進の1の位が_1 16進の1の位が_2 16進の1の位が_3 16進の1の位が_4 16進の1の位が_5 16進の1の位が_6 16進の1の位が_7 16進の1の位が_8 16進の1の位が_9 16進の1の位が_A 16進の1の位が_B 16進の1の位が_C 16進の1の位が_D 16進の1の位が_E 16進の1の位が_F
(16進の10の位が)0_

0


1


2


3


4


5


6


7


8


9


10


11


12


13


14


15
(16進の10の位が)1_

16


17


18


19


21


21


22


23


24


25


26


27


28


29


30


31
(16進の10の位が)2_ SP
0020
32
!
0021
33
"
0022
34
#
0023
35
$
0024
36
%
0025
37
&
0026
38
'
0027
39
(
0028
40
)
0029
41
*
002A
42
+
002B
43
,
002C
44
-
002D
45
.
002E
46
/
002F
47
(16進の10の位が)3_ 0
0030
48
1
0031
49
2
0032
50
3
0033
51
4
0034
52
5
0035
53
6
0036
54
7
0037
55
8
0038
56
9
0039
57
:
003A
58
;
003B
59
<
003C
60
=
003D
61
>
003E
62
?
003F
63
(16進の10の位が)4_ @
0040
64
A
0041
65
B
0042
66
C
0043
67
D
0044
68
E
0045
69
F
0046
70
G
0047
71
H
0048
72
I
0049
73
J
004A
74
K
004B
75
L
004C
76
M
004D
77
N
004E
78
O
004F
79
(16進の10の位が)5_ P
0050
80
Q
0051
81
R
0052
82
S
0053
83
T
0054
84
U
0055
85
V
0056
86
W
0057
87
X
0058
88
Y
0059
89
Z
005A
90
[
005B
91
\
005C
92
]
005D
93
^
005E
94
_
005F
95
(16進の10の位が)6_ `
0060
96
a
0061
97
b
0062
98
c
0063
99
d
0064
100
e
0065
101
f
0066
102
g
0067
103
h
0068
104
i
0069
105
j
006A
106
k
006B
107
l
006C
108
m
006D
109
n
006E
110
o
006F
111
(16進の10の位が)7_ p
0070
112
q
0071
113
r
0072
114
s
0073
115
t
0074
116
u
0075
117
v
0076
118
w
0077
119
x
0078
120
y
0079
121
z
007A
122
{
007B
123
|
007C
124
}
007D
125
~
007E
126
DEL
007F
127
(16進の10の位が)8_

128


129


130


131


132


133


134


135


136


137


138


139


140


141


142


143
(16進の10の位が)9_

144


145


146


147


148


149


150


151


152


153


154


155


156


157


158


159
(16進の10の位が)A_ NBSP
00A0
160
¡
00A1
161
¢
00A2
162
£
00A3
163


164
¥
00A5
165


166
§
00A7
167
¤
00A4
168

2018
169

201C
170
«
00AB
171

2190
172

2191
173

2192
174

2193
175
(16進の10の位が)B_ °
00B0
176
±
00B1
177
²
00B2
178
³
00B3
179
×
00D7
180
µ
00B5
181

00B6
182
·
00B7
183
÷
00F7
184

2019
185

201D
186
»
00BB
187
¼
00BC
188
½
00BD
189
¾
00BE
190
¿
00BF
191
(16進の10の位が)C_

192
̀
0300
193
́
0301
194
̂
0302
195
̃
0303
196
̄
0304
197
̆
0306
198
̇
0307
199
̈
0308
200


201
̊
030A
202
̧
0327
203


204
̋
030B
205
̨
0328
206
̌
030C
207
(16進の10の位が)D_
2015
208
¹
00B9
209
®
00AE
210
©
00A9
211

2122
212

266A
213
¬
00AC
214
¦
00A6
215


216


217


218


219

215B
220

215C
221

215D
222

215E
223
(16進の10の位が)E_ Ω
2126
224
Æ
00C6
225
Đ
0110
226
ª
00AA
227
Ħ
0126
228


229
IJ
0132
230
Ŀ
013F
231
Ł
0141
232
Ø
00D8
233
Œ
0152
234
º
00BA
235
Þ
00DE
236
Ŧ
0166
237
Ŋ
014A
238
ʼn
0149
239
(16進の10の位が)F_ ĸ
0138
240
æ
00E6
241
đ
0111
242
ð
00F0
243
ħ
0127
244
ı
0131
245
ij
0133
246
ŀ
0140
247
ł
0142
248
ø
00F8
249
œ
0153
250
ß
00DF
251
þ
00FE
252
ŧ
0167
253
ŋ
014B
254
SHY
00AD
255
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F

出典

[編集]
  1. ^ Supplementary Set of ISO/IEC 6937:1992 The high-ASCII half of the character set. (The left-hand side is U.S. ASCII.)