ISO-IR-111

KOI8-E(1986年)
エイリアスISO-IR-111
言語ロシア語ベラルーシ語マケドニア語セルビア語ウクライナ語(一部)
標準ECMA-113:1986
分類拡張ASCIIKOI
拡張KOI8-B
後継者ECMA-113:1988 ( ISO-8859-5 )
その他の関連エンコーディングKOI8-F

ISO-IR-111 [ 1 ]またはKOI8-E [ 2 ]は8ビット文字集合である。これは、ベラルーシ語マケドニア語セルビア語ウクライナ語KOI8-Fに追加されたҐ ґ を除く)向けのKOI-8の多国間拡張である。「ISO-IR-111」という名称は、 ISO-IRレジストリにおける登録番号を指し、ISO/IEC 2022で使用可能な文字集合であることを示す。

これはECMA-113の最初の版(1986年版)で定義されました。[ 3 ]これはISO/IEC 8859-5に対応するECMA国際規格であり、1987年のISO-8859-5の草案版にも対応しています。[ 4 ] ISO/IEC 8859-5の公開版は、代わりに異なるエンコーディングを定義するECMA-113の後継版に対応しています。[ 5 ]

命名の混乱

1985年版のECMA-113(「ECMA-Cyrillic」または「KOI8-E」とも呼ばれる)であるISO-IR-111は、1974年版のGOST 19768(すなわちKOI-8)に基づいていました。1987年にECMA-113は再設計されました。[ 5 ]これらの新しいECMA-113版はISO-8859-5と同等であり、[ 5 ] [ 6 ] KOIレイアウトに従っていません。この混乱により、ISO-8859-5はGOST 19768-74で定義された、またはGOST 19768-74に基づいているという誤解が広まりました。[ 6 ]

おそらくこれの別の結果として、RFC  1345は誤って「ISO-IR-111」および「ECMA-Cyrillic」という名前で別のコードページをリストしています。これは、行の順序が変更されたISO-8859-5に似ており、Windows-1251と部分的に互換性があります。[ 7 ] [ 6 ]既存の実装がこれらの2つのラベルにRFC 1345の定義を使用する可能性があるという懸念から、IANAがKOI8-EECMA-113:1985コンテンツのラベルとして追加認識することが提案され、 [ 7 ] IANAは現在そのラベルを別名としてリストしています。[ 2 ]

文字セット

次の表はISO-IR-111のエンコードを示しています。各文字は対応するUnicodeコードポイントで示されています。

ISO-IR-111
0 1 2 3 4 5 6 7 8 9 B C D E F
0x
1倍
2倍  SP !#$%'*+-/
3倍 0123456789:;<>?
4倍 @BCDEFGHJKLM
5倍 P質問RSTあなたVWXはいZ[\]^_
6倍 `1つのbcdefグラムhjlメートルno
7倍 pqrstあなたv×yz{|}
8倍
9倍
NBSPђ 0452ѓ 0453ё 0451є 0454ѕ 0455і 0456ї 04570458љ 0459њ 045Aћ 045Bќ 045Cシャイў 045Eџ 045F
バックス 2116Ђ 0402Ѓ 0403Ё 0401Є 0404Ѕ 0405І 0406Ї 0407Ј 0408Љ 0409Њ 040AЋ 040BЌ 040C¤ 00A4Ў 040EЏ 040F
センチ 044E0430б 0431ц 0446д 0434е 0435ф 0444г 0433х 04450438© 0439к 043Aл 043Bм 043C043Dо 043E
診断 п 043Fя 044Fр 044004410442у 0443ж 04360432ь 044Cы 044Bз 0437ш 0448э 044Dщ 0449ч 0447ъ 044A
Ю 042EА 0410Б 0411Ц 0426Д 0414Е 0415Ф 0424Г 0413Х 0425И 0418Й 0419К 041AЛ 041BМ 041CН 041DО 041E
FX П 041FЯ 042FР 0420С 04210422У 0423Ж 0416В 0412Ь 042CЫ 042BЗ 0417Ш 0428Э 042DЩ 0429Ч 0427Ъ 042A

拡張版と修正版

KOI8 UnifiedまたはKOI8-Fと呼ばれる修正版がFingertip Software社が作成したソフトウェアで使用され、KOI8-Uの位置にҐが追加され(ソフトハイフンが置き換えられ、ユニバーサル通貨記号が置き換えられた)、C1制御コード領域に主にKOI8-RWindows-1251からのいくつかのグラフィカル文字が追加されました。[ 4 ] [ 6 ] [ 8 ] [ 9 ]

RFC 1345 コードページが正しくありません

RFC 1345の「ECMA-キリル文字」
言語ロシア語ベラルーシ語マケドニア語セルビア語
標準RFC  1345
分類拡張ASCII
変換/エンコードISO-IR-111
その他の関連エンコーディングISO-8859-5Windows-1251

RFC  1345は、誤ってISO-IR-111という別のコードページを記載しています。これは同じキリル文字をエンコードしていますが、レイアウトが異なります。これはWindows-1251ISO-8859-5を混ぜ合わせたようなコードページです。[ 7 ]具体的には、行A_はISO-8859-5に、行C_からF_はWindows-1251に[ 6 ](ISO-8859-5の行B_からE_に相当)に、行B_はISO-8859-5の行F_にほぼ相当しますが、§が¤に置き換えられています。

一部のコードはISO-IR-111と大文字小文字が反転した形で類似しており、これが混乱の一因となった可能性があります。大部分は異なりますので、以下に示します。

RFC 1345でコード ページが誤って「ISO-IR-111」または「ECMA-Cyrillic」とラベル付けされている 
0 1 2 3 4 5 6 7 8 9 B C D E F
NBSPЁЂЃЄЅІЇЈЉЊЋЌシャイЎЏ
バックス いいえёђѓєѕіїјљњћќ¤ўџ
センチ БВГДЕЖЗИЙКЛМНП
診断 РСТУФХЦЧШЩЪЫЬЭЮЯ
ああбвгджзйклмноп
FX рстуфхцчшщъыьэю
  ISO-IR-111からの逸脱(ケースのみの逸脱を除く)

参照

参考文献