ISO/IEC 8859-6

ISO-8859-6(ASMO 708)
MIME / IANAISO-8859-6
エイリアスiso-ir-127, ECMA-114, ASMO-708, アラビア語, csISOLatinArabic [ 1 ]
標準ASMO 708、ECMA-114、ISO/IEC 8859-6
分類拡張ASCIIISO 8859
拡張機能OEM-708、Mac OS アラビア語(ほぼ)
先行ASMO 449
後継者ユニコード
その他の関連エンコーディングWindows-1256 (互換性なし、いくつかの文字を移動)

ISO/IEC 8859-6:1999「情報技術 - 8 ビット シングルバイト コード化グラフィック文字セット - パート 6: ラテン/アラビア語アルファベット」は、 ASCII ベースの標準文字エンコードのISO/IEC 8859シリーズの一部で、初版は 1987 年に発行されました。非公式にはラテン/アラビア語と呼ばれます。アラビア語をカバーするように設計されています。名目上の文字のみがエンコードされ、文字の事前成形形式は含まれていないため、表示には成形処理が必要です。アラビア語自体以外のほとんどのアラビア文字言語 (ペルシャ語、ウルドゥー語など) の記述に必要な追加の文字は含まれていません。

ISO-8859-6は、 ISO/IEC 6429C0およびC1制御コードが補足された場合の、この標準に対するIANA推奨の文字セット名です。テキストは論理順序で記述されるため、表示にはBiDi処理が必要です。名目上、ISO-8859-6コードページ28596)は「視覚順序」、ISO-8859-6-Iコードページ38596)は論理順序を表します。しかし、実際には、HTMLおよびXML文書に必要なISO-8859-6は論理順序テキストも表します。また、特殊な制御文字を使用して方向性を明示的に指定する必要があるとされるISO-8859-6-Eもありますが、この後者のバリアントは実際には使用されていません。IBMは、コードページ/ CCSID 1089をISO 8859-6に割り当てています。[ 2 ] [ 3 ]これは、IBMのAIXオペレーティングシステムのエミュレーションです。

ISO-8859-6はアラビア語の文字をUnicodeでエンコードするための参照標準として使用されていました[ 4 ]が、現在では技術的に時代遅れです[ 5 ]。Unicodeは、特にインターネット上の現代のアプリケーションで好まれており、WebページではUTF-8エンコードが主流となっています(完全なカバレッジについては、Unicodeのアラビア語文字も参照してください。ISO-8859-6やWindows-1256など、追加機能をカバーしていないものとは異なります)。すべてのWebページのうち0.0002%未満がISO-8859-6を使用しており[ 6 ] 、 [ 7 ]、Web上のアラビア語のエンコードオプションとしては3番目にもなりません。

歴史

ASMO 708は、現在は解散したアラブ標準化計量機構[ 8 ]によって1986年に考案され、アラビア語圏で使用される8ビット標準規格となりました。この文字セットの設計は、以前の7ビット標準規格であるASMO 449に着想を得ていますが、単に7ビット文字セットを上位に移動したわけではなく、いくつかの違いがあります。

ASMO 708は双方向文字セットです。文字セットの下部は、数字と一部の句読点において標準ISO 646と異なります。文脈(数字がラテン文字かアラビア文字か)に応じて、数字はラテン数字またはアラビア数字として表示されます。また、文脈に応じて対称句読点は反転されます。つまり、句読点が開始位置にある場合、その形状は文字の方向に応じて異なるように表示されます。

文字セットの上部には、アラビア文字、ラテン語の句読点とは異なるアラビア語の句読点、およびその他のいくつかの文字のみが含まれています。

ASMO 708はECMAとの緊密な協力のもと[ 9 ]設計され、ECMAは1986年にこれをECMA-114規格として採用した。また、 ISO規格としてもISO 8859-6として承認された[ 10 ]。さらに、1986年には国際符号化文字セット登録簿にIR 127として[ 11 ]登録された。

他の文字セットとの関係

その他の文字セットも ASMO 708 に関連しています。

  • ASMO 708/French 1 [ 12 ]はフランス語の小文字を追加します。
  • フランス語1/ASMO 708 [ 12 ]は、ISO 8859-1コードポイントにフランス語の小文字を追加し、アラビア語の小文字を削除した。
  • ISO/IR 167 [ 13 ]はフランス語とドイツ語の文字を追加します。
  • Microsoft のMS-DOS 用コード ページ 708では、コード ページ 437 の一般的なコード ポイントにフランス語の文字が追加され、ボックス描画文字も追加されています。
  • MS-DOS 用の Microsoft コード ページ 710 (透過アラビア語) と Microsoft コード ページ 720 (透過 ASMO) はどちらも、コード ページ 437 の一般的なコード ポイントにフランス語の文字を追加しますが、コード ページ 437 のボックス描画文字が元のコード ポイントに残るようにアラビア語の文字の位置を変えています。
  • Microsoft のWindows-1256 は、 Windows -252コード ポイントにフランス語の小文字を追加し、アラビア語の小文字を置き換えます。

コードチャート

ISO/IEC 8859-6 [ 14 ] [ 15 ] [ 16 ] [ 17 ]
0 1 2 3 4 5 6 7 8 9 B C D E F
0x
1倍
2倍  SP !#$% / ٪'* / ٭+-/
3倍 0/٠1/١2/٢3/٣4/45/46/٦7/٧8/٨9/٩:;<>?
4倍 @BCDEFGHJKLM
5倍 P質問RSTあなたVWXはいZ[\]^_
6倍 `1つのbcdefグラムhjlメートルno
7倍 pqrstあなたv×yz{|}
8倍
9倍
NBSP¤،シャイ
バックス ؛؟
センチ ءآأؤإئابةثجحخد
診断 ذرزسشصضطظعغ
ـفقكلمنهوىي◌ً ◌ٌ ◌ٍ ◌َ ◌ُ
FX ◌ِ ◌ّ ◌ْ

コード値 0xEB~0xF2 は結合文字に割り当てられます。

参照

参考文献

  • ISO/IEC 8859-6:1999
  • 標準 ECMA-114 : 8 ビット シングルバイト符号化グラフィック文字セット - ラテン文字/アラビア文字第 2 版 (2000 年 12 月)
  • ISO-IR 127ラテン語/アラビア語アルファベットの右側部分(1986年11月30日)