ISO/IEC 8859-11

ISO/IEC 8859-11:2001「情報技術 - 8ビットシングルバイトコード化グラフィック文字セット - パート11:ラテン/タイ語アルファベット」は、 ASCIIベースの標準文字エンコーディングであるISO/IEC 8859シリーズの一部であり、初版は2001年に発行されました。非公式にはラテン/タイ語と呼ばれています。タイの国家規格TIS-620(1990)とほぼ同じです。唯一の違いは、ISO/IEC 8859-11ではコード0xA0にノーブレークスペースが割り当てられているのに対し、TIS-620では未定義のままであることです(実際には、この小さな違いは通常無視されます)。

ISO-8859-11は、 ISO 8859シリーズに基づくIANA文字セットの通常のパターンに従っているにもかかわらず、主要な登録IANA文字セット名ではありません。しかし、これはほぼ同等のTIS-620 (ノーブレークスペースがない)の別名[ 1 ]として定義されており、ノーブレークスペースにTIS-620で割り当てられていなかったコードが割り当てられているため、ISO/IEC 8859-11に問題なく使用できます。Microsoftは、WindowsのISO-8859-11にコードページ28601(別名Windows-28601)を割り当てています。 [ 2 ]ある草案では、タイ文字の位置が異なっていました。[ 3 ]

ISO/IEC 8859の他のバリエーションと同様に、下位128文字はASCIIコードと同等です。ノーブレークスペースを除く追加文字は、Unicodeでも同じ順序で出現しますが、0xA1からU+0E01などに変更されます。

Microsoft Windows コード ページ874と、タイ語版Apple Macintoshで使用されるコード ページ(MacThai)は TIS-620 のバリエーションですが、互いに互換性はありません。

文字セット

ISO/IEC 8859-11 [ 4 ]
0 1 2 3 4 5 6 7 8 9 B C D E F
0x
1倍
2倍  SP !#$%'*+-/
3倍 0123456789:;<>?
4倍 @BCDEFGHJKLM
5倍 P質問RSTあなたVWXはいZ[\]^_
6倍 `1つのbcdefグラムhjlメートルno
7倍 pqrstあなたv×yz{|}
8倍
9倍
NBSP
バックス
センチ
診断 ฿
FX

コード値 D1、D4-DA、E7-EE は結合文字です。

ベンダー拡張機能

コードページ 874 (IBM) / 9066

IBMコードページ874CP874IBM-874x-IBM874)は、コードページ9066IBM-9066)とも呼ばれ、[ 5 ] ISO/IEC 8859-11と異なるのは、次の表の枠で囲まれた9つの記号のみです。[ 6 ] [ 7 ] [ 8 ]

IBMコードページ874/9066(ISO-8859-11との相違点)[ 9 ] [ 10 ] [ 11 ]
0 1 2 3 4 5 6 7 8 9 B C D E F
バックス
センチ
診断 ฿
FX ¢ ¬ ¦ NBSP
  ISO 8859-11との違い

コードページ 1161

コードページ1161CP1161IBM-1161 )は、IBMコードページ874の変種である。唯一の違いは、DE16進数(222)の位置にあるユーロ記号(€)である。[ 12 ] [ 13 ]

コードページ 874 (Microsoft) / 1162

Windowsコードページ874windows-874MS874x-windows-874)は、IBMではコードページ1162CP1162IBM-1162 )として知られており、 [ 14 ] [ 15 ] Microsoft Windowsで使用されています。ISO/IEC 8859-11との相違点は、以下の表に示す9つの記号が追加されていることのみです。

コードページ1162(IBM)/874(Microsoft):ISO-8859-11との相違点[ 16 ] [ 17 ] [ 18 ] [ 19 ]
0 1 2 3 4 5 6 7 8 9 B C D E F
8倍
9倍 ''
  ISO 8859-11との違い

Mac OS タイ語

これはClassic Mac OSで使用されるバリアントです。

Mac OS タイ語[ 20 ]
0 1 2 3 4 5 6 7 8 9 B C D E F
8倍 »
9倍 ''
NBSP
バックス
センチ
診断  WJ ZWSP฿
FX ®©
  ISO 8859-11との違い

参照

脚注

参考文献

  1. ^ 「IANA 文字セット」
  2. ^ 「js-codepage、コードページの取得」。GitHub 2021年10月12日。
  3. ^エバーソン、マイケル. 「提案された ISO 8859-11」 .
  4. ^ Whistler, Ken (2002-10-07)、ISO/IEC 8859-11:2001、UnicodeUnicode コンソーシアム
  5. ^ IBM ; Unicode Consortium . "convrtrs.txt" . International Components for Unicode . v. 59180.0.1.はい、ibm-874 == ibm-9066。ibm-1161にはユーロアップデートが含まれています。
  6. ^ 「コードページ874情報文書」 。2017年1月16日時点のオリジナルよりアーカイブ
  7. ^ 「CCSID 874情報文書」 。2016年3月27日時点のオリジナルよりアーカイブ
  8. ^ 「CCSID 9066情報文書」 。2016年3月27日時点のオリジナルよりアーカイブ
  9. ^ IBM . 「コードページ CPGID 00874」(PDF) .レジストリ: グラフィック文字セットとコードページ.
  10. ^コードページ CPGID 00874 (txt)、IBM
  11. ^ 「コンバータエクスプローラー: ibm-874_P100-1995」国際Unicodeコンポーネント。Unicodeコンソーシアム
  12. ^ 「コードページ01161」(PDF) .
  13. ^ 「CCSID 1161情報文書」 。2016年3月27日時点のオリジナルよりアーカイブ
  14. ^ 「コードページ1162情報文書」 。2016年3月17日時点のオリジナルよりアーカイブ
  15. ^ 「CCSID 1162情報文書」 。2016年3月27日時点のオリジナルよりアーカイブ
  16. ^ 「コードページ01162」(PDF) .
  17. ^ Steele, Shawn (1998-02-28). 「cp874からUnicodeへのテーブル」 UnicodeコンソーシアムMicrosoft .
  18. ^コードページ CPGID 01162 (txt)、IBM
  19. ^国際Unicodeコンポーネント(ICU)、ibm-1162_P100-1999.ucm、2002年12月3日
  20. ^ Apple (2005-04-05). 「Mac OS タイ語文字セットから Unicode 3.2 以降へのマップ(外部版)」 . Unicode Consortium .