C0およびC1制御コード、あるいは制御文字セットは、 ASCIIおよびASCII派生言語を使用するコンピュータシステムでテキスト内で使用される制御コードを定義します。これらのコードは、カーソルの位置、改行指示、テキスト受信メッセージなど、テキストに関する追加情報を表します。
C0コードは00 HEX~1F HEXの範囲で、デフォルトのC0セットは元々ISO 646(ASCII )で定義されました。C1コードは80 HEX~9F HEXの範囲で、デフォルトのC1セットは元々ECMA-48(後にISO 6429と整合)で定義されました。制御文字およびグラフィック文字を指定するISO/IEC 2022システムでは、特殊な用途向けに他のC0およびC1セットも利用可能ですが、ほとんど使用されていません。
C0制御
ASCIIは32個の制御文字とDEL文字を定義しています。当時、マルチバイト制御には端末にステートマシンを実装する必要があり、当時の電子機器や機械式端末では非常に困難だったため、この多数のコードは望ましいものでした
使用されているコードはごくわずかで、BEL、ESC、そしてフォーマットエフェクタ[ 1 ](FE n)文字であるBS、HT、LF、VT、FF、CRです。その他のコードは使用されていないか、C言語の文字列終端文字であるNULのように異なる意味を獲得しています。ANPA -1312、Kermit、XMODEMなどのデータ転送プロトコルでは、元の定義に近づけるためにSOH、STX、ETX、EOT、ACK、NAK、SYNを多用しています。また、Unix info形式[ 2 ]やPythonのsplitlines文字列メソッド[ 3 ]など、一部のファイル形式では「情報区切り文字」(IS n )が使用されています。
ISO 6429:1992(またはECMA-48:1991)では、一部のコード名称が、表記方向に依存しないよう変更されました。ただし、使用されている略語は変更されていません。これは、規格が他の言語に翻訳されても略語は変更されないことが既に規定されていたためです。この表では、名称が変更されたコントロールについて、新旧両方の名称を示しています(旧名称は略語と一致するものです)。
Unicodeは、C0制御文字を画面上で表示できるように置き換える制御ピクチャを提供しています。ただし、キャレット表記の方がより一般的に使用されます。
10進数 | 16進数 | 略語 | 名前 | 説明 | |||||
|---|---|---|---|---|---|---|---|---|---|
| ^@ | 0 | 00 | ヌル | ␀ | ヌル | \0 | 何もしません。空白の紙テープのコードで、伝送速度を遅くするためのパディングとしても使用されます | ||
| ^A | 1 | 01 | TC 1、SOH | ␁ | 見出しの開始 | メッセージの見出しの最初の文字。[ 5 ] | |||
| ^B | 2 | 02 | TC 2、STX | ␂ | 本文の開始 | ヘッダーを終了し、メッセージ本文を開始します | |||
| ^C | 3 | 03 | TC 3、ETX | ␃ | テキストの終了 | メッセージテキストを終了し、フッターを開始します(次のTC文字まで)。[ 5 ] [ 6 ] | |||
| ^D | 4 | 04 | TC 4、EOT | ␄ | 送信終了 | 1つ以上のメッセージの送信を終了します。[ 5 ] [ 6 ]端末をスタンバイ状態にする場合があります。[ 6 ] | |||
| ^E | 5 | 05 | TC 5、ENQ、WRU [ a ] | ␅ | 問い合わせ | 受信側で応答をトリガーし、まだ存在するかどうかを確認します | |||
| ^F | 6 | 06 | TC 6、ACK | ␆ | 確認 | メッセージの受信に成功したことを示します。 | |||
| ^G | 7 | 07 | ベル[ b ] | ␇ | ベル、アラート | \a | オペレーターに連絡してください。 | ||
| ^H | 8 | 08 | FE 0、BS | ␈ | バックスペース | \b | 1つ左に移動します。次の文字は、そこにあった文字を上書きするか、置き換えます | ||
| ^I | 9 | 09 | FE 1、HT、TAB [ c ] | ␉ | 文字集計、横集計 | \t | 次のタブ ストップまで右に移動します。 | ||
| ^J | 10 | 0A | FE 2、LF | ␊ | 改行 | \n | 次の行の同じ位置まで下に移動します(一部のデバイスでは左の列にも移動します)。 | ||
| ^K | 11 | 0B | FE 3、VT | ␋ | 行集計、縦集計 | \v | 次の垂直タブ ストップまで下に移動します。 | ||
| ^L | 12 | 0C | FE 4、FF、NP [ d ] | ␌ | フォームフィード | \f | 次のページの先頭に移動します | ||
| ^M | 13 | 0D | FE 5、CR | ␍ | キャリッジリターン | \r | 同じ行に留まりながら、0列目に移動します | ||
| ^N | 14 | 0E | SO、LS 1 [ 13 ] [ e ] | ␎ | シフトアウト | 別の文字セットに切り替えます。 | |||
| ^O | 15 | 0F | SI、LS 0 [ 13 ] [ e ] | ␏ | シフトイン | SOの後に通常の文字セットに戻ります。 | |||
| ^P | 16 | 10 | TC 7、DC 0、[ f ] DLE | ␐ | データリンクエスケープ | 連続する限られた数の文字を、何らかの異なる方法で解釈させます。[ 15 ] [ 16 ] | |||
| ^Q | 17 | 11 | DC 1、XON | ␑ | デバイスコントロールワン | デバイスをオン (DC 1および DC 2 ) またはオフ (DC 3および DC 4 ) にします。 テレタイプ[ 7 ]は、紙テープリーダーと紙テープパンチにこれを使用しました。最初の使用は、ソフトウェアフロー制御の事実上の標準となりました。[ 17 ] | |||
| ^R | 18 | 12 | DC 2、テープ | ␒ | デバイスコントロール2 | ||||
| ^S | 19 | 13 | DC 3、XOFF | ␓ | デバイスコントロール3 | ||||
| ^T | 20 | 14 | DC 4、 | ␔ | デバイスコントロール4 | ||||
| ^U | 21 | 15 | TC 8、NAK | ␕ | 否定応答 | エラーの検出など、送信者への否定的な応答 | |||
| ^V | 22 | 16 | TC 9、SYN | ␖ | 同期アイドル | 同期伝送システムにおいて、他の文字が伝送されていないときに送信されます | |||
| ^W | 23 | 17 | TC 10、ETB | ␗ | 伝送ブロックの終了 | 伝送目的でデータがブロックに分割された場合の、データの伝送ブロックの終了 | |||
| ^X | 24 | 18 | CAN | ␘ | キャンセル | 先行するデータがエラーであるか、無視されることを示します | |||
| ^Y | 25 | 19 | EM | ␙ | 媒体終了 | 紙や磁気テープ上で、テープの使用可能部分の終わりに達したことを示します。[ 4 ] | |||
| ^Z | 26 | 1A | サブ | ␚ | 代替 | 無効またはエラーであると判明した文字を置き換えます。無視してください。 | |||
| ^[ | 27 | 1B | ESC | ␛ | エスケープ | \e [ g ] | 後続のバイトの限られた数の意味を変更します。現在では、これはほとんどの場合、ANSIエスケープシーケンスを導入するために使用されます。 | ||
| ^\ | 28 | 1C | IS 4、FS | ␜ | ファイルセパレータ | データ構造のフィールドを区切る区切り文字として使用できます。USは最下位レベルで、RS、GS、FSは下位レベルの項目で構成されるグループを区切るための上位レベルです。SP(スペース)はさらに下位レベルと見なすことができます | |||
| ^] | 29 | 1D | IS 3、GS | ␝ | グループ区切り | ||||
| ^^ | 30 | 1E | IS 2、RS | ␞ | レコードセパレーター | ||||
| ^_ | 31 | 1階 | IS 1、米国 | ␟ | 単位区切り文字 | ||||
| 技術的にはC0制御文字の範囲の一部ではありませんが、次の2つの文字は制御文字のいくつかの特性を持っていると考えられます | |||||||||
| 32 | 20 | SP | ␠ | スペース | 1文字分右に移動します | ||||
| ^? | 127 | 7F | 削除 | ␡ | 削除 | 無視してください。すべての穴をパンチして、パンチテープ上の文字を削除するために使用されます。 | |||
- ^テレタイプではこのキーを「あなたは誰ですか?」の略であるWRUと名付けた[ 7 ]
- ^ BELLという名前は、Unicodeによって無関係の絵文字🔔(U+1F514)に割り当てられています。C0およびC1制御文字は当時Unicode標準自体では正式に命名されていませんでしたが、UTS#18(Unicode正規表現標準)の前のバージョンに準拠したソフトウェアでこの制御文字の名前としてBELLが既に使用されていたため、衝突しました。 [ 8 ]例えばPerlなどです。 [ 9 ] Unicodeは現在、制御文字の正式な別名としてALERTとBEL(BELLは除く)を受け入れていますが、 [ 10 ]コードチャートでは依然としてBELLがISO 6429の別名として記載されており、 [ 11 ]対応する制御ピクチャのコードポイントはSYMBOL FOR BELLと呼ばれています。Perlはその後、バージョン5.18でこの絵文字にBELLを使用するように切り替えました。 [ 12 ]
- ^ MS-DOS およびその派生ソフトではこれを TAB と呼んでいますが、QBASIC のヘルプの表によれば意味は同じで、(水平) タブです。
- ^ MS-DOS およびその派生プログラムではこれを NP (次のページ) と呼びますが、QBASIC のヘルプの表によれば、意味は同じで、次のページの先頭に移動します。
- ^ a b ISO/IEC 2022(ECMA-35)では、8ビット環境ではLS0とLS1、7ビット環境ではSIとSOと呼ばれています。[ 13 ]
- ^ 1963年版のASCIIでは、 DLEは伝送制御ではなくデバイス制御として分類され、DC0(「データリンクエスケープ用に予約されたデバイス制御」)という略語が与えられました。 [ 14 ]
- ^ ' \e ' エスケープシーケンスは、ISO C や他の多くの言語仕様には含まれていません。ただし、 GCCを含むいくつかのコンパイラでは認識されます。
C1コントロール
1973年、ECMA-35とISO 2022 [ 18 ]は、8ビットの「拡張ASCII」コードを対応する7ビットコードに変換し、その逆も行う方法を定義しようとした。[ 19 ] 7ビット環境では、シフトアウト(SO )によって0x20から0x7Fまでの96バイトの意味が変更[ a ] [ 21 ](つまり、C0制御コード以外のすべて)が、上位ビットがセットされた同じコードを使用した場合に8ビット環境で出力される文字になる。つまり、0x80から0x9Fの範囲は7ビット環境では出力できないため、[ 19 ]代替文字セットではこれらのコードを使用できないと判断され、これらのコードは追加の制御コードとなり、C1制御コードとして知られるようになった。 7ビット環境でこれらの新しい制御文字を使用できるようにするには、から までのシーケンスを同等と見なす必要があります。[ 19 ]その後のISO 8859規格では7ビットコードのサポートは廃止されましたが、この範囲の制御文字は保持されました。 ESC @ESC _
ISO 2022で使用するために登録された最初のC1制御コードセットはDIN 31626 [ 22 ]であり、これは書誌使用のための特殊なセットで、1979年に登録されました。[ 23 ]
より一般的な汎用ISO/IEC 6429セットは1983年に登録されましたが[ 24 ] 、そのベースとなったECMA-48仕様は1976年に初めて発行され[ 25 ]、JIS X 0211(旧JIS C 6323)も発行されました[ 26 ] 。RFC 1345 とISO 10646の初期ドラフトで定義されているがISO/IEC 6429には含まれていない記号名(PAD、HOP、SGC)も使用されています[ 9 ] 。 [ 27 ]
EUC-JPテキストのSS2とSS3 、およびEBCDICから変換されたテキストのNELを除き、これらのコードの8ビット形式はほとんど使用されませんでした。CSI 、DCS 、およびOSCはテキスト端末および端末エミュレータの制御に使用されますが、ほとんどの場合、7ビットエスケープコード表現が使用されます。今日では、これらのコードに遭遇した場合、Windows-1252またはMac OS Romanのその位置から文字を印刷することを意図している可能性が非常に高くなります。
NELを除き、Unicode はこれらのいずれにも「制御ピクチャ」を提供していません。また、これらの文字には、よく知られたキャレット表記のバリエーションも存在しません。
ESC+ | 10進数 | 16進数 | 略語 | 名前 | 説明[ 28 ] |
|---|---|---|---|---|---|
| @ | 128 | 80 | パッド[ 10 ] | パディング文字[ b ] | シングルバイト文字を2バイトにすることで、マルチバイト文字との相互運用性を容易にするための「パディング」または「上位バイト」として提案されています。拡張Unixコード(EUC)では、この方式が時々使用されます。[ 32 ] |
| A | 129 | 81 | ホップ[ 10 ] | ハイオクテットプリセット[ b ] | 単純なデータ圧縮形式として、 複数バイト文字のシーケンスの上位バイトを、それぞれ 1 バイトのみで済むように設定することを提案しました。 |
| B | 130 | 82 | BPH | ここで休憩が許可されています[ c ] | 改行が許可されているグラフィック文字の後に続きます。ソフトハイフンやゼロ幅スペースとほぼ同等ですが、改行後の印字内容は定義されません。 |
| C | 131 | 83 | NBH | ここは休憩禁止[ c ] | 分割されないグラフィック文字の後に続きます。「単語結合子」も参照してください。 |
| D | 132 | 84 | IND | 索引[ d ] | LF の意味の曖昧さを排除するために、水平方向に移動せずに 1 行下に移動します。 |
| E | 133 | 85 | NEL | 次の行 | EBCDIC制御文字 に一致するCR+LFに相当します |
| F | 134 | 86 | SSA | 選択エリアの開始 | ブロック指向端末で使用される。xtermでは、一部ESC Fのソフトウェアがこの動作を前提としているため、画面の左下隅に移動する。[ 35 ] |
| G | 135 | 87 | ESA | 選択エリアの終了 | |
| H | 136 | 88 | HTS |
| 現在の位置にタブストップを設定します。 |
| I | 137 | 89 | HTJ |
| 最後のタブ以降のテキストを次のタブ ストップに対して右揃えにします。 |
| J | 138 | 8A | VTS |
| 垂直タブストップを設定します。 |
| K | 139 | 8B | PLD |
| ISO/IEC 6429で下付き文字と上付き文字を作成するには、を使用します。下付き文字には を使用し、上付き文字には を使用します。 PLD text PLUPLU text PLD |
| L | 140 | 8C | PLU |
| |
| M | 141 | 8D | RI |
| 1行上に移動します。 |
| N | 142 | 8E | SS2 | シングルシフト2 | 次の文字はそれぞれG2またはG3セットから選択されます |
| O | 143 | 8階 | SS3 | シングルシフト3 | |
| P | 144 | 90 | DCS | デバイス制御文字列 | 印刷可能な文字列(0x20から0x7E)とフォーマットエフェクタ(0x08から0x0D)が続き、ST(0x9C)で終了します。Xtermではこれらの文字列がいくつか定義されています。[ 36 ] |
| Q | 145 | 91 | PU1 | 私的使用1 | データの送信者と受信者の間で合意されたプライベート機能のために予約されています。 |
| R | 146 | 92 | PU2 | 私的利用2 | |
| S | 147 | 93 | STS | 送信状態の設定 | |
| T | 148 | 94 | CCH | キャラクターをキャンセル | BSの意味の曖昧さを排除するための破壊的なバックスペース。 |
| U | 149 | 95 | MW | メッセージ待機中 | |
| V | 150 | 96 | スパ | 保護区の始まり | ブロック指向端末によって使用されます。 |
| 西 | 151 | 97 | EPA | 保護区域の終点 | |
| X | 152 | 98 | SOS | 文字列の開始[ c ] | ST (0x9C)で終了する制御文字列が続きます。これには ( DCS、OSC、PM 、またはAPCとは異なり) SOS または ST 以外の任意の文字を含めることができます。 |
| Y | 153 | 99 | SGC、[ 10 ] SGCI [ 37 ] | 単一グラフィック文字紹介[ b ] | 任意のUnicode文字を印刷できるようにすることを目的としており、その後に32ビットのコードポイントを定義する4バイトが続き、おそらくビッグエンディアンとなる。[ 37 ] |
| Z | 154 | 9A | SCI | 単一文字の紹介文[ c ] | 1 つの印刷可能文字 (0x20 ~ 0x7E) またはフォーマット エフェクタ (0x08 ~ 0x0D) が続き、使用されているグラフィック セットまたはコントロール セットに関係なく、ASCII として印刷されます。 |
| [ | 155 | 9B | CSI | 制御シーケンスイントロデューサー | パラメータを取る制御シーケンスを導入するために使用されます。ANSIエスケープシーケンスに使用されます。 |
| \ | 156 | 9C | ST | 文字列終端記号 | DCS、SOS、OSC、PM、またはAPCによって開始された文字列を終了します。 |
| ] | 157 | 9D | OSC | オペレーティングシステムコマンド | 印刷可能な文字の文字列 (0x20 から 0x7E) とフォーマット エフェクタ (0x08 から 0x0D) が続き、ST (0x9C) で終了します。プロトコル情報のインバンド シグナリングを可能にするために使用することを目的としていますが、その目的で使用されることはほとんどありません。 xtermを含む一部の端末エミュレータは、ウィンドウタイトルの設定やカラーパレットの変更にOSCシーケンスを使用します。また、OSCシーケンスの終了にSTではなくBELをサポートしている場合もあります。 [ 38 ] Kermitはコマンドの送信にAPCを使用していました。[ 39 ] |
| ^ | 158 | 9E | 午後 | プライバシーメッセージ | |
| _ | 159 | 9階 | APC | アプリケーションプログラムコマンド |
その他の制御コードセット
ISO /IEC 2022 (ECMA-35) 拡張メカニズムでは、エスケープシーケンスによってC0およびC1制御文字セットを変更することが可能になった。上記の標準C0制御文字セットはシーケンスで選択されESC ! @、上記のC1制御文字セットはシーケンスで選択されるESC " C。[ 24 ]
公式および非公式の代替手段がいくつか定義されていますが、これらはほぼ時代遅れです。そのほとんどは、相互運用性を確保するためにASCII制御との互換性をある程度維持せざるを得ませんでした。この規格では、ESC、[ 40 ] [ 41 ] SP、DEL [ a ]を「固定」コード化文字としており、これらの文字は規格に準拠するすべてのエンコードにおいて、ASCII位置で使用できます。[ 43 ]また、C0セットに伝送制御コード(TC n)が含まれている場合、それらはASCII位置でコード化する必要があり[ 40 ]、C1セットに含めることはできないこと、[ 44 ]と規定されています。新しい伝送制御コードはC1セットに含める必要があります。[ 40 ]
代替C0文字セット
- ニュース伝送に使用されるテキスト マークアップ言語であるANPA-1312 は、いくつかの C0 制御文字を置き換えます。
- 上記の新しい国際バージョンであるIPTC 7901には、独自のバリエーションがあります。
- Videotex にはまったく異なるセットがあります。
- テレテキストもビデオテックスに類似したセットを定義します。
- T.61 / T.51 [ 45 ]およびその他[ 46 ]ではEMとGSをSS2とSS3に置き換え、エスケープシーケンスに頼ることなく7ビット環境でこれらの機能を使用できるようにしました。
- 一部のセットではFSをSS2に置き換えた[ 47 ](ANPA-1312と同じ)。
- 現在は廃止されているJIS C 6225(後の資料ではJIS X 0207と命名)[ 48 ]は、FSをCEXまたは「制御拡張」[ 49 ]に置き換えました。これは、縦書きテキストの動作、上付き文字と下付き文字[ 50 ]、およびカスタム文字グラフィックスの送信のための制御シーケンスを導入します。[ 48 ]
代替C1文字セット
- 特殊なC1制御コードセットは、 MARC-8などの書誌的使用(文字列照合を含む)のために登録されています。[ 23 ] [ 51 ] [ 52 ]
- ビデオテックスフォーマットで使用するために、様々な特殊なC1制御コードセットが登録されています。[ 22 ]
- Stratus VOSオペレーティングシステムは、 NLS制御セットと呼ばれるC1セットを使用します。[ 53 ]これにはSS1(シングルシフト1)からSS15(シングルシフト15)までの制御が含まれており、[ 54 ]定義済み補助文字セットから個々の文字を呼び出すために使用されます。[ 55 ]これはISO/IEC 2022のシングルシフトメカニズムに似ています。ISO/IEC 2022で定義されているシングルシフト制御はSS2とSS3のみであり、これらは元のコードポイントでVOSセットに保持され、同じように機能します。
- EBCDICは、ASCIIにある制御コードに加えて最大29個の制御コードを追加で定義しています。EBCDICをUnicode(またはISO 8859)に変換する場合、これらのコードはIBMの文字データ表現アーキテクチャ(CDRA)で指定された方法でC1制御文字にマッピングされます。[ 56 ] [ 57 ]改行(NL)はISO/IEC 6429のNELに変換されますが(UNIXの行末規則に従ってLFと入れ替えられることがよくあります)、[ 56 ]残りの制御コードは対応していません。たとえば、EBCDICの制御SPSとECMA-48の制御PLUはどちらも上付き文字の開始または下付き文字の終了に使用されますが、互いにマッピングされていません。したがって、拡張ASCIIマッピングされたEBCDICは、 ISO/IEC 2022のISO-IRレジストリに登録されていませんが、独自のC1セットを持っていると見なすことができます。[ 22 ]
ユニコード
ユニコードは、C0およびC1制御コードとの互換性のために、上記の65個のコードポイントを予約しており、これらに一般カテゴリCc(制御)を割り当てています。これらは次のとおりです
- U+0000~U+001F(C0制御)とU+007F(DEL)はC0制御と基本ラテンブロックに割り当てられ、
- U+0080~U+009F (C1 コントロール) は、C1 コントロールおよび Latin-1 補足ブロックに割り当てられます。
Unicodeは、C0フォーマット制御文字HT、LF、VT、FF、CR(BSは欠落していることに注意)、C0情報区切り文字FS、GS、RS、US(およびSP)、およびC1制御文字NELの意味のみを規定している。[ 58 ]残りのコードはUnicodeに対して透過的であり、その意味は上位レベルのプロトコルに委ねられており、デフォルトとしてISO/IEC 6429が提案されている。 [ 58 ]
Unicodeには、これら以外にも、明示的な双方向書式設定のためのマーク、埋め込み、分離、ポップ、そして合字の使用を制御するゼロ幅ジョイナーと非ジョイナーCfなど、多くの書式効果文字が含まれています。ただし、これらは「」ではなく一般カテゴリ(書式)に分類されますCc。
参照
- 制御文字- C0制御コードのUnicodeグラフィカル表現文字
- ANSIエスケープコード
脚注
- ^ ISO/IEC 4873ではこの要件がC1、SS2、およびSS3に拡張されていますが、 [ 42 ] ISO/IEC 2022自体は拡張されていません
参考文献
- ^標準ECMA-6 7ビット符号化文字セット(PDF)(技術報告書)。1965年、4ページ
- ^ Fox, Brian . 「Infoに新しいノードを追加する」 . Info: オンラインのメニュー駆動型GNUドキュメントシステム. GNUプロジェクト.
- ^ 「組み込み型 § str.splitlines」 . Python標準ライブラリ. Pythonソフトウェア財団.
- ^ a b ISO/TC 97/SC 2 (1975). ISO 646の制御文字セット(PDF) . ITSCJ/ IPSJ . ISO-IR -1.
- ^ a b c IPTC (1995)。IPTC 推奨メッセージ フォーマット(PDF) (第 5 版)。 IPTCテック7901。
- ^ a b c「送信終了文字(EOT)」。連邦規格1037C 。1996年。2016年3月9日時点のオリジナルよりアーカイブ。
- ^ a bロバート・マッコーネル、ジェームズ・ヘインズ、リチャード・ウォーレン(2002年12月)。「ASCIIコードを理解する」NADCOMM。
- ^ Williamson, Karl. 「Re: PRI #202: Unicode 6.1.0 向け NameAliases.txt の拡張」。
- ^ a b c Ken Whistler (2011年7月20日). 「制御文字の正式な別名、L2/11-281」 . Unicodeコンソーシアム.
- ^ a b c d「名前の別名」 . Unicode文字データベース. Unicodeコンソーシアム.
- ^ 「C0コントロールと基本ラテン文字」(PDF)。Unicodeコンソーシアム。
- ^ "charnames" . Perlプログラミングドキュメント.
- ^ a b c ECMA (1994). 「7.3: 文字セットコード要素の呼び出し」.文字コード構造および拡張テクニック(PDF) (ECMA標準) (第6版). p. 14. ECMA-35.
- ^アメリカ規格協会(1963).情報交換用アメリカ標準コード: 4. 凡例. p. 6. ASA X3.4-1963.
- ^ 「データリンクエスケープ文字(DLE)」連邦規格1037C 、1996年。 2016年8月1日時点のオリジナルよりアーカイブ。
- ^ 「補助伝送制御機能(データ通信システムの基本モード制御手順の拡張)」欧州コンピュータ製造業者協会。1972年。ECMA-37。
- ^ 「Ctrl-Sのポイントは何ですか?」 Unix and Linux Stack Exchange 。 2019年2月14日閲覧。
- ^ ECMA/TC 1 (1973). 「簡単な歴史」. 7ビット入出力符号化文字セット(PDF) (第4版). ECMA . ECMA-6:1973.
- ^ a b c ECMA/TC 1 (1971). 「8.2: 7ビットコードと8ビットコードの対応」. 7ビット符号化文字セットの拡張(PDF) (第1版). ECMA . pp. 21– 24. ECMA-35:1971.
- ^ ECMA/TC 1 (1973). 「4.2: 特定の制御文字」. 7ビット入出力符号化文字セット(PDF) (第4版). ECMA . p. 16. ECMA-6:1973.
- ^ ECMA/TC 1 (1985). 「5.3.8: 96個のグラフィック文字のセット」.コード拡張テクニック(PDF) (第4版). ECMA . pp. 17– 18. ECMA-35:1985.
- ^ a b c ISO/IEC エスケープシーケンスで使用されるコード化文字セットの国際登録簿(PDF)、ITSCJ/ IPSJ、ISO-IR、2023年5月12日のオリジナル(PDF)からアーカイブ、 2023年5月13日取得
- ^ a b DIN (1979-07-15).ドイツ規格DIN 31626に基づく書誌用追加制御コード(PDF) . ITSCJ/ IPSJ . ISO-IR -40.
- ^ a b c ISO/TC97/SC2 (1983-10-01). ISO 6429:1983のC1制御セット(PDF) . ITSCJ/ IPSJ . ISO-IR -77.
- ^ ECMA/TC 1 (1979). 「略歴」.文字イメージングI/Oデバイス用追加制御関数(PDF) (第2版). ECMA . ECMA-48:1979.
- ^ 「JIS X 02xx 記号」。
- ^ a b Ken Whistler (2015年10月5日). 「なぜ何も消え去らないのか」 . Unicodeメーリングリスト.
- ^ ECMA/TC 1 (1991年6月).符号化文字セットの制御関数(PDF) (第5版). ECMA . ECMA-48:1991.
- ^ a b ISO 6429:1983 情報処理 - ISO 7ビットおよび8ビット符号化文字セット - 文字画像化装置の追加制御機能。ISO。1983-05-01 。
- ^ ISO 6429:1988 情報処理 — 7ビットおよび8ビット符号化文字セットの制御機能。ISO 。 1988年11月15日。
- ^ a b ISO/IEC 6429:1992 情報技術 — 符号化文字セットの制御機能. ISO . 1992-12-15 . 2024-05-29閲覧。
- ^ルンデ、ケン (2008). CJKV情報処理:中国語、日本語、韓国語、ベトナム語コンピューティング. O'Reilly. p. 244. ISBN 9780596800925。
- ^ ECMA/TC 1(1986年12月)「付録E:本版での変更点」。符号化文字セットの制御関数(PDF)(第4版)。ECMA . ECMA -48:1986
- ^ ECMA/TC 1 (1991年6月). 「F.8 削除された制御関数」.符号化文字セットの制御関数(PDF) (第5版). ECMA . ECMA-48:1991.
- ^ "VT100 ウィジェットリソース (§ hpLowerleftBugCompat)" . xterm - X 用端末エミュレーター.
- ^ Moy, Edward; Gildea, Stephen; Dickey, Thomas. 「デバイス制御関数」 . XTerm制御シーケンス.
- ^ a b Brender, Ronald F. (1989). 「Ada 9x プロジェクトレポート: Ada 9x の文字セットの問題」カーネギーメロン大学.
- ^ Moy, Edward; Gildea, Stephen; Dickey, Thomas. 「オペレーティングシステムコマンド」 . XTerm制御シーケンス.
- ^ Frank da Cruz; Christine Gianone (1997). C-Kermit の使用. Digital Press. p. 278. ISBN 978-1-55558-164-0。
- ^ a b c ECMA (1994). 「6.4.2: 符号化制御機能の主なセット」.文字コード構造および拡張テクニック(PDF) (ECMA規格) (第6版). p. 11. ECMA-35
- ^ ISO/TC97/SC2/WG-7 ; ECMA (1985-08-01)。ISO 4873 に設定された最小 C0 (PDF)。 ITSCJ/情報処理学会。ISO-IR -104。
- ^ ISO/TC97/SC2/WG-7 ; ECMA (1985-08-01)。ISO 4873 の最小 C1 セット(PDF)。 ITSCJ/情報処理学会。ISO-IR -105。
- ^ ECMA (1994). 「6.2: 固定符号化文字」.文字コード構造および拡張技術(PDF) (ECMA規格) (第6版). p. 7. ECMA-35.
- ^ ECMA (1994). 「6.4.3: コード化制御機能の補足セット」.文字コード構造および拡張技術(PDF) (ECMA規格) (第6版). p. 11. ECMA-35.
- ^ ITU (1985). Teletex 基本制御機能セット(PDF) . ITSCJ/ IPSJ . ISO-IR -106.
- ^ Úřad pronormalizaci a měřeni (1987)。ISO 646 の制御文字のセット。EM は SS2 (PDF)に置き換えられます。 ITSCJ/情報処理学会。ISO-IR -140。
- ^ ISO/TC 97/SC 2 (1977). ISO 646の制御文字セット(IS4をG2のシングルシフト(SS2)に置き換えたもの)(PDF) . ITSCJ/ IPSJ . ISO-IR -36.
- ^ a b ISO/TC97/SC2/WG6 . 「ISO/TC97/SC2/WG8およびISO/TC97/SC18/WG8へのリエゾン声明」(PDF) . ISO/TC97/SC2/WG6 N317.rev. 2020年10月26日時点のオリジナル(PDF)からアーカイブ。
- ^ ISO/TC 97/SC 2 (1982).日本規格JIS C 6225-1979の制御文字C0セット(PDF) . ITSCJ/ IPSJ . ISO-IR -74.
- ^ Printronix (2012). OKI® プログラマーズリファレンスマニュアル(PDF) . p. 26.
- ^ ISO/TC 46 (1983-06-01).国際規格ISO 6630に基づく書誌用追加制御コード(PDF) . ITSCJ/ IPSJ . ISO-IR -67.
- ^ ISO/TC 46 (1986-02-01).国際規格ISO 6630に基づく書誌用追加制御コード(PDF) . ITSCJ/ IPSJ . ISO-IR -124.
- ^ Stratus Technologies Ireland, Ltd. 「NLS文字列の概要」。各国語サポートユーザーズガイド(R212)。
- ^ Stratus Technologies Ireland, Ltd. 「OpenVOS内部文字コードセット」。OpenVOSシステム管理:システムの管理とカスタマイズ(R281)。
- ^ Stratus Technologies Ireland, Ltd. 「補助グラフィック文字セット」。各国語サポートユーザーズガイド(R212)。
- ^ a b Umamaheswaran, VS (1999-11-08). 「3.3 ステップ2:バイト変換」 . UTF-EBCDIC . Unicodeコンソーシアム. Unicode技術レポート#16.
64個の制御文字[…]、ASCII DELETE文字(U+007F)[…]は、IBM文字データ表現アーキテクチャ(CDRA)で定義されているEBCDIC規則に従ってマッピングされます。ただし、EBCDICの改行制御文字と改行制御文字の組み合わせが、CDRAのデフォルトの組み合わせからISO/IEC 6429の改行制御文字(U+000A)と次行制御文字(U+0085)に置き換えられます。
- ^ Steele, Shawn (1996-04-24). cp037_IBMUSCanadaからUnicodeへの変換表. Microsoft / Unicode Consortium .
- ^ a b「23.1: 制御コード」(PDF) . Unicode標準(15.0.0版). Unicodeコンソーシアム. 2022. pp. 914– 916. ISBN 978-1-936213-32-0。