アスキー

アスキー
MIL-STD-188-100 (1972)の ASCII チャート
MIME / IANA	US-ASCII
エイリアス	ISO-IR-006, ^{[ 1 ]} ANSI_X3.4-1968, ANSI_X3.4-1986, ISO_646.irv:1991, ISO646-US, us, IBM367, cp367 ^{[ 2 ]}
言語	主に英語。マレー語、ロトカス、インターリングア、Ido、およびX-SAMPAもサポートします
分類	ISO/IEC 646シリーズ
拡張機能	ユニコード ISO/IEC 8859（シリーズ） KOI-8 OEM（シリーズ） Windows-125x（シリーズ）その他
先行	ITA 2、フィールドタ
後継者	ISO/IEC 8859、ISO/IEC 10646（Unicode）

ASCII ( / ˈ æ s k i /^ⓘ ASS -kee）、^{[ 3 ]}^{： 6}American Standard Code for Information Interchangeの略称で、95 個の（英語中心の）印字可能文字と 33 個制御文字、合計 128 個のコードポイント文字エンコード Unicodeの最初の 128 個のコードポイントは ASCII と同じです。

ASCIIは各コードポイントを0から127までの値として符号化し、7ビットの整数として格納できる。^{[ 4 ]} 95個のコードポイントは印字可能で、数字0から9、小文字aからz、大文字AからZ、そして一般的に使用される句読点記号を含む。例えば、文字は105（ 10進数i）で表わされる。また、ASCIIはテレタイプ機器に由来する33個の印字されない制御コードも規定しており、そのほとんどは今では廃止されている。^[⁵^]現在でも一般的に使用されている制御文字には、キャリッジリターン、ラインフィード、タブなどがある。

ASCIIには分音記号付きの文字のコードポイントがないため、 résumé、jalapeño、Renéといった用語や名前を直接サポートしていません。ただし、ハードウェアとソフトウェアのサポート状況によっては、文字をバックティック（`）またはチルダ（~）で上書きすることで、一部の分音記号をレンダリングできます。

インターネット番号割当機関（IANA）は、この文字エンコーディングをUS-ASCIIという名前で呼んでいます。^{[ 2 ]}

ASCIIはIEEEのマイルストーンの一つである。^{[ 6 ]}

歴史

ASCII は、以前の電信コードから部分的に開発された7ビットのテレプリンターコードの標準化です。

ASCII規格の作業は、1961年5月にIBMの技術者ボブ・ベマーが米国規格協会（ASA）（現在の米国規格協会、ANSI）のX3.2小委員会に提案を提出したことから始まりました。^{[ 7 ]}規格の初版は1963年に発行され、^{[ 8 ]}テレタイプモデル33の導入と同時期に発行されました。その後、1967年に大幅な改訂が行われ、^{[ 9 ]}^{[ 10 ]}、1986年までさらに数回の改訂が行われました。 ^{[ 11 ]}ボードットなどの初期の電信コードとは対照的に、ASCIIは照合（特にリストのアルファベット順ソート）の利便性を考慮して順序付けられ、テレプリンター以外のデバイス用の制御機能も追加されました。^{[ 11 ]}

ASCII (1963)。同等のコントロールが存在する場合は、そのコントロールの図が表示され、存在しない場合は灰色のドットで表示されます。

ASCIIは、アメリカ規格協会（ASA）のX3委員会（X3委員会）の支援の下、そのX3.2（後にX3L2）小委員会、そしてさらにその小委員会のX3.2.4ワーキンググループ（現在のINCITS）によって開発されました。ASAは後にアメリカ合衆国規格協会（USASI）^{[ 3 ]}^:211となり、最終的にはアメリカ国家規格協会（ANSI）となりました。

他の特殊文字と制御コードが埋め込まれて、ASCIIはASA X3.4-1963として公開されましたが、^{[ 8 ]}^{[ 12 ]} 28のコード位置は意味が割り当てられておらず、将来の標準化のために予約されており、1つの未割り当ての制御コードが残されました。^{[ 3 ]}^：66、245当時、小文字のアルファベットよりも制御文字を増やすべきかどうかについて議論がありました。^{[ 3 ]}^：435この優柔不断な態度は長くは続きませんでした。1963年5月、CCITTの新電信アルファベット作業部会は、小文字をスティック^{[ a ]}^{[ 13 ]} 6と7に割り当てることを提案し、^{[ 14 ]}国際標準化機構TC 97 SC 2は、10月にその変更を標準案に組み込むことを投票で決定しました。^{[ 15 ]} X3.2.4タスクグループは、1963年5月の会議でASCIIへの変更を承認しました。^{[ 16 ]}小文字を棒^{[ a ]}^{[ 13 ]} 6 と 7 に配置すると、文字のビットパターンが大文字と 1 ビット異なり、大文字と小文字を区別しない文字のマッチングと、キーボードやプリンターの構造が簡素化されました。

X3委員会は他にも変更を加えました。括弧と縦棒の文字が追加されました。^{[ 17 ]}一部の制御文字の名前が変更され、SOMはSOHになりました。他の文字は移動または削除され、RUは削除されました。^{[ 3 ]}^{: 247–248} ASCIIはその後、USAS X3.4-1967、^{[ 9 ]}^{[ 18 ]}、USAS X3.4-1968、^{[ 19 ]} ANSI X3.4-1977、そして最終的にANSI X3.4-1986へと更新されました。^{[ 11 ]}^{[ 20 ]}

ネットワーク交換のためのASCII形式の使用は1969年に説明されました。^{[ 21 ]}この文書は2015年に正式にインターネット標準に昇格されました。^{[ 22 ]}

改訂

ASA X3.4-1963 ^{[ 3 ]}^{[ 8 ]}^{[ 18 ]}^{[ 20 ]}
ASA X3.4-1965（承認されたが公表されなかったが、IBM 2260および2265ディスプレイステーションとIBM 2848ディスプレイコントロールで使用された）^{[ 3 ]}^{：423、425–428、435–439}^{[ 23 ]}^{[ 18 ]}^{[ 20 ]}
USAS X3.4-1967 ^{[ 3 ]}^{[ 9 ]}^{[ 20 ]}
USAS X3.4-1968 ^{[ 3 ]}^{[ 19 ]}^{[ 20 ]}
ANSI X3.4-1977 ^{[ 20 ]}
ANSI X3.4-1986 ^{[ 11 ]}^{[ 20 ]}
ANSI X3.4-1986 (R1992)
ANSI X3.4-1986 (R1997)
ANSI INCITS 4-1986 (R2002) ^{[ 24 ]}
ANSI INCITS 4-1986 (R2007) ^{[ 25 ]}
INCITS 4-1986 (R2012) ^{[ 26 ]}
INCITS 4-1986 (R2017) ^{[ 27 ]}
INCITS 4-1986 (R2022) ^{[ 28 ]}

X3.15規格において、X3委員会はASCIIデータの伝送方法（最下位ビットを先頭とする）^{[ 3 ]}^{: 249–253}^{[ 29 ]}と、パンチ穴付きテープへの記録方法についても検討した。彼らは磁気テープ用の9トラック規格を提案し、パンチカードのいくつかのフォーマットへの対応を試みた。

設計上の考慮事項

ビット幅

X3.2 小委員会は、初期のテレプリンター符号化システムに基づいて ASCII を設計した。他の文字符号化と同様に、ASCII はデジタルビットパターンと文字シンボル (つまり、書記素と制御文字) との対応を指定する。これにより、デジタルデバイスは互いに通信し、書き言葉などの文字指向の情報を処理、格納、通信することができる。 ASCII が開発される前は、26 のアルファベット文字、10 の数字、11 ～ 25 の特殊グラフィックシンボルが符号化に使用されていた。これらすべて、および1932 年の国際電信電話諮問委員会(CCITT)の国際電信アルファベット No. 2 (ITA2) 規格、^{[ 30 ]}^{[ 31 ]} FIELDATA (1956)、および初期のEBCDIC (1963) と互換性のある制御文字を含めるには、ASCII には 64 を超えるコードが必要であった。

ITA2は、エミール・ボードが1870年に発明し、1874年に特許を取得した5ビットの電信コードであるボードコードに基づいていました。^{[ 31 ]}

委員会は、 ITA2のようなシフト機能の可能性について議論しました。これにより、64以上のコードを6ビットコードで表現できるようになります。シフトコードでは、一部の文字コードが後続の文字コードの選択肢を決定します。これによりコンパクトな符号化が可能になりますが、シフトコードの送信エラーにより、通常、送信データの長い部分が判読不能になるため、データ伝送の信頼性は低くなります。標準化委員会はシフトを採用しないことを決定し、ASCIIでは少なくとも7ビットコードが必要となりました。^[³^]^{：215 §13.6、236 §4}

委員会は8ビット符号を検討した。8ビット（オクテット）であれば、2つの4ビットパターンで2つの数字を2進化10進数で効率的に符号化できるためである。しかし、7ビットで十分な場合、すべてのデータ伝送で8ビットの送信が必要になる。委員会は、データ伝送に関連するコストを最小限に抑えるため、7ビット符号の使用を決定した。当時のミシン目付きテープは1つの位置に8ビットを記録できたため、必要に応じてエラーチェック用のパリティビットを追加することも可能であった。^[³^]^{：217 §c、236 §5}パリティチェックを使用しない8ビットマシン（ネイティブデータ型がオクテット）では、通常、8番目のビットを0に設定する。 ^[³²^]

内部組織

コード自体は、識別しやすいように、ほとんどの制御コードが一緒に、またすべてのグラフィックコードが一緒になるようにパターン化されました。最初の 2 つのいわゆるASCII スティック^{[ a ]}^{[ 13 ]} (32 の位置) は、制御文字用に予約されていました。^{[ 3 ]}^{: 220, 236 8, 9)}ソートを容易にするために「スペース」文字はグラフィックの前に置く必要があったため、16_進数で 20 の位置になりました。^[³^]^{: 237 §10}同じ理由で、区切り文字としてよく使用される多くの特殊記号は数字の前に置かれました。委員会は、大文字の 64 文字アルファベットをサポートすることが重要であると判断し、DEC SIXBITコード (1963)で行われたように、ASCII を使いやすい 64 文字のグラフィックコードセットに簡単に縮小できるようにパターン化することを選択しました^[³^]^{: 228, 237 §14}小文字やその他のグラフィックスのオプションを利用できるように、特殊コードと数字コードは文字の前に配置され、文字A は対応する英国規格の草案と一致するように16_進数の41 番目の位置に配置されました。 ^[³^]^{: 238 §18}数字 0 〜 9 には 011 がプレフィックスとして付きますが、残りの4 ビットは2 進数のそれぞれの値に対応しているため、2 進化 10 進数による変換は簡単です (たとえば、5 は 011 0101にエンコードされ、2 進数では 5 は0101になります)。

英数字以外の文字の多くは、タイプライターのシフト位置に対応するように配置されていました。重要な微妙な点は、これらが電気タイプライターではなく、機械式タイプライターに基づいていたことです。^[³³^]機械式タイプライターは、シフトキーを備えた最初のタイプライターであるレミントン No. 2 (1878)によって設定された事実上の標準に準拠し、のシフトされた値はでした。初期のタイプライターは0と1 を省略し、代わりにO (大文字のo ) とl (小文字のL ) を使用していましたが、 0 と 1 が一般的になるにつれて、とのペアが標準になりました。したがって、ASCII ではは 2 番目のスティックの^[^a^]^[¹³^]位置 1 ～ 5 に配置され、隣接するスティックの数字 1 ～ 5 に対応します。^[^a^]^[¹³^]ただし、 0に対応する場所がスペース文字で占められているため、括弧は9と0に対応できませんでした。これは、 6から（アンダースコア）を削除し、残りの文字をシフトすることで対応されました。これは、 8と9に括弧を配置する多くのヨーロッパのタイプライターに対応していました。タイプライターとのこの矛盾は、ビットペアキーボード、特にテレタイプモデル33につながり、従来の機械式タイプライターとは異なり、ASCIIに対応する左シフトレイアウトを採用しました。 23456789-"#$%_&'()1!0)!"#$%_

電気タイプライター、特にIBM Selectric (1961) は多少異なるレイアウトを使用していましたが、これはIBM PC (1981)、特にModel M (1984)以降、コンピューターの事実上の標準となっています。そのため、現代のキーボードの記号のシフト値は、それ以前のキーボードほど ASCII テーブルと密接には対応していません。このペアも No. 2 に遡り、一部のキーボードで使用されていました (No. 2 を含むその他のキーボードでは、 (カンマ) または(ピリオド)はシフトしないため、シフト解除せずに大文字で使用できます)。ただし、ASCII ではこのペア (No. 2 に遡る) を分割し、数学記号 (さまざまな規則、一般的に) をに再配置しました。 /?,< .>,.;:-* =+:* ;+ -=

当時一般的だったタイプライター文字の中には、特にが含まれていなかったものもあった½ ¼ ¢が、は^ ` ~ 国際用および数学用として、単純な線文字（一般的なに加えて）< >と共に、分音記号として含まれていた。 @記号はヨーロッパ大陸では使用されておらず、委員会はフランス語版ではアクセント付きのÀに置き換えられると予想したため、 @は文字Aの直前の16_進数で40番目の位置に配置された。 ^[³^]^{: 243}\ |/

データ伝送に不可欠と考えられていた制御コードは、メッセージ開始（SOM）、アドレス終了（EOA）、メッセージ終了（EOM）、伝送終了（EOT）、"who are you?"（WRU）、"are you?"（RU）、予約デバイス制御（DC0）、同期アイドル（SYNC）、および確認応答（ACK）でした。これらのコードは、ビットパターン間のハミング距離が最大になるように配置されました。^{[ 3 ]}^：243–245

文字順

ASCIIコード順はASCIIベティカル順とも呼ばれる。^{[ 34 ]}データの照合は、「標準的な」アルファベット順（照合順序）ではなく、この順序で行われることがある。ASCII順における主な逸脱は以下の通りである。

大文字はすべて小文字の前に来ます。たとえば、「Z」は「a」の前に来ます。
数字と多くの句読点は文字の前に来る

中間命令は、ASCII 値を比較する前に大文字を小文字に変換します。

文字セット

アスキー（1977/1986）
	0	1	2	3	4	5	6	7	8	9	あ	B	C	D	E	F
0x	ヌル	SOH	STX	ETX	終了時刻	ENQ	確認	ベル	BS	HT	LF	VT	FF	CR	それで	SI
1倍	DLE	DC1	DC2	DC3	DC4	ナク	シン	ETB	できる	EM	サブ	ESC	FS	GS	RS	私たち
2倍	SP	!	「	#	$	%	＆	'	（	）	*	+	、	-	。	/
3倍	0	1	2	3	4	5	6	7	8	9	:	;	<	＝	>	?
4倍	@	あ	B	C	D	E	F	G	H	私	J	K	L	M	北	お
5倍	P	質問	R	S	T	あなた	V	W	X	はい	Z	[	\	]	^	_
6倍	`	1つの	b	c	d	e	f	グラム	h	私	j	け	l	メートル	n	o
7倍	p	q	r	s	t	あなた	v	わ	×	y	z	{	\|	}	〜	削除
1963年版で変更または追加されたもの 1963年版と1965年草案の両方で変更された

文字グループ

制御文字

ASCIIは、最初の32個のコードポイント（10進数で0～31）と最後の1個（10進数で127）を制御文字用に予約しています。これらは、周辺機器（プリンターなど）を制御したり、磁気テープなどに保存されているデータストリームに関するメタ情報を提供したりするためのコードです。その名前にもかかわらず、これらのコードポイントは印刷可能な文字を表すものではありません（つまり、文字ではなく信号です）。デバッグのために、これらのコードポイントには「プレースホルダー」シンボル（ISO 2047やその前身で使用されているものなど）が割り当てられています。

例えば、文字0x0Aは「改行」機能（プリンタの用紙送り）を表し、文字8は「バックスペース」を表します。RFC 2822 では、復帰、改行、空白を含まない制御文字を非空白制御文字と呼んでいます。^[³⁵^]基本的な行指向の書式設定を規定する制御文字を除いて、ASCIIは文書内のテキストの構造や外観を記述するためのメカニズムを定義していません。マークアップ言語、アドレスページ、文書のレイアウトと書式設定などの他のスキーム。

オリジナルのASCII規格では、各制御文字に短い説明フレーズのみが使用されていました。この曖昧さは、端末リンクとデータストリームで文字の使い方が若干異なるなど、意図的なものもあれば、例えば「削除」の意味が規格で明確にされていないなど、偶発的なものもありました。

これらの文字の解釈に最も影響を与えた単一のデバイスは、おそらくテレタイプモデル 33 ASR でしょう。これは、紙テープリーダー/パンチオプションを備えた印刷端末でした。紙テープは 1980 年代まで、磁気テープよりも安価で、いくつかの点で壊れにくいことから、長期プログラム保存用の非常に一般的な媒体でした。特に、テレタイプモデル 33 のコード 17 (control-Q、DC1、XON とも呼ばれる)、19 (control-S、DC3、XOFF とも呼ばれる)、および 127 (削除)のマシン割り当ては、事実上の標準になりました。モデル 33 は、control-G (コード 7、BEL、操作者に音声で警告することを意味する) の説明を文字通りに受け止めていることでも有名で、ユニットには BEL 文字を受信すると鳴る実際のベルが含まれていました。 O キーのキートップにも左矢印記号 (アンダースコアの代わりにこの文字を持つ ASCII-1963 から) が表示されていたため、コード 15 (コントロール + O、シフトイン) の非準拠な使用法が「前の文字を削除」と解釈され、多くの初期のタイムシェアリングシステムで採用されましたが、最終的には無視されるようになりました。

自動紙テープ読み取り装置を備えたテレタイプ33 ASRは、制御S（XOFF、送信オフの略）を受信するとテープ読み取りを停止し、制御Q（XON、送信オン）を受信するとテープ読み取りを再開しました。このいわゆるフロー制御技術は、バッファオーバーフローの兆候が見られるため送信側に送信を停止するよう警告する「ハンドシェイク」信号として、初期のコンピュータオペレーティングシステムのいくつかに採用されました。これは今日でも多くのシステムで手動出力制御技術として使用されています。一部のシステムでは、制御Sはそのままの意味を保持していますが、制御Qは出力を再開するための2番目の制御Sに置き換えられています。

33 ASRは、コントロールR（DC2）とコントロールT（DC4）を使用してテープパンチの開始と停止を行うように設定することもできます。この機能を備えた一部のユニットでは、キーキャップ上の対応する制御文字の文字はそれぞれTAPEと~~TAPE~~でした。^{[ 36 ]}

削除とバックスペース

テレタイプはタイプヘッドを後方に移動できなかったため、キーボードにはBS（バックスペース）を送信するキーがありませんでした。代わりに、RUB OUTコード127（DEL）を送信するキーがありました。このキーの目的は、手入力された紙テープの誤りを消去することでした。オペレーターはテープパンチのボタンを押してテープを戻し、次に消去する文字を入力することで、すべての穴がパンチされ、誤りは無視される文字に置き換えられました。^{[ 37 ]}テレタイプは、 Digital Equipment Corporation （DEC）の安価なコンピュータでよく使用されていました。これらのシステムは利用可能なキーを使用する必要があったため、DEL文字は前の文字を消去するキーに割り当てられていました。^{[ 38 ]}^{[ 39 ]}このため、DECのビデオ端末は（デフォルトで）「バックスペース」と表示されたキーに対してDEL文字を送信し、「Delete」と表示された別のキーに対してはエスケープシーケンスを送信していました。他の多くの競合端末は、バックスペースキーに対してBS文字を送信していました。

初期のUnix ttyドライバは、最近の実装とは異なり、標準的な入力処理（非常にシンプルな行エディタが利用可能な場合）において、前の文字を消去する文字として設定できるのは1つだけでした。これはBSまたはDELに設定できましたが、両方を設定することはできませんでした。その結果、ユーザーが使用している端末に応じて選択しなければならないという曖昧な状況が繰り返し発生しました（ksh、bash、zshなどの行編集が可能なシェルはどちらも理解します）。どのキーもBS文字を送信しないという前提により、Ctrl+Hは GNU Emacsの「help」プレフィックスコマンドなど、他の目的に使用できました。^[⁴⁰^]

逃げる

制御文字の多くは、本来の意味とは全く異なる意味が割り当てられています。例えば、「エスケープ」文字（ESC、コード27）は、元々は他の制御文字を、その意味である「エスケープシーケンス」を呼び出すのではなく、リテラルとして送信できるようにするために設計されていました。これは、URLエンコーディング、C言語文字列、その他特定の文字が予約語として意味を持つシステムで使用されている「エスケープ」と同じ意味です。時を経てこの解釈は流用され、最終的には変更されました。

現代の用法では、端末に送信されるESCは通常、コマンドシーケンスの開始を示します。コマンドシーケンスは、カーソルのアドレス指定、領域のスクロール、端末の様々なプロパティの設定/照会などに使用できます。これらは通常、ECMA-48 （1972）およびその後継規格におけるいわゆる「 ANSIエスケープコード」（多くの場合、「制御シーケンスイントロデューサ」、「CSI」、「ESC [」で始まる）の形式をとります。「初期状態にリセット」、「RIS」コマンド「 ESC c 」のように、イントロデューサを持たないエスケープシーケンスもあります。^[⁴¹^]

対照的に、端末から読み取られるESCは、TECOやvi テキストエディタのように、操作や特殊モードを終了するための帯域外文字として最もよく使用されます。グラフィカルユーザーインターフェース（GUI）やウィンドウシステムでは、ESCは通常、アプリケーションに現在の操作を中止させるか、完全に終了（終了）させます。

行末

一部の制御文字を新たな意味に再適用したことで、「プレーンテキスト」ファイルをシステム間で転送する際に問題が発生しました。その最たる例は、様々なオペレーティングシステムにおける改行問題です。テレタイプ機では、テキスト行の終了は「キャリッジリターン」（プリントヘッドを行頭に移動）と「ラインフィード」（用紙を1行進める）で終了する必要がありました。「キャリッジリターン」という名称は、手動タイプライターにおいて、用紙を保持するキャリッジが移動する一方で、リボンを叩くタイプバーは静止していることに由来しています。用紙を次の行に移動させるには、キャリッジ全体を右に押し込む（「戻す」）必要があります。

DECオペレーティングシステム（OS/8、RT-11、RSX-11、RSTS、TOPS-10など）は、テレタイプマシンの必要に応じて、テキストファイルの各行末に両方の文字を保存していました。いわゆる「グラスTTY」（後にCRTまたは「ダム端末」と呼ばれるようになった）が導入されたときも、同じロジックに従い、同じCR文字とLF文字を期待していました。ゲイリー・キルドールが CP/Mを開発したとき、彼はDECのRT-11オペレーティングシステムで使用されていたコマンドラインインターフェースの慣習に触発されました。

1981年にIBM PC DOSが登場するまで、IBMはこの分野に影響力を持っていませんでした。1970年代のIBMのオペレーティングシステムはASCIIではなくEBCDICエンコーディングを採用し、パンチカード入力とラインプリンタ出力を主眼に置いていたため、「キャリッジリターン」の概念は意味をなさなかったからです。IBMのPC DOS（マイクロソフトはMS-DOSとしても販売していました）は、CP/Mを大まかにベースとしていたためCRLF規則を継承しており、^{[ 42 ]} WindowsもMS-DOSからCRLF規則を継承しました。

プレーンテキスト文書またはデータストリームの各行末にCRとLFを配置することは、端末やプリンタがその情報を表示するために受信する必要のある文字を反映しています。Multicsは革新的な技術を導入しました。保存されたファイルやデータストリームの行末を1文字（LF）のみで表すというものです。^{[ 43 ]}^{: 357}出力時にttyドライバがLFをCRLFに変換するため、ファイル形式を明示的に変換するコマンドを必要とせずに、ファイルを端末に出力できます。UnixおよびUnix 系システムは、 Amigaシステムと同様に、この設計をMulticsから採用しました。UNIXの文書では、行末記号を「改行」または「NL」と表現しています。一方、Radio Shack TRS-80、Apple DOS、Apple ProDOS、および従来のMac OSでは、行末に単一のキャリッジリターン（CR）を使用していました。Appleの後継オペレーティングシステムであるMac OS X（現在はmacOSと呼ばれています）はUnixベースであるため、改行（LF）を使用しています。

ARPANETに接続されたコンピュータには、CR-LF改行コードを使用するTOPS-10やTENEXなどのオペレーティングシステム、LF改行コードを使用するMulticsなどのオペレーティングシステム、そして文字数とそれに続く行の文字数で行を表現し、ASCIIではなくEBCDICエンコードを使用するOS/360などのオペレーティングシステムが含まれていた。これらのシステム間の通信を可能にするため、 Telnetプロトコルは「ネットワーク仮想端末」（NVT）を定義した。NVTでは、単一のテキスト形式（CR-LF改行コードを持つASCII）が伝送に使用され、各システムはそれぞれのネイティブ表現との間で相互に変換を行った。^{[ 44 ]}

ファイル転送プロトコルは、コマンドの送信とテキストファイルの転送（「ASCIIモード」として知られる）のために、ネットワーク仮想端末を含むTelnetプロトコルを採用しました。^{[ 45 ]}^{[ 46 ]} インターネット電子メールはNVT上に構築されています。^{[ 47 ]} ワールドワイドウェブのHTTPは修正されたNVTを使用しています。この標準では、CRとLF文字のみが許可されていますが、それぞれがNVT CRLFとして解釈される必要があります。^{[ 48 ]}

一部のバージョン管理システムなど、NVTメカニズムに従わないネットワーク対応システムでは複雑さが生じました。^{[ 49 ]}バグによってシステムのネイティブ実装がインターネット上の他のシステムに公開され、データ破損を引き起こすことがあります。^{[ 50 ]}

ファイル/ストリームの終わり

PDP-6 モニター^{[ 38 ]}とその後継機である PDP-10 TOPS-10 ^{[ 39 ]}は、端末からの入力に対するファイル終了表示として、control-Z (SUB) を使用していました。CP/M などの一部のオペレーティングシステムでは、ファイルの長さをディスクブロック単位でのみ追跡し、ファイル内の実際のテキストの終了を示すために control-Z を使用していました。^{[ 51 ]}これらの理由から、EOF、つまりファイルの終わりは、SUBstitute ではなく、control-Z の 3 文字の頭字語として口語的に慣例的に使用されていました。テキスト終了文字 ( ETX )、別名control-C はさまざまな理由で不適切でしたが、ファイルの終了を示す制御文字として control-Z を使用することは、アルファベットの末尾の文字 Z の位置に類似しており、非常に便利なニーモニック補助として機能します。歴史的に一般的で現在でも広く普及している慣例に、ETX 文字規則を使用して、通常はキーボードからの入力データストリームを介してプログラムを中断および停止するというものがあります。

Unix ターミナルドライバは、データストリームの終了を示すために、制御 D とも呼ばれる転送終了文字 ( EOT ) を使用します。

C プログラミング言語および Unix 規則では、ヌル文字はテキスト文字列を終了するために使用されます。このようなヌル終了文字列は、ASCIZ または ASCIIZ という略語で表されます。ここで、Z は「ゼロ」を表します。

コード表

制御コード表

バイナリ	10月	12月	ヘックス	略語			Unicode制御画像^{[ b ]}	キャレット表記^{[ c ]}	Cエスケープシーケンス^{[ d ]}	名前（1967年）
バイナリ	10月	12月	ヘックス	1963	1965	1967	Unicode制御画像^{[ b ]}	キャレット表記^{[ c ]}	Cエスケープシーケンス^{[ d ]}	名前（1967年）
000 0000	000	0	00	ヌル	ヌル		␀	^@	\0 ^{[ e ]}	ヌル
000 0001	001	1	01	ソム	SOH		␁	^A		見出しの開始
000 0010	002	2	02	EOA	STX		␂	^B		テキストの開始
000 0011	003	3	03	終了	ETX		␃	^C		テキストの終わり
000 0100	004	4	04	終了時刻			␄	^D		送信終了
000 0101	005	5	05	WRU	ENQ		␅	^E		問い合わせ
000 0110	006	6	06	ロシア	確認		␆	^F		了承
000 0111	007	7	07	ベル	ベル		␇	^G	\a	ベル（警報）
000 1000	010	8	08	FE0	BS		␈	^H	\b	バックスペース^{[ f ]}^{[ g ]}
000 1001	011	9	09	HT/SK	HT		␉	^私	\t	水平タブ^{[ h ]}
000 1010	012	10	0A	LF			␊	^J	\n	改行
000 1011	013	11	0B	VTAB	VT		␋	^K	\v	垂直タブ
000 1100	014	12	0℃	FF			␌	^L	\f	フォームフィード
000 1101	015	13	0D	CR			␍	^M	\r	キャリッジリターン^{[ i ]}
000 1110	016	14	0E	それで			␎	^N		シフトアウト
000 1111	017	15	0F	SI			␏	^O		シフトイン
001 0000	020	16	10	DC0	DLE		␐	^P		データリンクエスケープ
001 0001	021	17	11	DC1			␑	^Q		デバイス制御 1 (多くの場合XON )
001 0010	022	18	12	DC2			␒	^R		デバイスコントロール2
001 0011	023	19	13	DC3			␓	^S		デバイスコントロール3（多くの場合XOFF）
001 0100	024	20	14	DC4			␔	^T		デバイスコントロール4
001 0101	025	21	15	エラー	ナク		␕	^U		否定的な承認
001 0110	026	22	16	同期	シン		␖	^V		同期アイドル
001 0111	027	23	17	レム	ETB		␗	^西		送信ブロックの終了
001 1000	030	24	18	S0	できる		␘	^X		キャンセル
001 1001	031	25	19	S1	EM		␙	^はい		媒体の終わり
001 1010	032	26	1A	シーズン2	SS	サブ	␚	^Z		代わりの
001 1011	033	27	1B	S3	ESC		␛	^[	\e ^{[ j ]}	脱出^{[ k ]}
001 1100	034	28	1C	S4	FS		␜	^\		ファイルセパレーター
001 1101	035	29	1D	シーズン5	GS		␝	^]		グループセパレーター
001 1110	036	30	1E	シーズン6	RS		␞	^^ ^{[ l ]}		レコードセパレータ
001 1111	037	31	1階	S7	私たち		␟	^_		単位区切り
111 1111	177	127	7階	削除			␡	^?		削除^{[ m ]}^{[ g ]}

専門的な機器では、ISO 2047グラフィックスや16 進数などの他の表現が使用される場合があります。

印刷可能な文字表

採用当時、20 _16進数から7E _16進数のコードは可視文字（グリフ）の印刷を指示するため、「印刷可能文字」と呼ばれていました。これらのコードは、文字、数字、句読点、そしてその他の記号を表します。印刷可能文字は合計95文字あります。^{[ n ]}

キーボードのスペースキーによって生成される単語間の空白は、文字コード20 _{（16進数）}です。スペース文字は印刷されたテキストに表示されるため、目に見えるグリフを持たないという点で独特ですが、「印刷可能文字」と見なされます。ASCII標準に従って、制御文字テーブルではなく、印刷可能文字テーブルに登録されています。^{[ 3 ]}^{: 223}^{[ 21 ]}

コード 7F _{16 進数は}、印刷できない「削除」(DEL) 制御文字に対応し、制御文字テーブルにリストされています。

ASCIIの初期のバージョンでは、キャレットの代わりに上矢印（16_進数5E ）、アンダースコアの代わりに左矢印（16_進数5F ）が使用されていました。^{[ 8 ]}^{[ 52 ]}

バイナリ	10月	12月	ヘックス	グリフ
バイナリ	10月	12月	ヘックス	1963	1965	1967
010 0000	040	32	20	スペース（グリフは表示されない）
010 0001	041	33	21	!
010 0010	042	34	22	「
010 0011	043	35	23	#
010 0100	044	36	24	$
010 0101	045	37	25	%
010 0110	046	38	26	＆
010 0111	047	39	27	'
010 1000	050	40	28	（
010 1001	051	41	29	）
010 1010	052	42	2A	*
010 1011	053	43	2B	+
010 1100	054	44	2C	、
010 1101	055	45	2D	-
010 1110	056	46	2E	。
010 1111	057	47	2階	/
011 0000	060	48	30	0
011 0001	061	49	31	1
011 0010	062	50	32	2
011 0011	063	51	33	3
011 0100	064	52	34	4
011 0101	065	53	35	5
011 0110	066	54	36	6
011 0111	067	55	37	7
011 1000	070	56	38	8
011 1001	071	57	39	9
011 1010	072	58	3A	:
011 1011	073	59	3B	;
011 1100	074	60	3C	<
011 1101	075	61	3D	＝
011 1110	076	62	3E	>
011 1111	077	63	3階	?
10万	100	64	40	@	`	@
100 0001	101	65	41	あ
100 0010	102	66	42	B
100 0011	103	67	43	C
100 0100	104	68	44	D
100 0101	105	69	45	E
100 0110	106	70	46	F
100 0111	107	71	47	G
100 1000	110	72	48	H
100 1001	111	73	49	私
100 1010	112	74	4A	J
100 1011	113	75	4B	K
100 1100	114	76	4C	L
100 1101	115	77	4D	M
100 1110	116	78	4E	北
100 1111	117	79	4階	お
101 0000	120	80	50	P
101 0001	121	81	51	質問
101 0010	122	82	52	R
101 0011	123	83	53	S
101 0100	124	84	54	T
101 0101	125	85	55	あなた
101 0110	126	86	56	V
101 0111	127	87	57	W
101 1000	130	88	58	X
101 1001	131	89	59	はい
101 1010	132	90	5A	Z
101 1011	133	91	5B	[
101 1100	134	92	5C	\	〜	\
101 1101	135	93	5D	]
101 1110	136	94	5E	↑	^
101 1111	137	95	5階	←	_
110 0000	140	96	60		@	`
110 0001	141	97	61		1つの
110 0010	142	98	62		b
110 0011	143	99	63		c
110 0100	144	100	64		d
110 0101	145	101	65		e
110 0110	146	102	66		f
110 0111	147	103	67		グラム
110 1000	150	104	68		h
110 1001	151	105	69		私
110 1010	152	106	6A		j
110 1011	153	107	6B		け
110 1100	154	108	6C		l
110 1101	155	109	6D		メートル
110 1110	156	110	6E		n
110 1111	157	111	6階		o
111 0000	160	112	70		p
111 0001	161	113	71		q
111 0010	162	114	72		r
111 0011	163	115	73		s
111 0100	164	116	74		t
111 0101	165	117	75		あなた
111 0110	166	118	76		v
111 0111	167	119	77		わ
111 1000	170	120	78		×
111 1001	171	121	79		y
111 1010	172	122	7A		z
111 1011	173	123	7B		{
111 1100	174	124	7C	確認	¬	\|
111 1101	175	125	7D		}
111 1110	176	126	7E	ESC	\|	〜

使用法

ASCIIは1963年、アメリカ電信電話会社TWX（TeletypeWriter eXchange）ネットワーク用の7ビットのテレタイプライターコードとして初めて商用利用されました。TWXは当初、競合会社のテレックス・テレタイプライターシステムでも使用されていた5ビットのITA2を採用していました。ボブ・ベマーはエスケープシーケンスなどの機能を導入しました。^[⁷^]彼のイギリス人の同僚であるヒュー・マクレガー・ロスはこの研究の普及に貢献しました。ベマーによれば、「ASCIIとなるコードはヨーロッパで初めてベマー・ロスコードと呼ばれたほどでした」^[⁵³^] 。ASCIIに関する広範な研究から、ベマーは「ASCIIの父」と呼ばれています。^[⁵⁴^]

1968年3月11日、リンドン・B・ジョンソン大統領は、米国連邦政府が購入するすべてのコンピュータがASCIIをサポートすることを義務付け、次のように述べた。^{[ 55 ]}^{[ 56 ]}^{[ 57 ]}

私はまた、商務長官[ルーサー・H・ホッジス]による、磁気テープおよび紙テープをコンピュータ操作に使用する際に、情報交換用標準コードを記録するための規格に関する勧告を承認しました。1969年7月1日以降に連邦政府の在庫に持ち込まれるすべてのコンピュータおよび関連機器は、これらの媒体を使用する際に、情報交換用標準コードおよび磁気テープおよび紙テープ規格で規定されたフォーマットを使用できる必要があります。

ASCIIは2007年12月までワールドワイドウェブ上で最も一般的な文字エンコーディングであったが、UTF-8エンコーディングがそれを上回った。UTF-8はASCIIと下位互換性がある。 ^{[ 58 ]}^{[ 59 ]}^{[ 60 ]}

変種と派生

コンピュータ技術が世界中に普及するにつれ、様々な標準化団体や企業が、ローマ字ベースのアルファベットを使用する英語以外の言語の表現を容易にするために、ASCIIの様々なバリエーションを開発しました。これらのバリエーションのいくつかは「ASCII拡張」に分類できますが、7ビット範囲のASCIIの文字マップを保持しないものも含め、すべてのバリエーションを指すためにこの用語を誤用する人もいます。さらに、ASCII拡張はASCIIと誤って分類されることもありました。

7ビットコード

開発当初から、^{[ 61 ]} ASCIIは国際的な文字コード標準のいくつかの国別バリエーションの1つに過ぎないことが意図されていました。

他の国際標準化団体も、ISO 646 (1967)などの文字エンコーディングを批准しています。これらの文字エンコーディングはASCIIと同一またはほぼ同一ですが、英語アルファベット以外の文字や、コードページ1104に見られる英国ポンド(£)の記号など、米国以外で使用される記号のための拡張機能を備えています。ASCIIは米国とその他の少数の国のニーズにしか対応していなかったため、ほぼすべての国でASCIIの適応版が必要でした。例えば、カナダにはフランス語の文字をサポートする独自のバージョンがありました。

他の多くの国では、英語以外の文字 (例: é、ñ、ß、Ł ) や通貨記号 (例: £、¥ ) などを含めるために ASCII のバリエーションを開発しました。YUSCII (ユーゴスラビア) も参照してください。

この規格では、ほとんどの文字は共通化されていたものの、その他の地域的に有用な文字は「国別使用」のために留保されたいくつかのコードポイントに割り当てられていました。しかし、ASCII-1963の発行から1967年にISOが初めて国際勧告を承認するまでの4年間^{[ 62 ]}、ASCIIが国別使用文字として選択した文字が世界の事実上の標準であるかのように思われ、他国がこれらのコードポイントに独自の割り当てを始めると、混乱と非互換性が生じました。

ISO/IEC 646は、ASCIIと同様に7ビットの文字セットです。追加のコードは提供されていないため、同じコードポイントでも国によって異なる文字がエンコードされます。エスケープコードは、テキストに適用される国別バリアントを示すために定義されていましたが、ほとんど使用されなかったため、どのバリアントを処理すればよいのか、ひいてはコードがどの文字を表しているのかを理解できないことがよくありました。また、一般的にテキスト処理システムは1つのバリアントしか処理できませんでした。

ASCIIの括弧と中括弧の文字は、ISO/IEC 646の他の国別バージョンでアクセント付き文字に使用される「国別使用」コードポイントに割り当てられていたため、ASCIIではなくISO/IEC 646の国別バージョンを使用するドイツ、フランス、スウェーデンなどのプログラマーは、次のようなコードを書き、読み取らなければなりませんでした。

ä aÄiÜ = 'Ön'; ü

の代わりに

{ a[i] = '\n'; }

Cトライグラフは ANSI Cのこの問題を解決するために作成されましたが、導入が遅れたこととコンパイラにおける実装の一貫性のなさから、その使用は限られていました。多くのプログラマはコンピュータをASCIIコードで使用していたため、スウェーデン語、ドイツ語などのプレーンテキスト（電子メールやUsenetなど）には単語の途中に「{, }」などの変形文字が含まれていました。これらのプログラマはそれに慣れていました。例えば、スウェーデン人のプログラマが別のプログラマに昼食に行こうかとメールで尋ねると、「N{jag har sm|rg}sar」という返事が返ってくる可能性がありますが、これは「いいえ、サンドイッチがあります」という意味の「Nä jag har smörgåsar」であるべきでした。

日本と韓国では、2020年代現在でも、ASCIIのバリエーションが使用されており、バックスラッシュ（16進数5C）は ¥ （日本では円記号）または ₩ （韓国ではウォン記号）として表示されます。つまり、例えばファイルパス「C:\Users\Smith」は、C:\Users\Smith（日本）またはC:\₩Users\Smith（韓国）と表示されます。

ヨーロッパでは、ASCIIの変種であるテレテキスト文字セットが放送テレビの字幕に使用されており、世界システムテレテキストで定義され、DVB送信にテレテキストを埋め込むためのDVB-TXT標準を使用して放送されています。^{[ 63 ]}字幕が最初にテレテキスト用に作成され、変換された場合、派生した字幕フォーマットは同じ文字セットに制限されます。

8ビットコード

最終的に、8 ビット、16 ビット、32 ビット（後に64 ビット）のコンピュータが12 ビット、18 ビット、36 ビットのコンピュータに取って代わり、標準として普及し始めると、各文字をメモリに格納するために 8 ビットバイトを使用するのが一般的になり、ASCII の拡張された 8 ビットの類似文字が生まれるようになりました。ほとんどの場合、これらは ASCII の真の拡張として開発され、元の文字マッピングはそのままに、最初の 128 文字（つまり 7 ビット）の後に追加の文字定義が追加されました。ASCII 自体は 7 ビットコードのままであり、「拡張 ASCII」という用語は公式なものではありません。

一部の国では、現地の言語で使用される文字のサポートを含む ASCII の 8 ビット拡張が開発されました (たとえば、インドではISCII 、ベトナムでは VISCII )。

初期の家庭用コンピュータシステムのメーカーは、追加言語をサポートするために多くの文字を追加する必要がなかった市場であっても、ボックス描画文字、セミグラフィックス、ビデオゲームのスプライトなどの追加文字を含めるために、独自の8ビットASCII拡張を開発することが多かった。これらの追加により、制御文字（インデックス0から31、およびインデックス127）が、さらにプラットフォーム固有の拡張機能に置き換えられることも多かった。また、余分なビットが反転表示の切り替えなどの他の目的に使用されることもあり、このアプローチは Atariによって開発されたASCIIの拡張であるATASCIIで採用された。

ほとんどのASCII拡張はASCII-1967（現在の標準）に基づいていますが、一部の拡張は以前のASCII-1963に基づいています。例えば、コモドール・インターナショナルが自社の 8ビットシステム用に開発したPETSCIIは、ASCII-1963に基づいています。同様に、シャープのMZ文字セットの多くはASCII-1963に基づいています。

IBMはIBM PC用にコードページ437を定義し、制御文字をスマイリーフェイスなどのグラフィックシンボルに置き換え、追加のグラフィック文字を上位128桁にマッピングしました。^[⁶⁴^] Digital Equipment Corporationは、ブロックグラフィックよりも国際言語向けに設計された最初の拡張機能の1つとして、人気のVT220 端末で使用するために多国籍文字セット（DEC-MCS）を開発しました。AppleはMacintosh用にMac OS Romanを定義し、 Adobeは PostScript用にPostScript標準エンコーディングを定義しました。どちらのセットにも、グラフィックではなく、現代の文字セットに近い「国際的な」文字、印刷記号、句読点が含まれていました。

ISO /IEC 8859規格（DEC-MCSから派生）は、ほとんどのシステムが模倣した（あるいは、完全に模倣されていなくても、少なくともそれに基づいていた）規格を提供した。Microsoftによって設計された人気の高い拡張規格であるWindows-1252（しばしばISO-8859-1と誤記される）は、従来のテキスト印刷に必要な印刷用句読点を追加した。ISO-8859-1、Windows-1252、そしてオリジナルの7ビットASCIIは、2008年に UTF-8に取って代わられるまで、ワールドワイドウェブ上で最も一般的な文字エンコード方式であった。^[⁵⁹^]

ISO/IEC 4873では、 7ビットASCIIエンコードを8ビットシステムに拡張する一環として、 80～9Fの16進数範囲で定義された32の追加制御コードが導入されました。 ^{[ 65 ]}

ユニコード

UnicodeとISO/IEC 10646ユニバーサル文字セット（UCS）は、はるかに幅広い文字群をサポートしており、その多様なエンコード形式は、多くの環境でISO/IEC 8859やASCIIに急速に取って代わり始めています。ASCIIは128文字に制限されていますが、UnicodeとUCSは、一意の識別（コードポイントと呼ばれる自然数を使用）とエンコード（それぞれ UTF-8、UTF- 16、UTF - 32と呼ばれる8ビット、16ビット、または32ビットのバイナリ形式へのエンコード）の概念を分離することで、より多くの文字をサポートします。

ASCIIは最初の128文字としてUnicode（1991）文字セットに組み込まれたため、7ビットASCII文字は両方のセットで同じ数値コードを持ちます。これにより、UTF-8は7ビットASCIIと下位互換性があります。ASCII文字のみを含むUTF-8ファイルは、同じ文字列を含むASCIIファイルと同一です。さらに重要なのは、 7ビットASCII文字のみを特殊文字として認識し、最上位ビットがセットされたバイトを変更しないソフトウェア（ISO-8859-1などの8ビットASCII拡張をサポートするためによく行われるように）は、UTF-8データを変更せずに保持するため、上位互換性が保証されることです。^{[ 66 ]}

参照

3568 ASCII – 小惑星スペースのない短い説明を表示するページ
Altコード – 入力方法リダイレクト先の簡単な説明を表示するページ
ASCIIアート – テキスト文字を使用したコンピュータアート
ASCIIリボンキャンペーン – プレーンテキスト（のみ）メールキャンペーン
基本ラテン文字（Unicodeブロック）
拡張ASCII – 8ビットASCII由来の文字セットのニックネーム
HTML の 10 進文字レンダリング – HTML における国際文字のエンコードシステムの使用リダイレクト先の簡単な説明を表示するページ
専門用語ファイル – コンピュータサブカルチャーの定義集リダイレクト先の簡単な説明を表示するページ
テキストファイル – プレーンテキストを含むコンピュータファイル
コンピュータ文字セットの一覧
Unicode文字の一覧

注記

^ ^a ^b ^c ^d ^e7ビットASCII文字セットの128文字は、0～7のスティックと呼ばれる8つの16文字グループに分かれており、最上位3ビットに関連付けられています。^{[ 13 ]}文字マップの水平または垂直の表現に応じて、スティックは表の行または列に対応します。
^「制御文字」領域のUnicode文字U+2400からU+2421は、本来の機能を果たすのではなく、印刷または表示する必要がある場合に制御文字を表すために予約されています。一部のブラウザでは正しく表示されない場合があります。
^キャレット表記は、端末上で制御文字を表すためによく使用されます。ほとんどのテキスト端末では、キーを押しながら2番目の文字を入力すると制御文字が入力されます。Shiftキーが不要な場合もあり、例えばCtrl+2またはCtrl+Spaceだけで入力できる場合もあります。Ctrl^@
^ C プログラミング言語およびJavaやPerlなど、C プログラミング言語の影響を受ける他の多くの言語における文字エスケープシーケンス(ただし、すべての実装が必ずしもすべてのエスケープシーケンスをサポートするわけではありません)。
^ 8進数値をエスケープすることで、任意のシングルバイト文字の入力がサポートされます。ただし、 C言語の文字列におけるNULLの役割のため、この場合は特別な使用法を参照してください。
^一部のシステムでは、キーを押してバックスペース文字を入力することもできます。← Backspace
^ ^a ^bバックスペースの曖昧さは、初期の端末が、キーボードの主な用途がコンピュータに接続されていない状態で紙テープを手動で穴あけすることであると想定して設計されていたことに起因しています。前の文字を削除するには、紙テープパンチを後退させる必要がありました。これは、機械的および簡便な理由から、キーボードではなくパンチ本体のボタンに搭載されていました。そのため、タイプライターのバックスペースと同じ位置に、消しゴムキーを配置しました。システムがこれらの端末を使用し、コマンドライン編集機能を提供する場合、バックスペースを実行するには「消しゴム」コードを使用する必要があり、バックスペース文字を解釈しないことがよくありました（バックスペースとして「^H」をエコーするなど）。紙テープ用に設計されていない他の端末では、この位置のキーでバックスペースが実行され、それらの端末用に設計されたシステムでは、その文字を使用して後退していました。削除コードはバックスペース効果を生成することが多かったため、端末メーカーはどのキーでも削除文字以外の文字を入力できるようにせざるを得ませんでした。Delete
^ほとんどのシステムでは、キーを押して Tab 文字を入力することもできます。Tab ↹
^ほとんどのシステムでは、またはを押してキャリッジリターン文字を入力することもできます。↵ EnterReturn
^ \eエスケープシーケンスは、 ISO Cや他の多くの言語仕様には含まれていません。ただし、 GCCを含むいくつかのコンパイラでは認識されます。
^一部のシステムでは、キーを押してエスケープ文字を入力することもできます。Esc
^ ^^ は+(「Ctrl」キーとキャレットキーを押す) を意味します。Ctrl^
^一部のシステムでは、キーを押してDelete 文字を入力できる場合があります← Backspace

^印刷すると、文字は次のようになります。

 !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~

参考文献

^ ANSI (1975-12-01)。ISO-IR-6: ASCII グラフィック文字セット(PDF)。 ITSCJ/情報処理学会。
^ ^a ^b「文字セット」 . Internet Assigned Numbers Authority (IANA) . 2007年5月14日. 2019年8月25日閲覧。
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l ^m ⁿ ^o ^p ^q ^r ^s Mackenzie, Charles E. (1980). Coded Character Sets, History and Development (PDF) . The Systems Programming Series (1 ed.). Addison-Wesley Publishing Company, Inc. pp. 6, 66, 211, 215, 217, 220, 223, 228, 236– 238, 243– 245, 247– 253, 423, 425– 428, 435– 439. ISBN 978-0-201-14460-4. LCCN 77-90165 . 2016年5月26日時点のオリジナルよりアーカイブ（PDF） . 2019年8月25日閲覧.
^ Shirley, R. (2007年8月).インターネットセキュリティ用語集バージョン2. doi : 10.17487 /RFC4949 . RFC 4949. 2016年6月13日閲覧。
^マイニ、アニル・クマール（2007年）『デジタルエレクトロニクス：原理、デバイス、アプリケーション』ジョン・ワイリー・アンド・サンズ、p.28、ISBN 978-0-470-03214-5さらに、テキストの処理方法に影響を与える、印刷されない、ほとんどが廃止された制御文字 33 個のコードも定義しています。
^ 「マイルストーン提案:ASCII マイルストーン - IEEE NJ Coast Section」 IEEEマイルストーン Wiki 2016年3月29日. 2024年2月26日閲覧。
^ ^a ^b Brandel, Mary (1999-07-06). 「1963: The Debut of ASCII」 . CNN . 2013年6月17日時点のオリジナルよりアーカイブ。 2008年4月14日閲覧。
^ ^a ^b ^c ^d「American Standard Code for Information Interchange, ASA X3.4-1963」 Sensitive Research . American Standards Association . 1963年6月17日. 2020年6月6日閲覧。
^ ^a ^b ^c米国情報交換標準コード、USAS X3.4-1967（技術レポート）。米国規格協会。1967年7月7日。
^ Jennings, Thomas Daniel (2016-04-20) [1999]. 「ASCII文字コードの注釈付き歴史：情報浸透のためのアメリカ標準コード」 . Sensitive Research . 2020年3月8日閲覧。
^ ^a ^b ^c ^d米国情報システム規格 - 符号化文字セット - 7ビット米国情報交換規格コード（7ビットASCII）、ANSI X3.4-1986（技術報告書）。米国規格協会（ANSI）。1986年3月26日。
^ Bukstein, Ed (1964年7月). 「バイナリコンピュータコードとASCII」 . Electronics World . 72 (1): 28– 29. 2016年3月3日時点のオリジナルよりアーカイブ。 2016年5月22日閲覧。
^ ^a ^b ^c ^d ^e ^fロバート・ウィリアム・ベマー(1980). 「第1章 ASCIIの内側」(PDF) .汎用ソフトウェア. ベスト・オブ・インターフェース・エイジ. 第2巻. オレゴン州ポートランド, 米国: ダイリチウム・プレス. pp. 1– 50. ISBN
978-0-918398-37-6 LCCN 79-67462 . 2016年8月27日時点のオリジナルよりアーカイブ。 2016年8月27日閲覧。から：
- ベマー、ロバート・ウィリアム（1978年5月）「ASCIIの内側パートI」インターフェースエイジ3 ( 5): 96-102。
- ロバート・ウィリアム・ベマー（1978年6月）「Inside ASCII – Part II」『インターフェース・エイジ』3 (6): 64–74。
- ベマー、ロバート・ウィリアム（1978年7月）「Inside ASCII – Part III」『インターフェース・エイジ』3 (7): 80–87 .
^簡潔な報告: 新しい電信アルファベットに関する CCITT ワーキングパーティの会議、1963 年 5 月 13 〜 15 日。
^ ISO/TC/97/SC 2の報告書 – 1963年10月29～31日の会議。
^タスクグループX3.2.4に関する報告書、1963年6月11日、ペンタゴンビル、ワシントンD.C.
^ 1963年12月17日および18日、タスクグループX3.2.4、第8回会議報告書
^ ^a ^b ^c Winter, Dik T. (2010) [2003]. 「米国および国際規格：ASCII」 2010年1月16日時点のオリジナルよりアーカイブ。
^ ^a ^b USA Standard Code for Information Interchange, USAS X3.4-1968 (技術レポート).米国規格協会. 1968年10月10日.
^ ^a ^b ^c ^d ^e ^f ^g Salste, Tuomas (2016年1月). 「7ビット文字セット：ASCIIの改訂」 . Aivosto Oy. urn : nbn:fi-fe201201011004 . 2016年6月13日時点のオリジナルよりアーカイブ。2016年6月13日閲覧。
^ ^a ^b Cerf, Vint (1969-10-16).ネットワーク交換のためのASCIIフォーマット. ネットワークワーキンググループ. doi : 10.17487/RFC0020 . RFC 20. 2016年6月13日閲覧。(注:イントロを除いてUSAS X3.4-1968とほぼ同じ文言です。)
^ Barry Leiba (2015年1月12日). 「RFC 20 (ASCII形式) のインターネット標準への正しい分類」IETF .
^「Information」. Scientific American (特別版). 215 (3). 1966年9月. JSTOR e24931041 .
^ Korpela, Jukka K. (2014-03-14) [2006-06-07]. Unicode Explained – Internationalize Documents, Programs, and Web Sites (第1版の第2版). O'Reilly Media, Inc. p. 118. ISBN 978-0-596-10121-3。
^ ANSI INCITS 4-1986 (R2007): 情報システムのための米国規格 – 符号化文字セット – 7ビット情報交換のための米国規格コード (7ビットASCII)、2007 [1986]
^ 「INCITS 4-1986[R2012]: 情報システム - コード化文字セット - 7ビット米国国家標準情報交換コード（7ビットASCII）」 2012年6月15日. 2020年2月28日時点のオリジナルよりアーカイブ。 2020年2月28日閲覧。
^ 「INCITS 4-1986[R2017]: 情報システム - コード化文字セット - 7ビット米国国家標準情報交換コード（7ビットASCII）」 2017年11月2日 [2017年6月9日] 。 2020年2月28日時点のオリジナルよりアーカイブ。 2020年2月28日閲覧。
^ “INCITS 4-1986 (R2022)” . webstore.ansi.org。
^シリアル・バイ・ビット・データ伝送における情報交換のための米国国家標準コードのビット順序、米国国家規格協会(ANSI)、1966 年、X3.15-1966
^ 「電信規則および最終議定書（マドリード、1932年）」（PDF）。2023年8月21日時点のオリジナルよりアーカイブ。 2024年6月9日閲覧。
^ ^a ^b Smith, Gil (2001). 「テレタイプ通信コード」(PDF) . Baudot.net. 2008年8月20日時点のオリジナルよりアーカイブ(PDF) . 2008年7月11日閲覧.
^ Sawyer, Stanley A.; Krantz, Steven George (1995). A TeX Primer for Scientists . CRC Press . p. 13. Bibcode : 1995tps..book.....S . ISBN 978-0-8493-7159-2. 2016年12月22日時点のオリジナルよりアーカイブ。2016年10月29日閲覧。
^ Savard, John JG 「コンピュータキーボード」。2014年9月24日時点のオリジナルよりアーカイブ。2014年8月24日閲覧。
^ 「ASCIIbeticalの定義」 . PC Magazine . 2013年3月9日時点のオリジナルよりアーカイブ。2008年4月14日閲覧。
^ Resnick, Peter W. 編 (2001年4月).インターネットメッセージフォーマット. doi : 10.17487/RFC2822 . RFC 2822. 2016年6月13日閲覧。(注: NO-WS-CTL。)
^ McConnell, Robert; Haynes, James; Warren, Richard. 「ASCIIコードを理解する」 2014年2月27日時点のオリジナルよりアーカイブ。 2014年5月11日閲覧。
^ Barry Margolin (2014年5月29日). 「Re: エディタとワードプロセッサの歴史 (旧: Re: Emacs用RTF)」 . help-gnu-emacs (メーリングリスト). 2014年7月14日時点のオリジナルよりアーカイブ。 2014年7月11日閲覧。
^ ^a ^b「PDP-6マルチプログラミングシステムマニュアル」（PDF） . Digital Equipment Corporation（DEC）. 1965年. p. 43. 2014年7月14日時点のオリジナルよりアーカイブ（PDF） . 2014年7月10日閲覧。
^ ^a ^b「PDP-10 リファレンスハンドブック第3巻モニターとの通信」(PDF)。Digital Equipment Corporation (DEC)、1969年、p. 5-5。2011年11月15日時点のオリジナルよりアーカイブ(PDF) 。 2014年7月10日閲覧。
^ 「ヘルプ - GNU Emacsマニュアル」。2018年7月11日時点のオリジナルよりアーカイブ。2018年7月11日閲覧。
^ 「ANSI X3.64-1979」（PDF） . 2024年10月27日閲覧。
^ Tim Paterson (2007年8月8日). 「DOSはCP/Mのパクリか？」 DosMan Drivel . 2018年4月20日時点のオリジナルよりアーカイブ。 2018年4月19日閲覧。
^ Ossanna, JF ; Saltzer, JH (1970年11月17～19日). 「端末をタイムシェアリングシステムに接続する際における技術的および人間工学的問題」(PDF) . Proceedings of the November 17-19, 1970, Fall Joint Computer Conference (FJCC) . AFIPS Press. pp. 355– 362. 2012年8月19日時点のオリジナルよりアーカイブ(PDF) . 2013年1月29日閲覧. 「改行」機能（キャリッジリターンとラインフィードの組み合わせ）を使用する方が、改行に両方の機能を必要とするよりも人間と機械の両方にとって簡単です。米国規格X3.4-1968では、改行コードに改行の意味を持たせることが認められています。
^ O'Sullivan, T. (1971-05-19). TELNETプロトコル. Internet Engineering Task Force (IETF). pp. 4–5. doi : 10.17487/RFC0158 . RFC 158. 2013年1月28日閲覧。
^ Neigus, Nancy J. (1973-08-12).ファイル転送プロトコル. Internet Engineering Task Force (IETF). doi : 10.17487/RFC0542 . RFC 542 . 2013年1月28日閲覧。
^ Postel, Jon (1980年6月).ファイル転送プロトコル.インターネット技術タスクフォース(IETF). doi : 10.17487/RFC0765 . RFC 765. 2013年1月28日閲覧。
^ Crocker, David (1982-08-13). ARPAインターネットテキストメッセージ形式の標準.インターネット技術タスクフォース(IETF). doi : 10.17487/RFC0822 . RFC 822 .
^ Berners-Lee, Tim; et al. (1996年5月). Hypertext Transfer Protocol -- HTTP/1.0 . Internet Engineering Task Force (IETF). doi : 10.17487/RFC1945 . RFC 1945 .
^ 「MercurialのEOL翻訳計画」 Mercurial. 2016年6月16日時点のオリジナルよりアーカイブ。2017年6月24日閲覧。
^ Bernstein, Daniel J. 「SMTPにおけるBare LFs」 2011年10月29日時点のオリジナルよりアーカイブ。2013年1月28日閲覧。
^ CP/M 1.4 インターフェースガイド(PDF) . Digital Research . 1978年. p. 10. 2019年5月29日時点のオリジナルよりアーカイブ(PDF) . 2017年10月7日閲覧。
^ Haynes, Jim (2015-01-13). 「第一人者：Chadは私たちの最も重要な製品：テレタイプ社をエンジニアが振り返る」エンジニアリングと技術史Wiki (ETHW) . 2023-02-14閲覧. 1961 ASCII から 1968 ASCII への変更がありました。一部のコンピュータ言語では、上矢印や左矢印など、1961 ASCII の文字が使用されていました。これらの文字は 1968 ASCII からは姿を消しました。私たちは、当時テレタイプ社の営業担当だった Fred Mocking と協力して、 1961 ASCII の意味が完全に失われないように、変化する文字をうまく処理できる活字シリンダーを開発しました。アンダースコア文字は、左矢印としても機能するように、くさび形にしました。
^ Bemer, Robert William . 「Bemer meets Europe (Computer Standards) – Computer History Vignettes」 . Trailing-edge.com. 2013年10月17日時点のオリジナルよりアーカイブ。 2008年4月14日閲覧。(注: ベマー氏は当時IBMに勤務していました。)
^ “Robert William Bemer: Biography” . 2013年3月9日. 2016年6月16日時点のオリジナルよりアーカイブ。
^ジョンソン、リンドン・ベインズ(1968年3月11日). 「連邦政府による情報交換用標準コードの採用を承認する覚書」 . アメリカ大統領プロジェクト. 2007年9月14日時点のオリジナルよりアーカイブ。 2008年4月14日閲覧。
^ Richard S. Shuford (1996年12月20日). 「Re: ASCIIの初期の歴史？」 .ニュースグループ: alt.folklore.computers . Usenet: [email protected] .
^フォルツ、ハロルド・C.、カープ、ハリー編 (1982年2月1日). 『データ通信規格集成（第2版）』McGraw-Hill Inc. ISBN 978-0-07-021457-6。
^ Dubost, Karl (2008年5月6日). 「UTF-8 Growth on the Web」 . W3C Blog . World Wide Web Consortium . 2016年6月16日時点のオリジナルよりアーカイブ。2010年8月15日閲覧。
^ ^a ^b Davis, Mark (2008年5月5日). 「Unicode 5.1への移行」 .公式Googleブログ. 2016年6月16日時点のオリジナルよりアーカイブ。 2010年8月15日閲覧。
^ Davis, Mark (2010年1月28日). 「Unicodeがウェブの50%に近づいている」 .公式Googleブログ. 2016年6月16日時点のオリジナルよりアーカイブ。 2010年8月15日閲覧。
^「特定の基準」、RW Reachのメモの添付資料、「X3-2会議 - 9月14日と15日」、1961年9月18日
^ Maréchal, R. (1967-12-22)、ISO/TC 97 – コンピュータと情報処理：ISO勧告草案No.1052の受諾
^ 「DVB ビットストリームで ITU-R システム B テレテキストを伝送するための DVB-TXT (テレテキスト) 仕様」。
^テクニカルリファレンス(PDF) . パーソナルコンピュータハードウェアリファレンスライブラリ (初版). IBM. 1981年8月. 付録C. 文字のキーストロークと色.
^ Unicodeコンソーシアム (2006年10月27日). 「第13章特殊領域と書式指定文字」(PDF) . Allen, Julie D. (編). Unicode規格バージョン5.0 . アッパーサドルリバー, ニュージャージー州, 米国: Addison-Wesley Professional . p. 314. ISBN 978-0-321-48091-0. 2022年10月9日にオリジナルからアーカイブ（PDF）されました。 2015年3月13日閲覧。
^ "utf-8(7) – Linux マニュアルページ" . Man7.org. 2014年2月26日. 2014年4月22日時点のオリジナルよりアーカイブ。 2014年4月21日閲覧。

さらに読む

ベマー, ロバート・ウィリアム(1960). 「文字コード互換性に関する提案」 . Communications of the ACM . 3 (2): 71– 72. doi : 10.1145/366959.366961 . S2CID 9591147 .
ロバート・ウィリアム・ベマー(2003年5月23日). 「ASCII以前のコードの混乱：1960年コード化文字セット概説：ASCIIの理由」 . 2013年10月17日時点のオリジナルよりアーカイブ。 2016年5月9日閲覧。から：
- ベマー, ロバート・ウィリアム(1960年12月). 「符号化文字表現の概観」 . Communications of the ACM . 3 (12): 639– 641. doi : 10.1145/367487.367493 . S2CID 21403172 .
- スミス, HJ; ウィリアムズ, FA (1960年12月). 「パンチカードコードの調査」 Communications of the ACM . 3 (12): 642. doi : 10.1145/367487.367491 .
「米国国家標準情報交換コード | ANSI X3.4-1977」（PDF）。米国国立規格協会（NIST）1977年。2022年10月9日時点のオリジナルからアーカイブ（PDF）。（ファクシミリ、機械可読ではありません）
Robinson, GS; Cargill, C. (1996). 「コンピュータ標準の歴史と影響」. Computer . 第29巻第10号. pp. 79– 85. doi : 10.1109/2.539725 .
Mullendore, Ralph Elvin (1964) [1963]. Ptak, John F. (編). 「ASCIIの初期開発について – ASCIIの歴史」 . JF Ptak Science Books (2012年3月出版). 2016年5月26日時点のオリジナルよりアーカイブ。 2016年5月26日閲覧。

外部リンク

ウィキメディアコモンズには、 ASCIIに関連するメディアがあります。

「C0制御文字と基本ラテン文字 - 範囲: 0000～007F」(PDF)。Unicode規格8.0。Unicode , Inc. 2015 [1991]。2016年5月26日時点のオリジナルよりアーカイブ(PDF) 。 2016年5月26日閲覧。

「 https://en.wikipedia.org/w/index.php?title=ASCII&oldid=1335901102#Printable_character_table」から取得

カテゴリー:

非表示のカテゴリ: