| タグ | |
|---|---|
| 範囲 | U+E0000..U+E007F (128コードポイント) |
| 飛行機 | SSP |
| スクリプト | 一般 |
| 割り当て済み | 97コードポイント |
| 未使用 | 31 予約コードポイント 1非推奨 |
| Unicodeのバージョン履歴 | |
| 3.1 (2001) | 97 (+97) |
| Unicodeドキュメント | |
| コードチャート ∣ ウェブページ | |
| 注: [ 1 ] [ 2 ] | |
Tags は、書式タグ文字を含むUnicode ブロックです。このブロックはASCII をミラーリングするように設計されています。元々は言語タグ用に設計されていましたが、現在は絵文字修飾子、特に地域旗用として再利用されています。
U+E0001、U+E0020~U+E007Fは、もともと言語別にテキストを目に見えない形でタグ付けするために使用されていましたが[ 3 ]、その使用は推奨されなくなりました。[ 4 ] これらの文字はすべてUnicode 5.1で非推奨となりました。
Unicode 8.0のリリースにより、U+E0020~U+E007Eは非推奨文字ではなくなりました。この変更は、「将来、言語タグを表す以外の目的でタグ文字を使用する可能性への道を開くため」に行われました。[ 5 ] Unicodeは、「プレーンテキストストリーム内で言語タグを表すためにタグ文字を使用することは、テキストに関する言語情報を伝達するための非推奨のメカニズムとして依然として使用されている」と述べています。[ 5 ]
Unicode 9.0のリリースにより、U+E007Fは非推奨文字ではなくなりました。(U+E0001 LANGUAGE TAGは非推奨のままです。)2017年5月にリリースされたEmoji 5.0 [ 6 ]では、これらの文字は特別なシーケンスの修飾子として使用される絵文字とみなされています。
指定されている唯一の用法は、国旗の地域表示記号の使用と並んで、地域の旗を表すことである。[ 7 ]これらのシーケンスは、U+1F3F4 🏴 WAVING BLACK FLAGの後に、 CLDRでコード化された地域に対応する一連のタグ、そしてU+E007F CANCEL TAGで構成される。例えば、「gbeng」のタグ (🏴) を使用すると、一部のシステムではイングランドの国旗、「gbsct」のタグ (🏴) を使用するとスコットランドの国旗、「gbwls」のタグ (🏴) を使用するとウェールズの国旗が表示される。[ 7 ]
タグシーケンスはISO 3166-2から派生していますが、他の地方国旗(例えば米国の州)を表すシーケンスもこのメカニズムを用いて可能です。ただし、Unicodeバージョン12.0時点では、上記の3つの国旗シーケンスのみがUnicodeコンソーシアムによって「一般交換に推奨」されており、これは「複数のプラットフォームで広くサポートされる可能性が最も高い」ことを意味します。[ 8 ]
タグはLLM上で目に見えないプロンプトインジェクションを作成するために使用されています。[ 9 ]
| タグ[1] [2] [3]公式Unicodeコンソーシアムコードチャート(PDF) | ||||||||||||||||
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | あ | B | C | D | E | F | |
| U+E000x | 始める | |||||||||||||||
| u+E001x | ||||||||||||||||
| U+E002x | SP | ! | 「 | # | $ | % | & | ' | ( | ) | * | + | 、 | - | 。 | / |
| u+E003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| U+E004x | @ | あ | B | C | D | E | F | G | H | 私 | J | K | L | M | 北 | お |
| U+E005x | P | 質問 | R | S | T | あなた | V | W | X | はい | Z | [ | \ | ] | ^ | _ |
| U+E006x | ` | 1つの | b | c | d | e | f | グラム | h | 私 | j | け | l | メートル | n | o |
| U+E007x | p | q | r | s | t | あなた | v | わ | × | y | z | { | | | } | 〜 | 終わり |
次の Unicode 関連のドキュメントには、Tags ブロックで特定の文字を定義する目的とプロセスが記録されています。
| バージョン | 最終コードポイント[ a ] | カウント | L2 ID | WG2 ID | 書類 |
|---|---|---|---|---|---|
| 3.1 | u+E0001 | 1 | L2/97-203 | Whistler, Ken; Adams, Glenn (1997-08-05), Plane 14 汎用タグの文字 | |
| L2/97-171R2 | ホイッスラー、ケン(1997-09-18)、プレーン14の汎用タグの文字 | ||||
| L2/97-256 | アルーシュ、マティ (1997-10-20)、プレーン 14 のポジションペーパーに関するコメント | ||||
| L2/97-255R | Aliprand, Joan (1997-12-03)、「3.B. 軽量言語タグ付け」、承認議事録 – UTC #73 & L2 #170 合同会議、カリフォルニア州パロアルト – 1997年8月4日~5日 | ||||
| L2/98-027 | N1670 | 言語タグ用平面14文字、1997-12-12 | |||
| L2/98-039 | Aliprand, Joan; Winkler, Arnold (1998-02-24)、「2.C 改訂提案」、予備議事録 - UTC #74 & L2 #171、カリフォルニア州マウンテンビュー - 1997年12月5日 | ||||
| L2/98-286 | N1703 | Umamaheswaran, VS; Ksar, Mike (1998-07-02)、「7.4」、未確認会議議事録、WG 2 会議 #34、レドモンド、ワシントン州、米国; 1998-03-16--20 | |||
| L2/98-281R (pdf、html ) | Aliprand, Joan (1998-07-31)、「IETFとW3Cの問題 (VI)」、未確認議事録 – UTC #77 & NCITSサブグループL2 # 174合同会議、ワシントン州レドモンド -- 1998年7月29日~31日 | ||||
| L2/00-010 | N2103 | Umamaheswaran, VS (2000-01-05)、「9.1」、WG 2会議37の議事録、コペンハーゲン、デンマーク:1999年9月13日〜16日 | |||
| L2/01-301 | ホイッスラー、ケン(2001年8月1日)、「タグ文字」、Unicode標準における文字の廃止の分析 | ||||
| L2/02-166R2 | ムーア、リサ(2002年8月9日)、「キャラクターの非推奨」、UTC #91 分 | ||||
| U+E0020..E007F | 96 | L2/16-042 | フォント、Agustin; Pournader、Roozbeh (2015-01-26)、「完全な絵文字データ」と絵文字フラグの説明要求 | ||
| L2/15-145R | エドバーグ、ピーター(2015-05-07)、地域指標シンボルの追加提案 | ||||
| L2/15-107 | ムーア、リサ(2015年5月12日)「E.1.3 地域指標記号の追加提案」、UTC #143 議事録 | ||||
| L2/15-190 | Edberg, Peter (2015-06-29), PRI #299 背景: 追加のフラグタイプの表現 | ||||
| L2/15-206 | デイビス、マーク(2015-07-25)、旗の地域/区分の有効性 | ||||
| L2/16-180R | バージ、ジェレミー、ウィリアムズ、オーウェン(2016年7月7日)、イングランド、スコットランド、ウェールズの国旗に絵文字を追加する提案 | ||||
| L2/17-016 | Moore, Lisa (2017-02-08)、「アクション項目 150-A59」、UTC #150 分、L2/16-180R に記載されているフラグの 3 つのシーケンスを emoji 5.0 の emoji-sequences.txt に追加します。 | ||||
| L2/17-048 | Pournader、Roozbeh (2017-01-24)、PRI 343 (Unicode Emoji 5.0) に関するフィードバック | ||||
| L2/17-086 | Burge, Jeremy; et al. (2017-03-27)、Emoji_Component に ZWJ、VS-16、キーキャップ、タグを追加 | ||||
| L2/17-103 | Moore, Lisa (2017-05-18)、「E.1.7 Emoji_Component に ZWJ、VS-16、キーキャップ、タグを追加する」、UTC #151 分 | ||||
| |||||
{{cite journal}}:ジャーナルを引用するには|journal=(ヘルプ)が必要です{{cite journal}}:ジャーナルを引用するには|journal=(ヘルプ)が必要です