Unicodeの下付き文字と上付き文字

Unicodeには、アラビア数字のフルセットを含む多くの文字の下付き文字と上付き文字があります。[ 1 ]これらの文字を使用すると、 HTMLTeXなどのマークアップ形式を使用せずに、多項式化学方程式、その他の特定の方程式をプレーンテキストで表現できます。

World Wide Web ConsortiumUnicode Consortium は、マークアップの使用と上付き文字および下付き文字の使用の選択に関する推奨事項を発表しました。

数学的な文脈( MathML )で使用する場合、上付き文字と下付き文字には一貫してスタイルマークアップを使用することをお勧めします。[...] しかし、上付き文字と下付き文字が意味の違いを反映する必要がある場合、音声表記音素表記などのマークアップではなくテキストでエンコードされた意味を扱う方が簡単です。[ 2 ]

用途

上付き文字/下付き文字と分子/分母のグリフの違い。多くの一般的なコンピュータフォントでは、Unicodeの「上付き文字」と「下付き文字」は、実際には分子と分母のグリフです。

これらの文字がUnicodeに追加された際の意図された用途[2]は、真の上付き文字と下付き文字を作成し、化学式や代数式をマークアップなしで表記できるようにすることでした。したがって、「H₂O」(下付き文字2を使用)は、「H 2 O付き文字マークアップを使用)と同一であると想定されます

実際には、これらの文字を含む多くのフォントはUnicodeの定義を無視し、代わりに数学分子分母のグリフの数字をデザインしており、[ 3 ] [ 4 ] 、それぞれキャップラインベースラインに揃えられています。ソリダスまたは分数スラッシュと一緒に使用すると、¾グリフの³/₄など、ほぼ印刷的に正しい斜めの分数が生成されます。上付きおよび下付きのマークアップでは正しい分数は生成されません( 3 / 4のマークアップとあらかじめ作成された¾のマークアップを比較してください)。この変更により、上付き文字は序数を示すためにも役立ち、ªやºの文字により近くなります。

Unicode では、斜めの分数は別のメカニズムでレンダリングされることが想定されていました。分数スラッシュU+2044 は、視覚的にはソリダスに似ていますが、通常の数字(上付き文字や下付き文字ではない)と一緒に使用された場合、¾ などの分数は自動グリフ置換を使用してレンダリングされるようにレイアウト システムに指示します。[ 5 ] [ a ]ユーザー エンドのサポートは長年にわたって非常に貧弱でしたが、フォント、[ b ]ブラウザー、[ c ]ワード プロセッサー、[ d ]デスクトップ パブリッシング ソフトウェア[ e ]などが、意図された Unicode の動作をサポートするようになりました。このブラウザーと既定のフォントでは、シーケンスは⟨3⁄4⟩とレンダリングされます。 (さまざまな他のフォントでのレンダリングについては、スラッシュ (句読点)#分数を参照してください。)

上付き文字と下付き文字のブロック

最も一般的な上付き数字(1、2、3)はISO-8859-1に含まれていたため、UnicodeのLatin-1範囲のこれらのコードポイントに引き継がれました。残りの文字は、基本的な算術記号、そして後に一部のラテン下付き文字とともに、U+ 2070からU+209Fの専用ブロックに配置されました。以下の表は、これらの文字をまとめて示しています。上付き文字または下付き文字の前には、下付き文字または上付き文字の高さを示す ベースラインxが付きます。

「上付き文字と下付き文字」ブロック内の6つのコードポイントは未割り当てであり、将来の文字のために利用可能です。2024年11月時点で、これらのうち3つ(209D、209E、209F)は、新しい下付き文字、すなわちラテン小文字のw、y、zに暫定的に割り当てられています。[ 6 ] [ 7 ]

Unicode文字
0123456789BCDEF
U+00Bx ײ
U+207x x⁰xⁱ x⁴x⁵x⁶x⁷×⁸×⁹x⁺x⁻×⁼x⁽×⁾xⁿ
U+208x x₀x₁x₂x₃x₄x₅x₆×₇x₈x₉x₊×₋x₌×₍×₎
U+209x xₐ×ₑ×ₒ×ₓ×ₔ ×ₕ×ₖxₗ×ₘ ×ₙ×ₚ×ₛ×ₜ
  まだ割り当てられていない
  上付き文字や下付き文字に関連しないラテン1のその他の文字

その他の上付き文字と下付き文字

Unicodeには、意味的な使用を目的とした下付き文字と上付き文字のコードポイントも含まれており、次のブロックに含まれています。[ 1 ] [ 8 ]

上付き文字
  • ラテン語 1 補足ブロックには、女性および男性の序数指示子ª と º が含まれています。
  • ラテン拡張 Cブロックには、上付き文字 ⱽ が 1 つ含まれています。
  • ラテン拡張 Dブロックには、7 つの上付き文字 (ꝰ ꟲ ꟳ ꟴ ꟱ ꟸ ꟹ) が含まれます。
  • ラテン拡張 Eブロックには、ꭜ ꭝ ꭞ ꭟ ꭩ の 5 つの上付き文字が含まれています。
  • ラテン拡張 Fブロックは完全に上付き IPA 文字です: 𐞁 𐞂 𐞃 𐞄 𐞅 𐞇 𐞈 𐞉 𐞊 𐞋 𐞌 𐞍 𐞎 𐞏 𐞐 𐞑 𐞒 𐞓 𐞔 𐞕 𐞖 𐞗 𐞘 𐞙 𐞚 𐞛 𐞜 𐞝 𐞞 𐞟 𐞠 𐞡 𐞢 𐞣 𐞤 𐞥 𐞦 𐞧 𐞨 𐞩 𐞪 𐞫 𐞬 𐞭 𐞮 𐞯 𐞰 𐞲 𐞳 𐞴 𐞵 𐞶 𐞷 𐞸 𐞹 𐞺。
  • 間隔修飾文字ブロックには、音声転写に使用される上付き文字と記号が含まれています: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ。
  • 音声拡張ブロックには、上付き文字と記号がいくつかあります: ラテン語/IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ、ギリシャ語 ᵝ ᵞ ᵟ ᵠ ᵡ、キリル文字 ᵸ、その他 ᵎ ᵔ ᵕ ᵙ ᵜ. これらは二次的な調音を示すことを目的としています。
  • 音声拡張補足ブロックには、さらにいくつかあります: ラテン語/IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ、ギリシャ語 ᶿ。
  • キリル文字拡張 Bブロックには、2 つのキリル文字上付き文字 ꚜ ꚝ が含まれています。
  • Cyrillic Extended-Dブロックには、キリル文字の上付き文字が多数含まれています: 𞀰 𞀱 𞀲 𞀳 𞀷 𞀵 𞀶 𞀷 𞀸 𞀹 𞀺 𞀻 𞀼 𞀽 𞀾 𞀿 𞁀 𞁁 𞁂 🁃 𞁄 𞁅 𞁆 𞁇 𞁈 𞁉 𞁊 𞁋 𞁌 𞁍 𞁎 𞁏 𞁐 𞁫 𞁬 𞁭。
  • ジョージア文字のブロックには、上付きのMkhedruli文字 ჼ が1 つ含まれています。
  • 漢文ブロックには、古典中国語テキストの日本語コピーで使用される上付き注釈文字があります:㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟。
  • Tifinaghブロックには上付き文字1 つあります: ⵯ。
  • 統一カナダ先住民音節文字とその拡張ブロックには、終止符と呼ばれる音節の末尾を示す主に子音のみの文字がいくつか含まれており、さらに、中間音と呼ばれる音節の中間を示す文字もいくつか含まれています。メイン ブロック ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐢ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ᑉ ᑊ ᑋ ᒃ ᒄ ᒡ ᒢ ᒻ ᒼ ᒽ ᒾ ᓐ ᓑ ᓒ ᓪ ᓫ ᔅ ᔆ ᔇ ᔈ ᔉ ᔊ ᔋ ᔥ ᔾ ᔿ ᕀ ᕁ ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᘁ ᙆ ᙇ ᙚ ᙾ ᙿ;拡張ブロック: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ。
上付き文字の結合
  • 結合ダイアクリティカルマークのブロックには、中世の上付き文字のダイアクリティカルマークが含まれています。これらの文字は中世ゲルマン写本に登場する他の文字のすぐ上に書かれるため、uͤのようにスペースは含まれません。ここでは、点線の円プレースホルダー ◌ の上に表示されています。◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ。
  • 結合発音区別符号拡張ブロックには、中英語のOrmulum、◌ᫌ ◌ᫍ ◌ᫎを表す3つの結合島状文字が含まれています。 [ 9 ]
  • 結合分音記号補足ブロックには、j、q、y を除く基本的な小文字ラテンアルファベットを完成させるのに十分な追加の中世上付き文字分音記号、いくつかの小さな大文字と合字 (ae、ao、av)、および追加の文字が含まれています: ◌᷒ ◌ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷪ ◌ᷫ ◌ᷬ ◌ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ、ギリシャ語 ◌ᷩ。
  • キリル文字拡張 Aおよび B ブロックには、教会スラヴ語テキストで使用される基本的な小文字のキリル文字を完成させるのに十分な、複数の中世の上付き文字の分音記号が含まれており、追加の合字 (ст) も含まれています。 ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
  • キリル文字の拡張 Dブロックには、і: ◌𞂏 という追加の結合文字が 1 つあります。
添字
  • ラテン拡張 Cブロックには 1 つの下付き文字 ⱼ が含まれます。
  • 音声拡張ブロックには、ラテン語/IPA ᵢ ᵣ ᵤ ᵥ およびギリシャ語 ᵦ ᵧ ᵨ ᵩ ᵪ などの下付き文字と記号がいくつかあります。
  • Cyrillic Extended-Dブロックには、多くのキリル文字の下付き文字も含まれています: 𞁑 𞁒 𞁓 𞁔 𞁕 𞁖 𞁗 𞁘 𞁙 𞁚 𞁛 𞁜 𞁝 𞁞 𞁟 𞁠 𞁡 𞁢 𞁣 🁤 𞁥 𞁦 𞁧 𞁨 𞁩 𞁪。
下付き文字の結合

ラテン文字、ギリシャ文字、キリル文字、IPA の表

この音声表記のように、上付きの小文字のW はイタリック体の上付きの小文字のwと区別される場合があります。

統合されたUnicode規格には、ラテン文字、ギリシャ文字、キリル文字のサブセットの上付き文字と下付き文字が含まれています。ここでは、比較(またはコピー&ペーストの利便性)のために、これらの文字をアルファベット順に並べています。これらの文字は異なるUnicode範囲に出現するため、ブラウザによるフォント置換によって、サイズや位置が異なって表示される場合があります。網掛けのセルはプチ・キャピタル(小文字)を表します。ローマ字体では小文字とあまり区別されませんが、イタリック体では、一部の音声表記で使用されるように、区別される場合があります。

句読点はほとんど符号化されていません。括弧は上記の基本的な上付き文字ブロックに示されており、感嘆符 ⟨ ⟩ は下のIPA表に示されています。対応フォントでは、上付きゲルド疑問符とその下に結合点を付けることで疑問符を作成できます:⟨ ˀ̣ ⟩。

基本的なラテン語修飾文字
BCDEFGHJKLMP質問RSTあなたVWXはいZ
上付き文字の大文字 ᴿ
上付き小文字大文字 *𐞄 **𐞒𐞖𞀹 §𞀻 §*𐞪 𞁀 §𐞲
上付き小文字 ʰʲˡ𐞥ʳˢʷˣʸ
上付き小文字大文字 ◌ⷡ §◌ᷛ◌ⷩ §◌ⷦ §◌ᷞ◌ᷟ◌ᷡ ◌ᷢ ◌ⷮ §
上付き小文字 ◌ͣ◌ᷨ◌ͨ◌ͩ◌ͤ◌ᷫ◌ᷚ◌ͪ◌ͥ◌ᷜ◌ᷝ◌ͫ◌ᷠ◌ͦ◌ᷮ◌ͬ◌ᷤ◌ͭ◌ͧ◌ͮ◌ᷱ◌ͯ◌ꙷ §◌ᷦ
下付き小文字 𞁞 §***
下付き小文字 ◌᷊◌ᪿ

* 小文字A、D、E、Pとƀの上付き文字、およびw、y、zの下付き文字は、Unicode標準バージョン18でリリースされる予定です。[ 6 ]

§これらの文字の代わりにキリル文字の 𞀹 𞀻 𞁀、◌ⷡ ◌ⷩ ◌ⷦ ◌ⷮ ◌ꙷ、𞁞 が使用される場合があります。

追加のラテン語修飾文字
Æ ÄɃƎƏĦŊ Ƞ オー Ü
上付き文字の大文字 (ᴬ̈)(ᴼ̈) (ᵁ̈)
上付き小文字 𐞃 (ᵃ̈)*𐞕 * (ᵒ̈) (ᵘ̈)
上付き小文字 ◌ᷔ ◌ᷲ◌ᷪ◌ᷬ ◌ᷳ ◌ᷴ
下付き小文字

これらの上付き大文字の一部は、Unicode提案の原文ではスモールキャップスとして表記されています。上付き文字のÄ、Ö、Ü(括弧内)は、基本文字と結合トレマで構成されています。

ギリシャ語テキストで使用されるイオタ下付き文字を除き、修飾語ギリシャ文字はラテン文字テキストにおける表音文字として意図されています。網掛けされたセルはラテン文字と区別がつかず、ラテン文字テキストで明確に区別されることは期待されず、Unicodeでもサポートされません。

ギリシャ語の修飾文字(ラテン文字のテキストで使用することを意図)
ΑΒΓΔΕΖΗΘΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ
上付き小文字 [ A ]* []ᶿ[ A ]**
上付き小文字 ◌ᷧ [ A ]◌ᷩ◌᫇ [ f ]
下付き小文字 ͺ [ g ]
下付き小文字 ◌ͅ◌̫ [ f ]
  1. ^ a b c d一部のフォントでは、script-a の ᵅ と ᶹ はギリシャ文字の上付き文字のアルファとウプシロンの形をとりますが、他のフォントでは完全に一致しません。同様に、スケジュールされた上付き文字のƞとギリシャ文字の η も同様です。

* ギリシャ語のpsiとomegaの上付き文字は、Unicode標準のバージョン18で予定されています。[ 6 ]

キリル文字修飾文字はキリル文字テキストで使用することを目的としています。

ロシア語の修飾文字
БВГДЕЖЗИКЛМНПРСТУФХЦЧШЩЪЫЬЭЮЯ
上付き文字𞀰𞀱𞀲𞀳𞀴𞀵𞀶𞀷𞀸𞀹𞀺𞀻𞀼𞀽 𞀾𞀿𞁀𞁁𞁂𞁃𞁄𞁅𞁆𞁇𞁈𞁉
上書き◌ⷶ◌ⷠ◌ⷡ◌ⷢ◌ⷣ◌ⷷ◌ⷤ◌ⷥ◌ꙵ◌ⷦ◌ⷧ◌ⷨ◌ⷩ◌ⷪ◌ⷫ ◌ⷬ◌ⷭ◌ⷮ◌ꙷ◌ꚞ◌ⷯ◌ⷰ◌ⷱ◌ⷲ◌ⷳ◌ꙸ◌ꙹ◌ꙺ◌ⷻ
添字𞁑𞁒𞁓𞁔𞁕𞁖𞁗𞁘𞁙𞁚𞁛𞁜𞁝 𞁞𞁟𞁠𞁡𞁢𞁣𞁤𞁥𞁦
追加の現代キリル文字修飾文字
ӘҐЄЅІЇЈӨҪҮҰЏӀ
上付き文字𞁋𞁊𞁌𞁌̈𞁍𞁎𞁫𞁏𞁭𞁐
上書き◌ꙴ◌𞂏◌ꙶ
添字𞁧𞁩𞁨𞁨̈𞁪
追加の中世キリル文字修飾文字
ѠѢѤѦѪѬѲ
上付き文字 𞁬
上書き◌ⷹ◌ꙻ◌ⷺ◌ⷼ◌ꚟ◌ⷽ◌ⷾ◌ⷿ◌ⷴ

上付き文字と下付き文字のёїйўなどは、分音記号、⟨𞀵̈ 𞁌̈ 𞀸̆ 𞁁̆⟩などで処理されます。キリル文字の多くは、2023 年 2 月にバージョン 6.2 で無料のGentiumおよびAndikaフォント に追加されたCyrillic Extended-Dブロックに追加されました。

Unicode の小文字大文字全角文字数学的英数字も参照してください。

上付きIPA

ラテン拡張Fブロックは、残りの上付きIPA文字のために作成されました。これらは無料のGentiumフォントAndikaフォントでサポートされています。歴史的IPA文字および準IPA文字用の追加の上付き文字は、2026年にUnicode標準バージョン18でリリースされる予定です。[ 6 ]

子音文字

上付き(修飾)IPAおよびextIPA子音を表すUnicode文字は以下の通りです。ラテン語拡張Fブロック全体が上付きIPA専用です。二次調音を伴う音を表す文字は括弧で囲み、一次調音の文字の下に配置します。アスタリスクは、2026年9月にUnicode 18でリリース予定の上付き文字を示します。

IPA、extIPA、para-IPAの子音、上付き文字の変種とそのUnicodeコードポイント
両唇 唇歯 歯科 歯槽骨 後歯槽骨 後屈 口蓋 軟口蓋 口蓋垂 咽頭 声門
鼻腔 m ᵐ 1D50ɱ ᶬ 1DACn ⁿ 207F ( ᶇ * )  ȵ *ɳ ᶯ 1DAFɲ ᶮ 1DAEŋ ᵑ 1D51ɴ ᶰ 1DB0
破裂音 p ᵖ 1D56b ᵇ 1D47ȹ *ȸ *t ᵗ 1D57 ( ƫ ᶵ ) 1DB5d ᵈ 1D48 ( ᶁ * )  ȶ *  ȡ *ʈ 𐞯 107AFɖ 𐞋 1078Bc ᶜ 1D9Cɟ ᶡ 1DA1k ᵏ 1D4Fɡ ᶢ / g ᵍ 1DA2/1D4Dq 𐞥 107A5ɢ 𐞒 10792ʡ 𐞳 107B3ʔˀ 02C0
破擦音 ʦ 𐞬 107ACʣ 𐞇 10787ʧ 𐞮 107AE ( ʨ 𐞫 ) 107ABʤ 𐞊 1078A ( ʥ 𐞉 ) 10789ꭧ 𐞭 107AD ( 𝼜 * )ꭦ 𐞈 10788 ( 𝼙 * )
摩擦音 ɸ ᶲ 1DB2β ᵝ 1D5Df ᶠ 1DA0v ᵛ 1D5Bθ ᶿ 1DBFð ᶞ 1D9Es ˢ 02E2 ( ᶊ * )z ᶻ 1DBB ( ᶎ * )ʃ ᶴ 1DB4 ( ɕ ᶝ ) 1D9Dʒ ᶾ 1DBE ( ʑ ᶽ ) 1DBDʂ ᶳ 1DB3 ( ᶘ * )ʐ ᶼ 1DBC ( ᶚ * )ç ᶜ̧ 1D9C + 0327 [ h ]ʝ ᶨ 1DA8x ˣ 02E3 ( ɧ 𐞗 ) 10797ɣˠ 02E0χ ᵡ 1D61ʁ ʶ 02B6ħ 𐞕 10795 ( ʩ 𐞐 ) 10790ʕ ˤ 02E4 [ i ]h ʰ 02B0 ( ꞕ * )ɦ ʱ 02B1
近似値 ʋ ᶹ 1DB9ɹ ʴ 02B4ɻ ʵ 02B5j ʲ 02B2 ( ɥ ᶣ ) 1DA3  ( ʍ ꭩ ) AB69ɰ ᶭ 1DAD ( w ʷ ) 02B7
タップ/フラップ ⱱ 𐞰 107B0ɾ 𐞩 107A9ɽ 𐞨 107A8
トリル ᴘ *ʙ 𐞄 10784r ʳ 02B3ʀ 𐞪 107AAʜ 𐞖 10796ʢ 𐞴 107B4
横摩擦音 ɬ 𐞛 1079B ( ʪ 𐞙 ) 10799ɮ 𐞞 1079E ( ʫ 𐞚 ) 1079Aꞎ 𐞝 1079D𝼅 𐞟 1079F𝼆 𐞡 107A1𝼄 𐞜 1079C
外側接近歯 l ˡ 02E1 ( ᶅ ᶪ ) 1DAA  ȴ *ɭ ᶩ 1DA9ʎ 𐞠 107A0ʟ ᶫ 1DAB ( ɫ ꭞ ) [ j ] AB5E
横方向のタップ/フラップ ɺ 𐞦 107A6𝼈 𐞧 107A7
内破的な ƥ *ɓ 𐞅 10785ƭ *ɗ 𐞌 1078C𝼉 *ᶑ 𐞍 1078Dƈ *ʄ 𐞘 10798ƙ *ɠ 𐞓 10793ʠ *ʛ 𐞔 10794
クリックリリース ʘ 𐞵 107B5ɋǀ 𐞶 107B6ʇ *ǃ ꜝ A71Dʗ *𝼊 𐞹 107B9ψ *ǂ 𐞸 107B8𝼋 *( ʞ * )
横方向クリックリリース ǁ 𐞷 107B7ʖ *
パーカッシブ ¡ ꜞ A71E [ k ]

排出子音の間隔用ダイアクリティカルマーク U+2BC は、それ自体が上付き文字ではないにもかかわらず、上付き文字と併用できます:⟨ ᵖʼ ᵗʼ ᶜʼ ᵏˣʼ ⟩。区別が必要な場合は、結合アポストロフィ U+315 を使用できます:⟨ ᵖ̕ ᵗ̕ ᶜ̕ ᵏˣ̕ ⟩。間隔用ダイアクリティカルマークは、 [tˢʼ][kˣʼ]のように上付き文字のリリースがある基底文字に使用する必要があります。この場合、アポストロフィの適用範囲には上付き文字以外の文字も含まれますが、結合用アポストロフィ U+315 は[ᵗ̕][ᵏ̕]のように、子音全体が上付き文字として書かれる、弱く発音される放出子音を示すために使用される場合があります。または、独立したアポストロフィが基底文字と修飾文字に適用される場合は、U+2BC と組み合わせて使用​​される場合もあります (⟨ pʼᵏˣ̕ ⟩など) 。[ 10 ]

⟨ tʲ ⟩のような間隔を表す分音記号は、プレーンテキストでは二次上付き文字として ⟨ ᵗʲ ⟩ を付けることはできません。(この場合、[tʲ]の古い IPA 文字⟨ ƫ ⟩ には、Unicode では上付き文字の異体 U+1DB5 ⟨ ⟩ がありますが、通常はそうではありません。)

古い文字のうち、最も一般的な口蓋鉤を持つ文字がサポートされており、それらは上の表に示されています。IPAはかつて、口蓋化された文字の一部に独特のカールがありました。これらは摩擦音文字の⟨ ʆ ʓ ⟩です。これらの上付き文字は、Unicode標準バージョン18で受け入れられています。古いスタイルのクリック文字と、廃止された文字の⟨ ƞ ⟩と⟨ ɼ ⟩も、Unicode標準バージョン18で受け入れられています。[ 6 ] Teuthonista文字の⟨ ꜧ ⟩ (U+A727) も、⟨ ɮ ⟩の古いグラフィックバリアントです。その上付き文字は⟨ ⟩ (U+AB5C) でサポートされています。

パラIPA文字のうち、漢語の⟨ ȡ ȴ ȵ ȶ ⟩、バントゥイ語の唇歯破裂音⟨ ȹ ⟩と⟨ ȸ ⟩、中母音⟨ ɉ ⟩、⟨ ɥ— ⟩、⟨ w— ⟩の上付き異形がUnicode標準バージョン18で採用されている。[ 6 ]

母音文字

上付き(修飾)IPA母音文字のUnicode文字、および英語辞書に掲載されている拡張文字のペア⟨ ᵿ ⟩は、以下のとおりです。最近廃止された⟨ ɩ ɷ ⟩などの代替文字もサポートされています。これらの文字は括弧で囲まれ、現代のIPA文字の下に配置されます。アスタリスクは、2026年9月にUnicode 18でリリース予定の上付き文字を示します。

IPAの母音と上付き文字の異形
フロント 中央 戻る
近い i ⁱ 2071y ʸ 02B8ɨ ᶤ 1DA4ʉ ᶶ 1DB6ɯ ᵚ 1D5Au ᵘ 1D58
ニアクローズ ɪ ᶦ 1DA6 ( ɩ ᶥ ) 1DA5ʏ 𐞲 107B2ᵻ ᶧ1DA7ᵿ *( ω * ) ʊ ᶷ 1DB7 ( ɷ 𐞤 ) 107A4
クローズミッド e ᵉ 1D49ø 𐞢 107A2ɘ 𐞎 1078Eɵ ᶱ 1DB1ɤ 𐞑 10791o ᵒ 1D52
ミッド ə ᵊ 1D4A
オープンミッド ɛ ᵋ 1D4Bœ ꟹ A7F9ɜ ᶟ 1D9F ( ᴈ ᵌ ) [ l ] 1D4Cɞ 𐞏 1078Fʌ ᶺ 1DBAɔ ᵓ 1D53
ほぼオープン æ 𐞃 10783ɶ 𐞣 107A3ɐ ᵄ 1D44ɑ ᵅ 1D45ɒ ᶛ 1D9B
開ける a ᵃ 1D43

Unicodeの合成母音文字⟨ ɚ ɝ ⟩は直接サポートされていません。代わりに、ロティック母音記号U+02DE ◌˞を使用してください:⟨ ᵊ˞ ᶟ˞ ⟩。[ 11 ]

古い文字の中で、 ⟨ ʊ ⟩の図形異形である⟨ ⟩ (U+1D1C)は、⟨ ⟩ (U+1DB8) でサポートされています。[ 12 ]一時的に復活した母音文字 ⟨ ʚ ⟩ (U+029A) は上付き文字としてサポートされていませんが、その反転した置換文字 ⟨ ɞ ⟩ のみがサポートされています。

パラIPA文字のうち、漢語上付き文字⟨ɿʅʮʯ⟩ ⟨ᴀᴇ⟩Unicode標準バージョン18で採用されている[ 6 ]

長さマーク

次の 2 つの長さマークもサポートされています。

長さマーク
長さ ハーフロング
ː 𐞁 10781ˑ 𐞂 10782

これらは、長い吹奏音を表す ⟨ Cʰ𐞁 ⟩ や ⟨ Cʰ𐞂 ⟩ など、別の上付き文字に長さを加えるために使用されます。

ワイルドカード

上付きワイルドカード(フルキャップ)は、ほぼサポートされています。例:ᴺC(前鼻音化子音)、ꟲN(前鼻音) 、 Pꟳ(摩擦音解放)、D꟱(歯擦音解放、2025年にUnicodeに追加)、NᴾF(浸透破裂音)、CVNᵀ(トーンベアリング音節)、Cᴸ(流動音または側方解放)、Cᴿ(共鳴音または共鳴解放)、Vᴳ(オフグライド/二重母音)、Cⱽ(つかの間の母音)。つかの間の/浸透クリックを表す上付き文字Ʞは、Unicode標準には含まれていません。国際音声記号 § 大文字に記載されている、トーン音と弱不定音を表すその他の基本的なラテン語上付きワイルドカードは、ほぼサポートされています。(ラテン語のセクションの表を参照してください。)

記号と下付き文字の組み合わせ

上付き文字に加えて、基本的なラテン アルファベット以外の IPA 文字の中には、結合形式を持つものや下付き文字としてサポートされているものがごくわずかあります。

追加のIPA修飾文字
ɑæβçðəɣʃʍχʔʼ
上書き ◌ᷧ◌ᷔ◌ᷩ◌ᷗ◌ᷙ◌ᷪ◌ᷯ◌̉ [ m ]◌̓
添字 *
下付き文字 ◌ᫀ◌̦

複合文字

主に以前の文字セットとの互換性のために、Unicodeには他の記号と組み合わせて上付き文字や下付き文字を構成する文字が多数含まれています。[ 1 ]ほとんどのフォントでは、これらの文字は、上記の文字から、またはマークアップを使用してこれらの記号を作成するよりもはるかに適切にレンダリングされます。

  • ラテン1補足ブロックには、½、¼、¾の合成分数が含まれています。著作権©と登録商標®もこのブロックに含まれており、一部のフォントでは上付き文字として表示されます。
  • 一般句読点ブロックにはパーミル記号‰ と10,000 分の 1 記号‱ が含まれ、基本ラテン語にはパーセント記号%が含まれます 。
  • の形式ブロックには、あらかじめ作成された分数がいくつか含まれています: ⅐ ⅑ ⅒ ⅓ ⅔ ⅕ ⅖ ⅗ ⅘ ⅙ ⅚ ⅛ ⅜ ⅝ ⅞ ⅟ ↉。
  • 文字のような記号ブロックには、下付き文字と上付き文字で構成されるいくつかの記号が含まれています: ℀ ℁ ℅ ℆ № ℠ ™ ⅍。
  • 同封の英数字補足ブロックには、3つの上付き略語が含まれています。MCはmarque de commerce商標)、MDはmarque déposée登録商標)で、どちらもカナダで使用されています。MRはmarca registrada(登録商標)で、スペイン語とポルトガル語圏の国で使用されています。[ 13 ]
  • その他の技術ブロックには、科学的記数法のために、下付き文字 10 (⏨) という追加の下付き文字が 1 つあります。
  • 統一カナダ先住民音節とその拡張ブロックには、拡張音価を示す上付き文字で構成されたいくつかの文字が含まれています。 メインブロック ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖒ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ ᙶ、拡張ブロックᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢷ ᢸ ᢹ ᢺ ᢻ ᢼ ᢽ ᢾ ᢿ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ。

注記

  1. ^グリフ置換に関する一般的な概要と技術情報(分数に特化しているわけではありません)については、 Microsoft タイポグラフィ サイトOpenType 仕様GSUB - グリフ置換テーブルを参照してください。
  2. ^ AndikaArno Pro Brill Brioso Pro Calibri Candara Carlito Cantarell FiraGO EB Garamond Gentium Lato Linux Libertine、Noto Sans Noto Serif Open Sans Yrsa など
  3. ^ Chrome Firefox Falkonなど
  4. ^ LibreOffice Writerなど
  5. ^ Adob​​e InDesignScribusなど
  6. ^ a b◌̫ ⟩ と ⟨ ◌᫇ ⟩ は伝統的にオメガとして表記されます。
  7. ^ ͺ ⟩ は通常の下付き文字よりも下に配置されます。これは、スペースに下付き文字 ⟨ ◌ͅ ⟩を付けるのと同じです
  8. ^上付き文字 ⟨ ç ⟩ は、上付き文字c結合セディラで構成されており、適切なフォントであれば正しく表示されるはずです。上付き文字 c は、Unicode提案 L2/03-180 において、この目的のために特に要請されました。
  9. ^ U+02E4 ˤ修飾文字(小文字)逆グロッタルストップは、 U+0295 ʕラテン文字(咽頭有声摩擦音)の上付き文字であり、IPA用に定義されています。類似の文字であるU+02C1 ˁ修飾文字(小文字)逆グロッタルストップは、 U+02C0 ˀ修飾文字(小文字)逆グロッタルストップを反転したもので、おそらく逆疑問符を消したものでしょう。フォントによって見た目が異なるかどうか、またその違いが何なのかは異なります。
  10. ^ Microsoft フォントでは、上付き文字 ⟨ ɫ ⟩ が誤って上付き文字 ⟨ ⟩ として設計されていました。
  11. ^ U+A71D ⟨ ⟩ と A71E ⟨ ⟩ は、IPA文字 ⟨ downstepと ⟨ upstepのアフリカニスト等価文字として採用されました。U+A71D ⟨ ⟩ とIPAクリック文字 ⟨ ǃ ⟩の対応は偶然の産物です。偶然にも、U+A71E ⟨ ⟩ はextIPA打楽器音 ¡ ⟩ の上付き文字として機能します。その他の打楽器音文字 ⟨ ʬ ⟩ と ⟨ ʭ ⟩ は、Unicodeでは上付き文字をサポートしていません。
  12. ^ U+1D4CMODIFIER LETTER SMALL TURNED OPEN EU+1D9FMODIFIER LETTER SMALL REVERSED OPEN Eは、前者はU+1D08LATIN SMALL LETTER TURNED OPEN Eの修飾子バリアントとして名前が付けられているにもかかわらず、両方とも Unicode プロパティで修飾子U+025C ɜ LATIN SMALL LETTER REVERSED OPEN Eとして誤って定義されてい
  13. ^これは実際にはベトナム語の発音区別符号 dấu hỏi であり、IPA とは明確に異なりますが、図的にはどちらも疑問符が消えたものです。

参考文献

  1. ^ a b c「UCD: UnicodeData.txt」 . Unicode標準. 2016年5月14日閲覧
  2. ^ a b Dürst, Martin; Freytag, Asmus (2007年5月16日). 「XMLおよびその他のマークアップ言語におけるUnicode」 . W3C . 2010年9月13日閲覧
  3. ^ "fraction | Dart Package" . Dartパッケージ. 2021年12月27日. 2022年9月21日閲覧
  4. ^ “MathML | 一般的なレイアウト要素 | 分数” . data2type GmbH (ドイツ語). 2021年3月30日. 2021年1月28日時点のオリジナルよりアーカイブ2022年1月13日閲覧。
  5. ^マーティン・デュルスト;アスムス、フライタグ(2007 年 5 月 16 日)。「分数スラッシュ」。 W3C 2010 年9 月 13 日に取得
  6. ^ a b c d e f g「Unicodeの暫定割り当てコードポイントの追加草案レパートリー」(PDF) Unicodeコンソーシアム2024年11月26日。
  7. ^ 「UTC会議181の承認議事録」 Unicodeコンソーシアム2025年1月27日。 2025年3月8日閲覧
  8. ^ 「UCD: Scripts.txt」 . Unicode標準. 2022年9月21日閲覧
  9. ^エバーソン、マイケル、ウェスト、アンドリュー(2020年10月5日)。「L2/20-268:UCSに中英語の10文字を追加する改訂提案」(PDF)
  10. ^ Kirk Miller & Michael Ashby、 L2/20-253R Unicode による IPA 修飾文字 (b)、非肺動脈弁の要求。
  11. ^カーク・ミラー & マイケル・アシュビー、 L2/20-252R IPA修飾語文字(a)、肺動脈弁に関するUnicode要求
  12. ^カーク・ミラー (2024年1月30日). 「L2/24-081: ラテン語音声のTheによる中級ティルデ」(PDF) .
  13. ^シルバ、エドゥアルド・マリン (2017 年 3 月 1 日)。「L2/17-066R: マルカ レジストラーダ記号をエンコードする提案」(PDF)