| 文字鏡今昔文字鏡今昔文字鏡 | |
|---|---|
| 開発者 | 石川忠久(いしかわただひさ)古家時雄(古家時雄)文字鏡研究所(文字鏡研究会) |
| 初回リリース | 1.0 / 1997年7月 (1997-07年) |
| 最終リリース | 4.0 / 2018年12月15日 ( 2018-12-15 ) |
| オペレーティング·システム | マイクロソフトウィンドウズ |
| サイズ | 51MB |
| 入手可能な | 日本語 |
| タイプ | フォントと文字マップがバンドルされた文字セット |
| ライセンス | 独自の |
| Webサイト | 文字京 |
文字鏡(もじきょう)、中国語、日本語、韓国語、ベトナム語のChữ Nôm、その他の歴史的中国語表語表記システムで使用される文字の完全なインデックスを提供するために作成された文字エンコード方式です。この文字セットを公開した文字鏡研究会(もじきょうけんきゅうかい)は、この文字セットに付随するコンピュータソフトウェアとTrueTypeコンピュータフォントも公開しました。石川忠久(いしかわただひさ)が会長を務める文字鏡研究会は、[1 ]当初、文字セットと関連ソフトウェアおよびデータを紀伊国屋書店で販売されたCD-ROMで再配布していました。 [ 2 ]
1996年に構想され、[ 3 ] CD-ROMの最初のバージョンは1997年7月にリリースされました。[ 4 ]文字鏡研究所は、一時期、「文字鏡WEB」と呼ばれる、より最新の文字を掲載したウェブサブスクリプションも提供していました。[ 5 ]
2006年9月現在、Mojikyoは174,975文字をエンコードしています。[ 6 ]そのうち、150,366文字(≈86%)は拡張中国語・日本語・韓国語・ベトナム語(CJKV)[注 2 ]ファミリーに属していました。[ 5 ] Mojikyoの文字の多くは廃止または不明瞭であると考えられており、最も広く使用されている国際的なテキストエンコード標準であるUnicodeを含む他の文字セットではエンコードされていません。
文字響研究所は、2015年に亡くなった開発者の一人、古家時雄氏を追悼するため、2015年から最新リリースをフリーウェアとしてインターネットアーカイブにアップロードし始めた。[ 7 ] [ 3 ] 2018年12月15日にはバージョン4.0がリリースされた。翌日、石川氏は古家氏の死後、これが文字響の最終リリースとなると発表した。[ 3 ]
文字鏡エンコードは、中国語、日本語、韓国語の表記体系とベトナム語のChữ Nôm表語文字で使用される文字の完全なインデックスを提供するために作成された。また、甲骨文字、篆書体、サンスクリット(Siddhaṃ )などの古代文字の多数の文字をエンコードする。多くの文字にとって、文字エンコードは唯一の文字エンコードであり、そのデータはしばしばUnicode提案の出発点として使用される。[ 8 ] [ 9 ]しかし、文字鏡はエンコードに関してUnicodeよりはるかに緩い基準を持っているため、文字鏡には、起源が疑わしい、または意図せずに架空のグリフが多数エンコードされている。[ 10 ] [ 11 ]そのため、多くの非Unicode文字鏡文字はUnicodeへの追加に適しているが、それぞれで必要な証拠の基準が異なるため、すべてがUnicode文字になるわけではない。
Mojikyōフォント(文字鏡フォント)は、ZIPファイルで提供されるTrueTypeフォントで、それぞれ約2~5MBの大きさです。フォントによって文字数は異なります。[注 3 ]また、グラフィカルな文字マップ「Mojikyō Character Map」(文字鏡MAP)を実装したWindows実行ファイル( MOCHRMAP .EXE )も含まれています。[注 4 ] [注 5 ] MOCHRMAP.EXEを使用すると、 Mojikyōフォントを閲覧し、キーボードで入力する代わりに文字をコピー&ペーストすることができます。TrueTypeフォントをサポートする通常のWindows文字マップやKCharSelectとは異なり、MOCHRMAP.EXEは、要求された文字の番号付きMojikyōエンコーディングスロットを表示します。 [ 12 ] [注 6 ] MOCHRMAP.EXEが動作するには、すべてのMojikyōフォントがインストールされている必要があります。[注 7 ]
文字鏡でエンコードされた文字を参照する場合、MXXXXXXという形式がよく用いられます[ 13 ]。これはUnicodeで用いられるU+XXXX形式に似ています。ただし、文字鏡のエンコードは10進数で表示されるのに対し、UnicodeのU+エンコードは16進数で表示されるという違いがあります。
文字鏡はUnicodeの黎明期から、この規格に影響を与え、また影響を受けてきました。文字鏡由来のグリフは、UnicodeのすべてのCJKブロックの保守を担当するIdeographic Rapporteur Group (IRG) [ note 8 ]への提案書の中で初めて2002年4月18日に登場しました[ 14 ] [ 15 ] [ 16 ] 。 2007年5月、文字鏡はUnicodeで西夏文字をエンコードするための一連の提案書において、最終的に成功を収める小さな役割を果たしました[ 17 ] [ note 9 ]。 2002年10月までに、文字鏡はすでに6,000の西夏文字をエンコードしていました[ 6 ]
Unicode 標準の Unihan データベースでは、文字鏡を「Japanese KOKUJI Collection」 (日本国字集)、[ 18 ]略称「JK」と呼んでいます。[ 19 ] [ 20 ]たとえば、U+2B679 𫙹 CJK UNIFIED IDEOGRAPH-2B679 [注 10 ]日本語ではburizādo (ブリザード、文字通り「ブリザード」 )と読まれる表意文字は、JK-66038 と同等の J-Source [注 11 ]を持っています。 JK 接頭辞 J-Source を持つすべての Unicode 文字は、Mojikyoに由来します。[ 21 ] [注 12 ]文字符号化および東アジア言語の専門家であるケン・ルンデによると、 Unicode 13.0の時点で、Unicodeの782の表意文字は文字鏡に由来しており、2つのブロックにほぼ均等に分かれています。CJK統合表意文字拡張Cが367、CJK統合表意文字拡張Eが415です。[ 20 ] [ 22 ]文字鏡由来のUnicode文字(JKで始まるJ-Sources)のすべてが、コードチャートで文字鏡フォントと同じ代表グリフを持っているわけではありません。[注 13 ]調査により、文字鏡協会によって割り当てられた形状が間違っていたことが判明したため、一部の文字は最終的な符号化の前に形状が変更されました。[ 11 ] [注 14 ]
2006年9月時点で、文字体系は174,975文字をエンコードしています。[ 6 ]そのうち150,366文字は拡張CJKV [注2 ]ファミリーに属しています。[ 5 ]エンコードされた文字の多くは廃止文字または難解文字とみなされており、国際標準であるUnicodeを含む他の文字セットではエンコードされていません。文字体系の各文字には固有の番号が付与され、文字はブロックに編成されています。
文字鏡では、CJKVの文字は伝統的な康熙部首に基づいて異なるブロックに分割されます。特に字数の多い部首、例えば9(人)や162( ⻌)などは、筆順によってさらに分割されます。 [注 15 ]
Unicode とは異なり、Mojikyo では意図的に漢字の統一を避けています。エンコードをコンパクトにする試みは行われておらず、Unicode のように U+FFFF 未満のすべての共通文字を保持する試みも行われていません。
一方、Unicodeでは、CJKをその一般的度に基づいてブロックに分類しています。最も一般的なものは一般的に基本多言語面に配置され、[注14 ]まれまたは不明瞭なものは補足面に配置されます。
文字鏡は、制限的なライセンスの下でプロプライエタリソフトウェアとして利用されている。当初、文字鏡協会は文字データの利用を阻止しようとし、文字セットとの変換表を公開した者を脅迫した。2010年7月、文字鏡協会は、少なくとも1人の日本人ユーザーが変換表を公開したり、文字鏡でエンコードされた文字をUnicodeや他の文字セットに変換したりするのを阻止するための法的努力を断念した。 [ 23 ]文字の形状を含む単なるデータは、独創性の基準を満たさないため、多くの法域で共有財産とみなされている。 [注 16 ]
しかし、この遺産のため、グリフウィキは2020年時点で文字鏡データを禁止しました。 [ 24 ]
文字鏡研究会の関係者に聞いたところ、オランダから提案されたWG2 N36981には文字鏡のフォントが使用されているが、文字鏡研究会は関与しておらず、内容提案についても疑問があるとのことであった。門司教研究所自体はこの提案には関与していない。さらに、その提案の内容の一部については疑問を抱いている。]
しかし、拡張Cの標準化作業が8年の長期期間、また事後的に用例が必須とされたため、正式に公開された拡張C漢字の典拠は初期の典拠とはかなり異なるものとなっている。 [ CJK Unified Ideographs Extension Cの標準化の取り組みには 8 年という長い年月がかかり、エンコード後に漢字の例が要求されてきたため、正式に公布された Extension C の漢字標準は元の標準とはかなり異なります。例えば、私たち日本政府は、当初、文字響協会が選定した約1,000字の漢字を申請しました。[...] 漢字の検証は文字響協会とは独立して行われたため、文字の形は、同じコードポイントの文字響のバージョンとは頻繁に変更されました。
N895-Japan_C1
今昔文字鏡およびその関連製品、データは、そのライセンス上グリフウィキには配置することができませ
ん
。そのため、上記の GlyphWiki ライセンスと互換性がありません。 GlyphWiki にデータを入力する際には、
文字協
エンコード スロットの番号、
文字協
の
フォント内のグリフ自体の外観、
文字協
製品を参照することによって収集されたと判断できるいかなる情報も
使用することはできません。
文字京
データは絶対に受け入れられません
。ご協力お願い致します。】
kIRG_JSource