| シリーズの一部 |
| 言語学 |
|---|
形態素とは、言語表現、特に単語の中で意味を持つ最小の構成要素のことです。[ 1 ]多くの単語はそれ自体が独立した形態素ですが、複数の形態素を含む単語もあります。言語用語では、これらはそれぞれ自由形態素と束縛形態素に区別されます。形態素を専門とする言語学の研究分野は形態論と呼ばれます。
英語では、複数の形態素を含む単語の中で、その単語の基本的な意味を与える主要な形態素は語根(例えば、catsという単語の中のcat)と呼ばれ、これは束縛されることも自由になることもあります。一方、接辞と呼ばれる追加の束縛形態素は、語根の前後に追加されることがあります。例えば、catsの-sは複数形を示しますが、常に語根名詞に束縛されており、それ自体では単語とはみなされません。[ 2 ]しかし、英語やラテン語など、一部の言語では、多くの語根でさえ単独では存在できません。つまり、それらは束縛形態素です。例えば、ラテン語の語根reg-(「王」)には、常に格マーカーを接尾辞として付けなければなりません。例えば、 regis、regi、rex(reg+s )などです。英語の語根nat(e)についても同様です。これは最終的に「誕生、生まれた」を意味するラテン語の語根から受け継がれ、native、nation、nature、innate、neonateなどの単語に現れます。
これらの英語の単語のサンプルには、次のような形態素解析があります。
すべての形態素は自由形態素と束縛形態素に分類できる。[ 4 ]
束縛形態素はさらに派生形態素と屈折形態素に分類できます。これらの主な違いは、単語に対する機能です。
異形態とは、形態は異なるものの、意味的には類似した形態素の異形です。例えば、英語の複数形マーカーには、/-z/ ( bug s )、/-s/ ( bat s )、または/-ɪz, -əz/ ( bus es ) という3つの異形態があります。異形態とは、抽象的な単位である形態素が具体的に実現されたものです。これは、異音と音素の関係に似ています。
ゼロ形態素とは、意味的意味を持つものの、聴覚音素では表されない形態素の一種である。ゼロ形態素を持つ単語は、文法的にはその形態素を持つと分析されるが、音声ではその形態素は実現されない。注釈の中では、/ ∅ /で表されることが多い。[ 7 ]
一般的に、このような形態素は目に見える変化を示さない。例えば、sheep はその名詞の単数形と複数形の両方である。しかし、通常の複数形接尾辞-sを用いて仮説的な*sheepsを形成するのではなく、複数形はsheep + -∅(空複数接尾辞)として分析される。したがって、意図された意味は共起限定詞(この場合は「some-」または「a-」)から導き出される。[ 8 ]
場合によっては、ゼロ形態素は、可聴形態素を含む他の語形変化形と対比するために用いられることもあります。例えば、英語の複数名詞「cats」は、語根「cat」と複数接尾辞「-s」で構成されており、単数形「cat」は、語根「cat」に単数形接尾辞「-∅」が付加された語根として分析されることがあります。[ 9 ]
内容形態素は具体的な意味や内容を表し、機能形態素はより文法的な役割を持ちます。例えば、「fast」や「sad」といった形態素は内容形態素とみなすことができます。一方、接尾辞「-ed」は過去形を表すという文法的な機能を持つため、機能形態素です。
どちらのカテゴリーも非常に明確で直感的に思えるかもしれないが、その背後にある考え方は、互いに重複しているため、理解するのが難しい場合がある。[ 10 ]曖昧な状況の例としては、前置詞overと限定詞yourがあり、これらは具体的な意味を持っているように見えるが、アイデアを文法的に結びつける役割があるため、機能形態素と見なされる。[ 11 ]形態素のカテゴリーを決定する一般的なルールは以下のとおりである。
語根は1つの形態素のみで構成されますが、語幹は複数の形態素で構成される場合があります。追加の接辞も形態素とみなされます。例えば、quirkinessという単語では、語根はquirkですが、語幹はquirkyであり、これは2つの形態素から構成されます。
さらに、音韻形態は同一でありながら意味が異なる接辞のペアも存在します。例えば、接尾辞-erは派生語(例: sell ⇒ seller)にも屈折語(例:small ⇒ smaller )にもなります。このような形態素は同音異義語と呼ばれます。[ 11 ]
複数の形態素で構成されているように見える単語もありますが、実際にはそうではありません。したがって、形態素を識別する際には、形式だけでなく意味も考慮する必要があります。例えば、「マダガスカル」という単語は長く、mad、gas、carなどの形態素で構成されているように見えますが、実際にはそうではありません。逆に、短い単語の中には複数の形態素で構成されているものもあります(例:dogs = dog + s)。[ 11 ]
日本語、中国語、その他の言語における自然言語処理において、形態素解析とは、文を形態素の列に分割する処理です。形態素解析は品詞タグ付けと密接に関連していますが、これらの言語では単語の境界が空白で示されないため、単語分割が必要となります。[ 12 ]
形態素解析の目的は、類似した形態の比較によって言語の意味の最小単位(形態素)を決定することです。例えば、「彼女は歩いている」と「彼らは歩いている」を、どちらかを「あなたは読んでいる」のような類似性の低い形態と比較するのではなく、互いに比較します。これらの形態は効果的に部分に分解することができ、異なる形態素を区別することができます。
形態素の識別においては、意味と形態の両方が同様に重要である。行為主体形態素とは、英語では-erのような接辞で、動詞を行為主体名詞に変換する(例:teach → teacher)。英語には、発音(および書き言葉)は同一だが意味と機能が異なる形態素も存在する。それは、形容詞の肯定形を別の比較級に変化させる(ただし、形容詞自体は同じ)比較形態素である(例:small → smaller)。逆の場合もあり、意味は同じだが形態が異なる形態素のペアが存在する。[ 11 ]
生成文法では、形態素の定義は、統語木の葉が形態素であるか、それとも素性であるかによって大きく異なります。
形態素を「意味のある最小単位」と定義することを踏まえ、ナノシンタックスでは、統語木全体が「意味のある最小単位」を構成するような慣用句を記述することを目指しています。例えば、 「Don't let the cat out of the bag(猫を袋から出さないで)」という慣用句があります。この慣用句は「let the cat out of the bag(猫を袋から出さないで)」という単語で構成されています。これは意味的形態素とみなされる可能性があり、意味的形態素自体も多くの統語的形態素で構成されています。「意味のある最小単位」が単語よりも長い例としては、「in view of(~を見つめて)」や「business intelligence(ビジネスインテリジェンス)」などがあり、これらの単語を組み合わせることで特定の意味を持ちます。
形態素の定義は、以下の理論的構成における生成文法のインターフェースにおいても重要な役割を果たします。