簡潔法

言語学において、簡潔法則ジップの省略法則とも呼ばれる)は、単語の使用頻度が高いほどその単語は短くなる傾向があり、その逆もまた同様であり、単語の使用頻度が低いほどその単語は長くなる傾向があることを定性的に述べる言語法則である。[ 1 ]これは、自然言語やその他の自然システムに見られる統計的な規則性であり、一般的な規則であると主張している。

簡潔性の法則は、 1945年に言語学者ジョージ・キングズリー・ジップによって、単語の出現頻度と単語の長さの間に逆相関があるという逆相関関係として初めて提唱されました。彼はアメリカ英語文書コーパスを分析し、出現頻度が増加するにつれて、平均音素数で表した平均長が短くなることを示しました。同様に、ラテン語のコーパスでは、単語の音節数と出現頻度の間に逆相関があることを発見しました。この観察は、言語において最も頻繁に使用される単語が最も短いことを示しています。例えば、英語で最も一般的な単語は、the、be(様々な形)、to、of、aであり、いずれも1~3個の音素を含みます。彼は、この省略の法則は言語の普遍的な構造的特性であり、正確かつ効率的にコミュニケーションをとろうとする競合するプレッシャーの下で、個人が形態と意味のマッピングを最適化した結果として生じると仮説を立てました。[ 2 ] [ 3 ]

それ以来、この法則は、書かれた単語の文字数とテキスト中の頻度の関係について、 80の異なる言語族のほぼ1000の言語で経験的に検証されてきました。[ 4 ]簡潔性の法則は普遍的であるように見え、単語の長さを単語の長さで測定したときに音響的にも観察されています。[ 5 ] 2016年の証拠は、この法則が他の霊長類の音響コミュニケーションにも当てはまることを示唆しています。[ 6 ]

Brown Corpus における単語長 (文字数) の関数としての 100 万語あたりの単語数の対数。Zipf の簡潔性の法則を示しています。

この統計パターンの起源は最適化の原理に関連しており、生産コストを削減する圧力と伝達の成功率を最大化する圧力という2つの主要な制約条件の調停によって導き出されたものと思われます。この考え方は、効率性は抵抗、つまり「努力」が最も少ない道を選択するという最小努力の原理と密接に関連しています。生産コストを削減するというこの原理は、情報理論における最適データ圧縮の原理とも関連している可能性があります。[ 7 ]

動物では

クジラの発声サンプルを分析したところ、研究対象となった5種のクジラのうち2種に、ジップの省略法則に従う分布を示す繰り返し音素が含まれていることがわかった。[ 8 ]

参照

参考文献

  1. ^ Zipf GK. 1949 人間の行動と最小努力の原理. ケンブリッジ、マサチューセッツ州: Addison-Wesley
  2. ^ Zipf GK. 1935 『言語の心理生物学:動的文献学入門』ボストン、マサチューセッツ州:ホートン・ミフリン
  3. ^ Zipf GK. 1949 人間の行動と最小努力の原理. ケンブリッジ、マサチューセッツ州: Addison-Wesley
  4. ^ Bentz C, Ferrer-i-Cancho R. 2016 普遍言語としてのZipfの法則。テュービンゲン大学図書館。
  5. ^ Tomaschek F, Wieling M, Arnold D, Baayen RH. 2013. 音声生成における単語頻度、母音長、母音品質:経験の重要性に関するEMA研究. 第14回国際音声コミュニケーション協会年次会議 (INTERSPEECH 2013) 議事録, フランス・リヨン, 8月25~29日 (F Bimbot 他編), pp. 1302~1306
  6. ^ Gustison ML, Semple S, Ferrer-i-Cancho R, Bergman TJ. 2016 ゲラダガモの発声シーケンスはメンゼラートの言語法則に従う. Proc. Natl Acad. Sci. USA 113, E2750-E2758
  7. ^ Kanwal J, Smith K, Culbertson J , Kirby S. 2017 「ジップの略語の法則と最小努力の原則:言語使用者は効率的なコミュニケーションのためにミニチュア語彙集を最適化する」認知 165, 45–52. ( doi : 10.1016/j.cognition.2017.05.001 )
  8. ^ Youngblood, Mason (2025-02-05). 「クジラコミュニケーションにおける言語的効率性」 . Science . 11 (6) eads6014. Bibcode : 2025SciA...11S6014Y . doi : 10.1126/sciadv.ads6014 . PMC 11797547. PMID 39908378 .