真に大数の法則とは、統計学において、十分に大きな数の独立した標本が与えられた場合、極めて起こりそうにない結果(すなわち、標本全体を通して常に低いがゼロではない確率を持つ事象)は起こりやすいという法則である。これは数学的な法則ではなく、口語的な表現である。[ 1 ]この法則は、疑似科学的な主張を反駁するために用いられてきた。[ 2 ]
この観察は、統計学者のペルシ・ディアコニスとフレデリック・モステラーによるものです。[ 1 ]懐疑論者でマジシャンのペン・ジレットも同様に、ニューヨーク市の約800万人の住民の間で「100万分の1の確率が1日に8回起こる」と述べています。[ 3 ]もう一つの例示的な事例(これも組み合わせ論に関係します)では、宝くじの抽選番号が近い順番、あるいは連続して重複していることがあります。[ 4 ] [ 5 ] [ 6 ]

ある事象が1回の試行で発生する確率がわずか1%だとします。すると、1回の試行では、事象が発生しない確率は99%になります。しかし、独立した試行を100回行った場合、そのうちの1回でも事象が発生しない確率は です。[ 7 ]したがって、100回の試行のうち少なくとも1回で発生する確率は です。試行回数を1,000回に増やすと、その確率は まで上昇します。言い換えれば、非常に起こりにくい事象でも、十分な数の独立した試行があれば、発生する可能性が非常に高いということです。
同様に、 1回の試行で「10億分の1」の確率で発生するイベントの場合、10億回の独立した試行で少なくとも1回発生する確率は です。80億回(2022年時点の地球上の人口のおおよその数)のような「真に大規模な」独立した試行回数では、この値は に上昇します 。[ 8 ]
これらの計算は数学的な言葉で次のように定式化できる。「Nが本当に大きい場合、1回の試行でXという事象が発生する確率がどれだけ小さくても、N回の独立した試行でXという事象が発生する確率は1に任意に近づく可能性がある。」[ 9 ]
たとえば、起こりそうにない事象 X の確率が小さな定数ではなく、N の関数として減少する場合は、グラフを参照してください。
高可用性システムでは、非常に起こりそうにないイベントも考慮する必要があり、直列システムでは、単一要素の障害確率が非常に低くても、それらを多数接続すると、システム全体の障害確率が上昇します(システム障害の可能性を低くするために冗長性を使用することができます。このような並列システムでは、信頼性の低い冗長部品を多数接続しても、故障しない確率が要求される高いレベルまで上昇します)。[ 10 ]
この法則は疑似科学批判の際に提起され、ジーン・ディクソン効果(後付け予測も参照)と呼ばれることもあります。これは、霊能者が予言を多くすればするほど、そのうちの一つが「当たる」確率が高くなるというものです。つまり、もし一つでも当たれば、霊能者は起こらなかった大部分のことを私たちが忘れるだろうと期待しているのです(確証バイアス)。[ 11 ]人間もこの誤謬に陥りやすいのです。
この法則のもう一つの類似した現れはギャンブルにも見られる。ギャンブラーは勝ちは覚えているが負けは忘れる傾向がある[ 12 ]が、後者が前者をはるかに上回っていても(ただし、人によっては、プレイシステムを微調整するために負けをもっと分析する必要があると考える場合は逆のことも起こりうる[ 13 ] )。ミカル・オースヴェドはこれを「選択的記憶バイアス」と結び付け、ギャンブラーが実際の勝ち(または逆の場合は負け - 「どちらの方向への選択的記憶バイアス」 )を過大評価することでギャンブルの結果から精神的に距離を置くことを可能にするとしている[ 13 ] 。