統計学者 ジョン・テューキー[1] [2]が定義した不快な科学とは、限られたデータサンプルから推論を導き出す必要があり、同じ原因システムの影響を受けたさらなるサンプルが利用できない状況を指します。より具体的には、探索的データ分析と検証的データ分析の両方に共通のデータサンプルを使用するという問題を克服することが困難な、有限の自然現象の分析が含まれます。 これは、データによって示唆される仮説を検証することにより、体系的なバイアスが生じる危険性につながります
典型的な例はボーデの法則で、これは太陽系の惑星の太陽からの距離に関する簡単な数値法則を提供します。さまざまな法則を観測データと試行錯誤でマッチングさせることで法則が導き出されると(探索的データ分析)、その仮説を厳密かつ独立にテストする(確認的データ分析) のに十分な数の惑星が残っていません。自然現象は調べ尽くされました。データと数値法則が一致することは驚くべきことではありません。なぜなら、データに一致する法則を意図的に選択したからです。ボーデの法則が惑星分布の原因システムについて教えてくれることに関心があるのであれば、他の惑星系に関するよりよい情報が得られるまでは確認できないであろう確認を求めます。
参照
参考文献
- Diaconis, P. (1985). 「データ分析の理論:魔法的思考から古典的統計まで」Hoaglin, DC; et al. (編). 『データテーブルの探究:傾向と形状』Wiley. ISBN 0-471-09776-4。
参考文献
- ^ Norel, R.; Rice, JJ; Stolovitzky, G. (2011). 「自己評価の罠:私たちは皆、平均よりも優れていることができるのか?」. Molecular Systems Biology . 7 : 537. doi :10.1038/msb.2011.70 . PMC 3261704. PMID 21988833
- ^ Hoaglin, DC; et al. (eds.). 『データテーブルの傾向と形状の探究』Wiley. ISBN 0-471-09776-4科学の多くは、ジョン・テューキーの「不快な科学」というレッテルにも当てはまります。
なぜなら、実際の繰り返しは実現不可能または実用的ではないからです。