
| シリーズの一部 |
| 研究 |
|---|
| 哲学ポータル |
実験とは、仮説を支持または反証するため、あるいはこれまで試みられていない事柄の有効性や可能性を判断するために行われる手順です。実験は、特定の要因を操作した場合にどのような結果が生じるかを示すことで、因果関係についての洞察を提供します。実験の目的や規模は多岐にわたりますが、常に再現可能な手順と結果の論理的な分析に基づいています。また、 自然実験研究も存在します。
子供は物が地面に落ちる仕組みを理解するために基礎実験を行う一方、科学者のチームはある現象への理解を深めるために何年もかけて体系的な調査を行うことがあります。実験やその他の実践的な活動は、理科の授業における生徒の学習にとって非常に重要です。実験は、特に時間をかけて行う場合、テストの点数を上げ、生徒が学習内容にさらに熱心に取り組み興味を持つのに役立ちます。[ 1 ]実験は、個人的で形式張らない自然な比較(例えば、お気に入りを見つけるために様々なチョコレートを味見する)から、高度に管理された実験(例えば、多くの科学者が監視する複雑な装置を必要とし、亜原子粒子に関する情報の発見を目指すテスト)まで多岐にわたります。実験の用途は、自然科学と人文科学とで大きく異なります。
実験には通常、単一の独立変数以外の変数の影響を最小限に抑えるように設計されたコントロールが含まれます。これにより、多くの場合、コントロール測定と他の測定との比較を通じて、結果の信頼性が向上します。科学的コントロールは科学的方法の一部です。理想的には、実験におけるすべての変数はコントロールされ(コントロール測定によって説明され)、コントロールされていない変数は存在しません。このような実験において、すべてのコントロールが期待通りに機能する場合、実験は意図したとおりに機能し、結果はテストされた変数の影響によるものであると結論付けることができます。
科学的方法において、実験とは競合するモデルや仮説を調停する経験的手順である。[ 2 ] [ 3 ]研究者は既存の理論や新しい仮説を検証し、それらを支持または反証するために実験を使用する。[ 3 ] [ 4 ]
実験は通常、特定のプロセスや現象がどのように機能するかについての期待である仮説を検証するものです。しかし、実験は、実験によって何が明らかになるかについて具体的な期待を持たずに「もし~だったら」という問いに答えること、あるいは以前の結果を確認することを目的とする場合もあります。実験が慎重に行われれば、結果は通常、仮説を支持するか反証するかのいずれかになります。科学哲学の一部によれば、実験は仮説を「証明」することはできず、支持を加えることしかできないとされています。一方、反例を提供する実験は理論や仮説を反証することはできますが、理論は簡潔さを犠牲にして、適切なアドホックな修正を加えることで常に救済することができます。
実験では、交絡因子(実験の精度や再現性、あるいは結果の解釈能力を損なう可能性のあるあらゆる因子)も管理する必要があります。交絡因子は通常、科学的な管理や、ランダム化実験においてはランダム割り当てによって排除されます。
工学および物理科学において、実験は科学的手法の主要な構成要素です。実験は、特定の条件下での物理的プロセスがどのように機能するかに関する理論や仮説を検証するために用いられます(例えば、特定の工学プロセスが目的の化合物を生成できるかどうかなど)。これらの分野における実験は通常、同一の手順を反復して行い、反復ごとに同一の結果が得られることを期待します。ランダム割り当ては一般的ではありません。
医学と社会科学において、実験研究の普及度は分野によって大きく異なります。しかし、実験が用いられる場合、通常は臨床試験の形式をとります。臨床試験では、実験単位(通常は個々の人間)がランダムに治療群または対照群に割り当てられ、1つ以上の結果が評価されます。[ 5 ]物理科学における標準とは対照的に、焦点は通常、平均的な治療効果(治療群と対照群の結果の差)または実験によって得られる他の検定統計量に置かれます。 [ 6 ]単一の研究では通常、実験の反復は行われませんが、個別の研究がシステマティックレビューやメタアナリシスを通じて集約される場合があります。
科学の各分野における実験の実践には、様々な違いがあります。例えば、農業研究ではランダム化実験(例えば、異なる肥料の有効性を比較試験するため)が頻繁に用いられますが、実験経済学では、個人を治療条件と対照条件にランダムに割り当てることなく、理論化された人間の行動を実験的に検証することがよくあります。
ダニエル書1章12-16節の記述は、古代文献における比較試験の最も初期の記述の一つであると、多くの学者が指摘しています。物語の中で、ダニエルとその仲間たちは10日間の試験を申請し、その間、自分たちは野菜と水だけを摂取し、他の若者たちは王の食事療法を続けます。二つの食事療法の結果が比較され、家令は観察された結果に基づいて行動するよう指示されます。[ 7 ] [ 8 ]
科学史家たちは、この一節を経験的推論の初期の文学的例として時折言及してきた。デイビッド・C・リンドバーグは、ヘブライ語聖書には「経験的テストに似た手順」が含まれており、ダニエル書1章は競合する条件を評価するために意図的に試験が計画された例の一つであると指摘している。[ 9 ]ジェームズ・C・ヴァンダーカムも同様に、このエピソードを、制御された状況下で2つの食事を比較する「初歩的な実験設計」を示していると述べている。[ 10 ]この見解は普遍的ではないが、一部の評論家は、このエピソードを記録に残る最も初期の実験テストの一つと呼んでいる。[ 11 ]
現代的な意味での実験への最初の方法論的アプローチの一つは、アラブの数学者であり学者でもあるイブン・アル=ハイサムの著作に見ることができる。彼は光学分野における実験(プトレマイオスの著作における光学的・数学的問題に遡る)において、自己批判性、実験の目に見える結果への依存、そして先行する結果に関する批判性といった要素に基づいて実験を制御しながら行った。彼は結果を得るために帰納的実験的手法を用いた最初の学者の一人でした。[ 12 ]彼は著書『光学の書』の中で、実験的な意味での知識と研究への根本的に新しいアプローチについて述べている。
つまり、私たちはその原理と前提への探究を再開すべきであり、まず存在するものの観察と可視物体の状態の調査から始めるべきである。個々の特性を区別し、視覚が生じる際に目に関係するものと、感覚の様式において均一で不変で明白であり、疑いの余地がないと見出されるものを帰納的に集めるべきである。その後、私たちは探究と推論において、前提を批判し、結論に関しては慎重に行動しながら、徐々に秩序立てて昇華していくべきである。私たちが検査と検討の対象とするすべてのものにおいて、私たちの目標は、偏見に囚われることなく正義を尽くすこと、そして、私たちが判断し批判するすべてのものにおいて、真実を求め、意見に左右されないよう注意することである。このようにして、私たちは最終的に心を満足させる真実に到達し、徐々に、そして慎重に、確信が現れる終着点に到達するであろう。そして、批判と慎重さを通して、意見の相違を払いのけ、疑念を解決する真実を掴むことができるであろう。それでもなお、私たちは人間の本性である人間的な濁りから逃れることはできません。しかし、私たちは人間として持てる力で最善を尽くさなければなりません。私たちはすべてのことにおいて神から支えを得ているのです。[ 13 ]
彼の説明によれば、人間の本性に起因する結果の主観性と感受性を考慮した、厳密に管理された試験実施が必要である。さらに、先行研究者による結果と成果に対する批判的な見解も必要である。
したがって、科学者の著作を研究する者は、もし真理の探求が目的であるならば、自分が読むものすべてに敵対し、その内容の核心と周辺にまで心を集中させ、あらゆる側面から攻撃する義務がある。また、批判的に検討する際には、偏見や寛大さに陥らないよう、自らを疑うべきである。[ 14 ]
したがって、客観的な実験を行うには、以前の結果と実験結果の比較が不可欠であり、目に見える結果の方が重要です。結局のところ、これは実験研究者が、特にそれらの結果が実験的なものではなく、論理的/精神的な導出によるものである場合、従来の見解や結果を捨て去る勇気を持つ必要があることを意味するかもしれません。この批判的考察のプロセスにおいて、研究者自身も「偏見」や「寛大さ」によって主観的な意見に陥りがちであり、したがって仮説構築の方法について批判的になる必要があることを忘れてはなりません。
17世紀に活躍したイギリスの哲学者であり科学者であったフランシス・ベーコン(1561–1626)は、イギリス・ルネサンス期において実験科学の有力な支持者となった。彼は、イブン・アル=ハイサムに類似した演繹によって科学的問いに答える方法に反対し、それを次のように記述した。「人はまず自らの意志に従って問いを定め、次に経験に頼り、それを自らの思惑に従わせ、まるで行列の捕虜のように引きずり回すのだ。」[ 15 ]ベーコンは、反復可能な観察、つまり実験に基づく方法を求めた。注目すべきことに、彼は今日私たちが理解しているような科学的方法を初めて体系化した。
単純な経験が残る。それは、そのまま受け取れば偶然と呼ばれ、追求すれば実験と呼ばれる。真の経験方法は、まずろうそく(仮説)に火をつけ、次いでろうそくによって道を示す(実験を準備し、範囲を定める)。経験は、適切に整理され、消化され、不器用で一貫性のないものでなければならない。そして、そこから公理(理論)を導き出し、確立された公理から新たな実験を生み出す。[ 16 ] : 101
その後の数世紀にわたり、様々な分野で科学的手法を応用した人々が重要な進歩と発見を成し遂げました。例えば、ガリレオ・ガリレイ(1564–1642)は時間を正確に計測し、落下する物体の速度について正確な計測と結論を導き出す実験を行いました。フランスの化学者アントワーヌ・ラボアジエ(1743–1794)は実験を用いて燃焼や生化学などの新しい分野を記述し、質量(物質)保存の理論を展開しました。[ 17 ]ルイ・パスツール(1822–1895)は科学的手法を用いて、当時の自然発生説を反証し、病気の細菌説を展開しました。[ 18 ]交絡の可能性がある変数を制御することが重要であるため、可能な限り適切に設計された実験室実験の使用が好まれます。
20世紀初頭には、ロナルド・フィッシャー(1890–1962)、イェジー・ネイマン(1894–1981)、オスカー・ケンプソーン(1919–2000 )、ガートルード・メアリー・コックス(1900–1978)、ウィリアム・ジェンメル・コクラン( 1909–1980)などの統計学者の貢献により、実験の設計と分析においてかなりの進歩が見られました。[ 19 ]
実験は、さまざまな研究分野の専門的な規範や基準に応じて、さまざまな側面で分類される可能性があります。
一部の分野(例えば、心理学や政治学)において、「真の実験」とは、2種類の変数を用いる社会調査の方法である。独立変数は実験者によって操作され、従属変数は測定される。真の実験の重要な特徴は、実験者のバイアスを中和するために被験者をランダムに割り当て、実験を多数回繰り返すことで、すべての交絡因子をコントロールすることである。[ 20 ]
研究分野によって、実験は異なる目的(ただし相互に排他的ではない)を達成するために実施されます。[ 21 ]理論の検証、現象の探索と記録、理論の構築、政策立案者への助言などです。これらの目的は、妥当性に関する懸念ともそれぞれ異なる形で関連しています。
対照実験では、実験サンプルから得られた結果を対照サンプルと比較することがよくあります 。対照サンプルは、効果がテストされている 1 つの側面 (独立変数) を除いて、実験サンプルと実質的に同一です。良い例として薬物試験が挙げられます。薬物を投与されるサンプルまたはグループは実験グループ (治療グループ) となり、プラセボまたは通常の治療を受けるものは対照グループとなります。多くの実験室実験では、実施するテストに対して複数の複製サンプルを用意し、陽性対照と陰性対照の両方を用意するのが良い方法です。複製サンプルの結果は平均化できる場合が多く、また、複製の 1 つが他のサンプルの結果と明らかに矛盾する場合は、実験エラー (そのサンプルに対してテスト手順の一部のステップが誤って省略された可能性がある) の結果として破棄することができます。ほとんどの場合、テストは 2 回または 3 回実行されます。陽性対照は実際の実験テストに似ていますが、過去の経験から陽性の結果が出ることが分かっている手順です。陰性対照は陰性の結果が出ることが分かっています。陽性対照は、実際の実験サンプルがいずれも陽性結果を示さなかったとしても、実験の基本条件が陽性結果をもたらすことができたことを確認するために使用されます。陰性対照は、試験で測定可能な陽性結果が得られなかった場合に得られるベースライン結果を示します。多くの場合、陰性対照の値は「背景」値として扱われ、試験サンプルの結果から差し引かれます。陽性対照が標準曲線の象限を占める場合もあります。
教育実験でよく用いられる例として、対照タンパク質アッセイが挙げられます。学生には、(学生にとって)未知量のタンパク質を含む液体サンプルが与えられます。学生の課題は、液体サンプル(通常「未知サンプル」と呼ばれます)中のタンパク質濃度を測定する対照実験を正しく実施することです。教育実験室には、タンパク質濃度が既知のタンパク質標準溶液が備え付けられます。学生は、タンパク質標準溶液を様々な濃度で希釈した陽性対照サンプルを複数作製することができます。陰性対照サンプルには、タンパク質アッセイに必要な試薬がすべて含まれますが、タンパク質は含まれません。この例では、すべてのサンプルを2回ずつ実施します。このアッセイは比色アッセイであり、分光光度計を用いて、タンパク質分子と添加した色素分子との相互作用によって形成される着色複合体を検出することで、サンプル中のタンパク質量を測定します。図では、希釈した試験サンプルの結果を標準曲線(図の青い線)の結果と比較することで、未知サンプル中のタンパク質量を推定できます。
実験におけるすべての条件を正確に制御することが難しい場合、制御された実験を実施できます。この場合、実験は、確率的に同等である 2 つ以上のサンプル グループを作成することから始まります。つまり、特性の測定値はグループ間で類似している必要があり、同じ処理が与えられた場合、グループは同じ方法で応答するはずです。この同等性は、個人間の変動の量と各グループの個体数を考慮に入れた統計的手法によって決定されます。微生物学や化学などの分野では、個人間の変動は非常に少なく、グループのサイズは簡単に数百万に達するため、これらの統計的手法はしばしば省略され、溶液を単純に均等に分割するだけで同一のサンプル グループが生成されると想定されます。
同等のグループが形成されると、実験者は分離したい変数を除いて、各グループを同一に扱うよう努めます。ヒト実験では、プラセボ効果などの外的要因に対する特別な安全策が必要です。このような実験は一般的に二重盲検法で行われます。つまり、すべてのデータが収集されるまで、被験者も研究者もどの被験者が対照群でどの被験者が実験群に属するかを知ることができません。これにより、被験者への影響は治療そのものによるものであり、治療を受けているという認識に対する反応ではないことが保証されます。
ヒト実験では、研究者は被験者(人)に反応する刺激を与えることがあります。実験の目的は、刺激に対する反応を試験方法を用いて測定することです。
実験計画法では、2つ以上の「処理」を適用し、 各処理における平均反応の差を推定します。例えば、パンを焼く実験では、小麦粉に対する水の割合などの量的変数と、酵母の菌株などの質的変数に関連する反応の差を推定できます。実験とは、科学的手法における段階であり、人々が2つ以上の競合する説明、つまり仮説の中から判断を下すのに役立ちます。これらの仮説は、現象を説明したり、行動の結果を予測したりする根拠を示唆します。例えば、「このボールを放すと床に落ちる」という仮説が挙げられます。この仮説は、ボールを放す実験を行い、その結果を観察することで検証できます。正式には、仮説は、その反対仮説、つまり帰無仮説(「このボールを放すと床に落ちない」)と比較されます。帰無仮説とは、調査対象の推論では現象を説明できず、予測力もないというものです。仮説が定義されると、実験を実行し、結果を分析して仮説の正確性を確認、反証、または定義することができます。
近くの未処理ユニットへの 波及効果を推定するための実験も設計できます。
「実験」という言葉は通常、統制された実験を意味しますが、統制された実験が極めて困難、不可能、非倫理的、あるいは違法である場合もあります。このような場合、研究者は自然実験や準実験に頼ります。[ 22 ]自然実験は、統制された実験のように1つまたは少数の変数を操作するのではなく、研究対象のシステム の変数の観察のみに依存します。可能な限り、自然実験では、すべての変数の寄与を決定できるような方法でシステムのデータを収集し、特定の変数の変動の影響がほぼ一定になるようにすることで、他の変数の影響を識別しようとします。これがどの程度可能であるかは、観測データにおける説明変数間の相関関係の観察に依存します。これらの変数間の相関が良好でない場合、自然実験は統制された実験の有効性に近づく可能性があります。しかし、通常、これらの変数間には何らかの相関関係があり、統制された実験を実施した場合に得られる結論と比較して、自然実験の信頼性は低下します。また、自然実験は通常、制御されていない環境で行われるため、検出されないソースからの変数は測定されず、一定に保たれることもないため、調査対象の変数に錯覚的な相関関係が生じる可能性があります。
経済学、人文地理学、考古学、社会学、文化人類学、地質学、古生物学、生態学、気象学、天文学など、様々な科学分野における多くの研究は、準実験に依存しています。例えば、天文学において「星は水素の雲が崩壊したものである」という仮説を検証する際に、巨大な水素の雲から始めて、数十億年かけて星が形成されるのを待つという実験を行うことは明らかに不可能です。しかし、様々な崩壊状態にある様々な水素の雲や、仮説の他の示唆(例えば、星の光からの様々なスペクトル放射の存在)を観察することで、仮説を裏付けるために必要なデータを収集することができます。この種の実験の初期の例としては、17世紀に光が瞬時に場所から場所へと移動するのではなく、測定可能な速度で移動することが初めて検証されたことが挙げられます。木星の衛星の出現の観測は、木星が地球に近いときよりも地球から遠いときにはわずかに遅れており、この現象は衛星の出現時間の差が測定可能な速度と一致していることを示すために使われた。[ 23 ]
フィールド実験は、実験室という人工的で高度に制御された環境で仮説を検証することで科学的管理を強化する実験室実験と区別するためにそのように呼ばれています。社会科学、特に教育や健康介入の経済分析においてよく用いられるフィールド実験は、人工的な実験室環境ではなく、自然な環境で結果を観察できるという利点があります。このため、フィールド実験は実験室実験よりも外部妥当性が高いと見なされることがあります。しかし、自然実験と同様に、フィールド実験にも汚染の可能性があります。実験条件は実験室でより正確かつ確実に制御できます。しかし、一部の現象(例:選挙における投票率)は、実験室では容易に研究できません。

観察研究は、物理システムや社会システムを実験室環境に当てはめたり、交絡因子を完全に制御したり、無作為割付を適用したりすることが非現実的、非倫理的、費用がかかりすぎる(あるいは非効率的)場合に用いられます。また、交絡因子が限られているか、あるいは交絡因子を考慮した上でデータを分析できるほど十分に既知である場合にも用いられます(ただし、社会現象を研究対象としている場合は稀です)。観察科学が有効であるためには、実験者は交絡因子を知り、考慮に入れる必要があります。このような状況において、観察研究は、無作為化実験や最新のデータ収集によって検証可能な仮説を提示することが多いため、価値があります。
しかし、基本的に、観察研究は実験ではない。定義上、観察研究にはベーコンの実験に必要な操作が欠けている。さらに、観察研究 (たとえば、生物系または社会系) では、定量化または制御が難しい変数が関係することが多い。観察研究は、ランダム化実験の統計的特性がないため限界がある。ランダム化実験では、実験プロトコルで指定されたランダム化の方法が統計分析の指針となり、統計分析も通常、実験プロトコルで指定される。[ 24 ]客観的なランダム化を反映する統計モデルがなければ、統計分析は主観的なモデルに依存する。[ 24 ]主観的モデルからの推論は、理論と実践において信頼できない。[ 25 ]実際、注意深く実施された観察研究が一貫して間違った結果をもたらす場合、つまり、観察研究の結果に一貫性がなく、実験の結果とも異なる場合がいくつかあります。例えば、大腸がんの疫学的研究では一貫してブロッコリーの摂取と有益な相関関係が示されているが、実験では有益性は見つかっていない。[ 26 ]
人間を対象とする観察研究に特有の問題は、治療(または曝露)間の公平な比較が非常に難しいことです。なぜなら、そのような研究は選択バイアスが生じやすく、異なる治療(曝露)を受けるグループは、共変量(年齢、身長、体重、投薬、運動、栄養状態、民族、家族の病歴など)によって大きく異なる場合があるからです。対照的に、ランダム化は、各共変量について、各グループの平均が同じになることが期待されることを意味します。もちろん、ランダム化試験では平均値からの多少の変動が予想されますが、中心極限定理とマルコフの不等式により、ランダム化によって実験グループの平均値が近くなることが保証されます。ランダム化が不十分であったり、サンプルサイズが小さかったりすると、治療グループ(または曝露グループ)間の共変量の系統的変動により、治療(曝露)の効果を、ほとんどが測定されていない他の共変量の効果から切り離すことが難しくなります。このようなデータを分析するために使用される数学モデルでは、それぞれの異なる共変量(測定されている場合)を考慮する必要があり、共変量がランダム化されておらず、モデルに含まれていない場合、結果は意味がありません。
実験の有用性を大幅に低下させるような状況を避けるため、米国食品医薬品局の承認を得るために医療試験を実施する医師は、識別できる共変量を定量化し、ランダム化します。研究者は、大規模な被験者集団と共変量に関する広範な情報を必要とする傾向スコアマッチングなどのマッチング法を用いて、観察研究のバイアスを軽減しようと試みます。しかし、傾向スコアマッチングは、バイアスを減らすどころか増やしてしまう可能性があるため、もはや推奨されない手法です。 [ 27 ]アウトカムも、可能であれば定量化され(骨密度、血液中の細胞または物質の量、体力または持久力など)、被験者または専門家の観察者の意見に基づかないようにしています。このように、観察研究のデザインによって、結果をより客観的にし、より説得力のあるものすることができます。
独立変数の分布を研究者の管理下に置くことにより、実験、特に人間を対象とする実験では、利益と害のバランス、介入(病気の治療など)の公平な分配、インフォームドコンセントなどの潜在的な倫理的配慮が導入される。たとえば、心理学やヘルスケアでは、患者に標準以下の治療を提供することは非倫理的である。したがって、倫理審査委員会は、新しい治療法が現在のベストプラクティスと同等の効果をもたらすと考えられない限り、臨床試験やその他の実験を中止することになっている。[ 28 ]また、ヒ素の摂取が人間の健康に及ぼす影響など、標準以下のまたは有害な治療の効果についてランダム化実験を行うことは、一般的に非倫理的(多くの場合違法)である。このような曝露の影響を理解するために、科学者はそれらの要因の影響を理解するために観察研究を使用することがある。
実験研究が直接的に人間を対象としない場合でも、倫理的な懸念が生じる可能性があります。例えば、マンハッタン計画で行われた核爆弾実験は、実験自体が直接人間を対象とするものではなかったにもかかわらず、核反応を利用して人間に危害を加えることを示唆していました。