最適な実験計画

凍った環境で経緯儀を使って測定をしている男性の写真。
グスタフ・エルヴィングは実験の最適計画を開発し、 嵐に見舞われたグリーンランドのテントに閉じ込められていた測量士による経緯儀測定(写真)の必要性を最小限に抑えました。[ 1 ]

実験計画法において、最適実験計画(または最適計画[ 2 ] )とは、ある統計的基準に関して最適実験計画の一種である。この統計学の分野は、デンマークの統計学者カースティン・スミスによって創始されたとされている。[ 3 ] [ 4 ]

統計モデルを推定するための実験計画法において、最適な計画はバイアスなくかつ分散を最小に抑えてパラメータを推定することを可能にする。最適でない計画では、最適な計画と同じ精度でパラメータを推定するために、より多くの実験実行が必要となる。実際的には、最適な実験は実験コストを削減することができる。

計画の最適性は統計モデルに依存し、推定値の分散行列に関連する統計基準に基づいて評価されます。適切なモデルと適切な基準関数を指定するには、統計理論の理解と実験計画に関する実践的な知識が必要です。

利点

最適な実験計画は、最適ではない実験計画に比べて3つの利点があります。[ 5 ]

  1. 最適設計により、より少ない実験実行で統計モデルを推定できるため、実験コストが削減されます。
  2. 最適設計では、プロセス、混合、離散要因など、複数の種類の要因に対応できます。
  3. 設計空間が制約されている場合、たとえば数学的プロセス空間に実際には実行不可能な要因設定(たとえば、安全上の懸念のため)が含まれている場合、設計を最適化できます。

推定値の分散を最小化する

実験デザインは統計的基準を用いて評価される。[ 6 ]

最小二乗推定量は、ガウス・マルコフ定理の条件下で、平均不偏推定量分散最小化することが知られています。1つのパラメータを持つ統計モデル推定理論において、 ( 「効率的な」 )推定量の分散の逆数は、その推定量の「フィッシャー情報量」と呼ばれます。[ 7 ]この相互性により、分散最小化することは、情報最大化することに対応します。

しかし、統計モデルが複数のパラメータを持つ場合、パラメータ推定値の平均はベクトルであり、その分散は行列である。分散行列の逆行列は「情報行列」と呼ばれる。パラメータベクトルの推定値の分散は行列であるため、「分散を最小化する」問題は複雑である。統計理論を用いて、統計学者は実数値要約統計量を用いて情報行列を圧縮する。実数値関数であるため、これらの「情報基準」を最大化することができる。[ 8 ]従来の最適性基準は情報行列の不変量であり、代数的には、従来の最適性基準は情報行列の 固有値関数である。

  • A -最適性(「平均」またはトレース
    • 一つの基準はA最適性であり、これは情報行列の逆行列トレースを最小化することを目指します。この基準は、回帰係数の推定値の平均分散を最小化するという結果をもたらします。
  • C最適性
  • D最適性(行列式
    • よく使われる基準はD-最適性であり、これは|(X'X) −1 |を最小化すること、つまり計画の情報行列X'Xの行列式を最大化することを目指す。この基準は、パラメータ推定値の微分シャノン情報量を最大化することを意味する。
  • E最適性(固有値
  • S最適性[ 9 ]
    • この基準は、X の相互列直交性と情報行列の行列式を測定する量を最大化します。
  • T最適性
    • この基準は、設計地点における2つの提案モデル間の差異を最大化します。[ 10 ]

他の最適性基準は予測の分散に関係している。

  • G最適性
    • 一般的な基準はG最適性であり、ハット行列X(X'X) −1X 'の対角成分の最大値を最小化することを目指します。これは予測値の最大分散を最小化する効果があります
  • I-最適性(統合
    • 予測分散に関する2番目の基準はI-最適性であり、これは設計空間全体の平均予測分散を最小化することを目指します。
  • V最適性(分散
    • 予測分散に関する3番目の基準はV最適性であり、これはm個の特定の点の集合にわたって平均予測分散を最小化することを目指すものである。[ 11 ]

対比

多くの応用において、統計学者は「不要なパラメータ」よりも「関心のあるパラメータ」に最も関心を持っています。より一般的には、統計学者は実験計画法分散分析において、処理平均の線形結合によって推定されるパラメータの線形結合を考慮します。このような線形結合は対比と呼ばれます。統計学者は、このような関心のあるパラメータ対比に対して適切な最適性基準を使用することができます。[ 12 ]

実装

最適な設計のカタログは、書籍やソフトウェアライブラリにあります

さらに、SASRなどの主要な統計システムには、ユーザーの指定に従って計画を最適化する手順が備わっています。実験者は、最適な計画を計算する前に、計画のモデルと最適性基準を指定する必要があります。 [ 13 ]

実践上の考慮事項

最適設計における高度なトピックの中には、実験の設計において より多くの統計理論と実践的な知識を必要とするものがあります

モデルの依存性と堅牢性

ほとんどの最適設計の最適性基準は情報行列の何らかの関数に基づいているため、与えられた設計の「最適性」はモデルに依存します。つまり、最適な設計は特定のモデルでは最適ですが、他のモデルではパフォーマンスが低下する可能性があります。また、他のモデルでは、最適な設計が非最適な設計よりも優れている場合もあれば、劣っている場合もあります。 [ 14 ]したがって、代替モデルにおける設計のパフォーマンスをベンチマークすることが重要です。[ 15 ]

最適基準と堅牢性の選択

適切な最適性基準の選択にはある程度の検討が必要であり、複数の最適性基準に関して設計のパフォーマンスをベンチマークすることは有用である。コーネルは次のように書いている。

[従来の最適性]基準は分散を最小化する基準であるため、ある基準のうちの1つを使用して特定のモデルに対して最適な設計は、通常、他の基準に関しても同じモデルに対してほぼ最適です。

[ 16 ]

実際、キーファーの「普遍的最適性」理論によれば、従来の最適性基準がすべて一致する設計のクラスがいくつかあります。[ 17 ]コーネルのような実務家の経験とキーファーの「普遍的最適性」理論は、最適性基準の変化に対する堅牢性は、モデルの変化に対する堅牢性よりもはるかに大きいことを示唆しています。

柔軟な最適性基準と凸解析

高品質な統計ソフトウェアは、指定されたモデルと最適性基準に応じて、最適設計のライブラリまたは近似最適設計を構築するための反復法の組み合わせを提供します。ユーザーは標準的な最適性基準を使用することも、カスタムメイドの基準をプログラムすることもできます。

従来の最適性基準はすべて凸(または凹)関数であるため、最適設計は凸解析の数学的理論に従順であり、その計算には凸最小化の特殊な手法を使用することができる。[ 18 ]実践者は、従来の最適性基準を厳密に1つ選択する必要はなく、カスタム基準を指定することができる。特に、実践者は凸最適性基準の最大値と最適性基準の非負の組み合わせを使用して凸基準を指定することができる(これらの操作は凸関数を保存するため)。最適性基準の場合、キーファー-ウォルフォウィッツ同値定理により、実践者は与えられた設計が大域的に最適であることを検証することができる。[ 19 ]キーファー-ウォルフォウィッツ同値定理は凸関数ルジャンドル-フェンシェル共役性と関連している。[ 20 ]

最適性基準に凸性がない場合、グローバル最適値を見つけてその最適性を検証することは困難になることが多いです。

モデルの不確実性とベイズ的アプローチ

モデル選択

科学者が複数の理論を検証したい場合、統計学者は特定のモデル間の最適な検証を可能にする実験を設計することができます。このような「判別実験」は、コックスとアトキンソンの研究に倣い、薬物動態学薬力学を支える 生物統計学において特に重要です。[ 21 ]

ベイズ実験計画法

実務家が複数のモデルを検討する必要がある場合、モデルに確率測度を指定し、そのような実験の期待値を最大化する計画を選択することができます。このような確率に基づく最適計画は、最適ベイズ計画と呼ばれます。このようなベイズ計画は、特に一般化線型モデル(応答が指数分布族に従う)に使用されます。[ 22 ]

しかし、ベイズ計画を採用したからといって、統計学者がデータ解析にベイズ的手法を用いることを強制されるわけではありません。実際、確率に基づく実験計画を「ベイズ的」と呼ぶことを嫌う研究者もいます。 [ 23 ] 「ベイズ的」最適性の別名としては、「平均的」最適性や「集団的」最適性などがあります。

反復実験

科学的実験は反復的なプロセスであり、統計学者は連続的な実験の最適な設計に向けていくつかのアプローチを開発してきました

逐次解析

逐次分析はアブラハム・ワルドによって開拓されました。[ 24 ] 1972年、ハーマン・チャーノフは最適な逐次設計の概要を執筆し、[ 25 ]適応設計は後にS・ザックスによって調査されました。[ 26 ]もちろん、実験の最適設計に関する多くの研究は、最適決定の理論、特にアブラハム・ワルド統計的決定理論に関連しています。[ 27 ]

応答曲面法

応答曲面モデルの最適設計については、アトキンソン、ドネフ、トビアスの教科書、ガフケとハイリガースの概説、プケルスハイムの数学的テキストで議論されています。最適設計のブロッキングについては、アトキンソン、ドネフ、トビアスの教科書、およびグースのモノグラフで議論されています

最も初期の最適設計は、連続変数を持つ回帰モデルのパラメータを推定するために開発されました。例えば、 1815年にJ.D. Gergonneによって開発されました(スティグラー)。英語では、 Charles S. PeirceKirstine Smithによる初期の貢献が2件ありました。

多変量応答曲面の先駆的なデザインは、ジョージ・E・P・ボックスによって提案されました。しかし、ボックスのデザインは最適性に関する特性がほとんどありません。実際、ボックス・ベンケンデザインは、変数の数が3を超えると過剰な実験回数を必要とします。[ 28 ] ボックスの「中心複合」デザインは、河野の最適デザインよりも多くの実験回数を必要とします。[ 29 ]

システム同定と確率近似

逐次実験の最適化は、確率計画法システム制御においても研究されている。よく用いられる手法には、確率近似法やその他の確率最適化手法などがある。この研究の多くは、システム同定という分野と関連している。[ 30 ] 計算最適制御において、D. Judin、A. Nemirovskii、そしてBoris Polyakは、 GEP Boxが応答曲面法で導入した( Armijoスタイルのステップサイズ規則よりも効率的な手法を報告している。[ 31 ]

適応型デザインは臨床試験で使用されており、最適な適応型デザインについては、 Shelemyahu Zacks 著の 「Handbook of Experimental Designs」の章で概説されています。

実験実行回数の指定

コンピュータを使って良いデザインを見つける

実験回数または反復回数に事前制約がある場合、最適な計画を見つける方法はいくつかあります。これらの方法のいくつかは、アトキンソン、ドネフ、トビアス、およびハーディンとスローンによる論文で議論されています。もちろん、実験回数を事前に固定することは現実的ではありません。賢明な統計学者は、実験回数が異なる他の最適な計画を検討します。

確率測度計画の離散化

最適実験に関する数学理論において、最適計画とは、観測場所の無限集合に基づく確率測度である。このような最適確率測度計画は、観測と実験実行のコストを特定しない数学的問題を解決する。しかしながら、このような最適確率測度計画は離散化することで、近似的に最適な計画を提供することができる。[ 32 ]

場合によっては、観測点の有限集合で最適設計をサポートするのに十分である。このような結果は、二次関数モデルの応答曲面設計に関する研究において、KônoとKieferによって証明された。Kôno-Kiefer分析は、応答曲面の最適設計が離散的なサポートを持つことができる理由を説明する。これは、応答曲面法において従来用いられてきた効率の低い設計と非常によく似ている。[ 33 ]

歴史

スティグラーによれば、1815 年にジョセフ・ディアス・ジェルゴンヌによって多項式回帰の最適設計に関する論文が出版された。

チャールズ・S・パースは1876年に科学実験の経済理論を提唱し、推定値の精度を最大化することを目指しました。パースの最適配分は重力実験の精度を即座に向上させ、パースとその同僚によって数十年にわたって用いられました。1882年にジョンズ・ホプキンス大学で発表された講演で、パースは実験計画法を次のように紹介しました。

論理は、重力加速度やオームの値を最もよく決定するためにどのような実験を行うべきかを教えてくれるわけではありません。しかし、実験計画を立てるためにどのように進めればよいかは教えてくれます。 [....] 残念ながら、実践は理論に先行することが多く、最初は何かと途方もない方法で物事を成し遂げ、後になってもっと簡単に完璧にできたはずなのに、と気づくのが人類の通常の運命なのです。[ 34 ]

カースティン・スミスは1918 年に多項式モデルの最適設計を提案しました。(カースティン・スミスはデンマークの統計学者トーヴァル・N・ティーレの弟子であり、ロンドンでカール・ピアソンと共に研究していました。)

参照

注記

  1. ^ノルドストローム(1999年、176ページ)
  2. ^形容詞「optimum」(「optimal」ではない)は「英語ではやや古い形式で、「optim(um) + al」という構文を避けています。ラテン語には「optimalis」はありません」(Atkinson、Donev、Tobias著『Optimum Experimental Designs, with SAS』のxページ)。
  3. ^ Guttorp, P.; Lindgren, G. (2009). 「カール・ピアソンとスカンジナビア統計学派」. International Statistical Review . 77 : 64. CiteSeerX  10.1.1.368.8328 . doi : 10.1111/j.1751-5823.2009.00069.x . S2CID  121294724 .
  4. ^スミス、カースティン (1918). 「観測された多項式関数とその定数の調整値および補間値の標準偏差、ならびにそれらが観測分布の適切な選択に向けて与える指針について」 . Biometrika . 12 (1/2): 1– 85. doi : 10.2307/2331929 . JSTOR 2331929 . 
  5. ^これら 3 つの利点 (最適設計の) は、Atkinson、Donev、Tobias の教科書に記載されています。
  6. ^このような基準は最適化理論では目的関数と呼ばれます。
  7. ^フィッシャー情報量やその他の「情報関数は統計理論における基本的な概念です。
  8. ^伝統的に、統計学者は、共分散行列(平均-不偏推定量の何らかの要約統計量(通常は正の実数値(行列式または行列トレースなど))を考慮して推定量と計画を評価してきた。正の実数を扱うことにはいくつかの利点がある。単一のパラメータの推定量が正の分散を持つ場合、分散とフィッシャー情報量は両方とも正の実数である。したがって、これらは非負の実数の凸錐の要素である(その非ゼロの要素は同じ錐内に逆数を持つ)。 いくつかのパラメータについては、共分散行列と情報行列は、 Loewner (Löwner) 順序の下、順序ベクトル空間の非負定値対称行列の凸錐の要素である。この錐は、行列間の加算、行列の反転、および正の実数と行列の乗算に対して閉じている。行列理論と Loewner 順序の説明が Pukelsheim に掲載されています。
  9. ^ Shin, Yeonjong; Xiu, Dongbin (2016). 「最小二乗線形回帰における非適応的準最適点選択」. SIAM Journal on Scientific Computing . 38 (1): A385– A411. Bibcode : 2016SJSC...38A.385S . doi : 10.1137/15M1015868 .
  10. ^ Atkinson, AC; Fedorov, VV (1975). 「2つの競合モデルを区別するための実験計画法」 . Biometrika . 62 (1): 57– 70. doi : 10.1093/biomet/62.1.57 . ISSN 0006-3444 . 
  11. ^上記の最適性基準は、対称正半正定値行列の領域上の凸関数です。多くの図解と統計的応用が掲載されている実務家向けのオンライン教科書を参照してください。 Boyd と Vandenberghe は 384 ~ 396 ページで最適な実験設計について説明しています。
  12. ^「関心パラメータ」コントラストの最適性基準については、Atkinson、Donev、Tobias によって議論されています。
  13. ^反復法と近似アルゴリズムについては、Atkinson、Donev、Tobias の教科書、Fedorov (歴史的) と Pukelsheim のモノグラフ、および Gaffke と Heiligers の概説記事で概説されています。
  14. ^ Kiefer(「バイアス付きマルチレスポンス表面のフィッティングのための最適設計」289〜299ページ)を参照。
  15. ^このようなベンチマークについては、Atkinsonらによる教科書やKieferの論文で議論されています。モデルロバスト設計(「ベイズ」設計を含む)については ChangとNotzが概説しています。
  16. ^コーネル、ジョン(2002年)『混合物の実験:デザイン、モデル、そして混合物データの分析』(第3版)ワイリー社ISBN 978-0-471-07916-3(400~401ページ)
  17. ^「普遍最適性」の入門書は、アトキンソン、ドネフ、トビアスの教科書に掲載されています。より詳細な解説は、プケルスハイムの上級教科書とキーファーの論文に記載されています
  18. ^計算方法については、Pukelsheim と Gaffke および Heiligers によって議論されています。
  19. ^キーファー-ウォルフォウィッツ同値定理についてはアトキンソン、ドネフ、トビアスの第 9 章で説明されています。
  20. ^プケルシャイムは凸解析を用いて、凸関数ルジャンドル-フェンシェル共役性と関連したキーファー-ウォルフォウィッツ同値定理研究いる。対称正半定値行列の領域における凸関数の 最小化は、多くの図解と統計的応用を含む実践者向けのオンライン教科書で説明されている。
    • 凸最適化ケンブリッジ大学出版局 2004年 (PDF版書籍)
    Boyd と Vandenberghe は 384 ~ 396 ページで最適な実験設計について説明しています。
  21. ^ Atkinison、Donev、Tobiasの第20章を参照。
  22. ^ベイズ設計については、アトキンソン、ドネフ、トビアスによる教科書の第18章で解説されています。より高度な議論は、フェドロフとハックルのモノグラフ、チャロナーとヴェルディネリ、そしてダスグプタの論文で展開されています。ベイズ設計と「モデルロバスト」設計のその他の側面については、チャンとノッツが解説しています。
  23. ^ 「ベイズ最適性」の代替としてフェドロフとハックルは「平均最適性」を提唱している。
  24. ^ Wald, Abraham (1945年6月). 「統計的仮説の逐次検定」 .数理統計年報. 16 (2): 117–186 . doi : 10.1214/aoms/1177731118 . JSTOR 2235829 . 
  25. ^ Chernoff, H. (1972)逐次分析と最適設計、 SIAM モノグラフ。
  26. ^ Zacks, S. (1996)「パラメトリックモデルのための適応型デザイン」Ghosh, S.およびRao, CR, (編) (1996).実験計画法と分析,統計ハンドブック, 第13巻. North-Holland. ISBN 0-444-82061-2(151~180ページ)
  27. ヘンリー・P・ウィンは、以下の巻の17~24ページにある序文「ジャック・キーファーの実験計画への貢献」の中で、「現代の最適設計理論は、アブラハム・ウォルドによって創設された米国統計学の意思決定理論学派にその起源を持つ」と述べている キーファーは、この記事の多くのページ(273ページ(再版では55ページ)、280ページ(62ページ)、289~291ページ(71~73ページ)、294ページ(76ページ)、297ページ(79ページ)、315ページ(97ページ)、319ページ(101ページ))で、ワルドの影響と成果を認めている。
  28. ^応答曲面法の分野では、 Box-Behnken設計非効率性がWuとHamadaによって指摘されています(422ページ)。
    • Wu, CF Jeff & Hamada, Michael (2002).実験:計画、分析、パラメータ設計の最適化. Wiley. ISBN 978-0-471-25511-6
    「フォローアップ」実験のための最適な設計については、ウーとハマダが議論しています
  29. ^ Box「中心複合」計画効率性については、Atkinson、Donev、Tobias(165ページ)によって議論されている。これらの著者は、二次応答曲面におけるKôno型計画のブロッキングについても議論している。
  30. ^システム識別においては、以下の書籍に最適実験設計に関する章があります。
  31. ^ Judin & Nemirovskii とPolyakのステップサイズ規則は、 Kushnerと Yin の教科書で説明されてい ます
  32. ^近似最適設計を提供するための最適確率測度設計の離散化については、アトキンソン、ドネフ、トビアス、およびプケルシャイム(特に第12章)によって議論されています
  33. ^二次応答曲面の設計に関しては、河野とキーファーの結果はアトキンソン、ドネフ、トビアスで議論されている。数学的には、これらの結果はチェビシェフ多項式、マルコフシステム、モーメント空間と関連している。
  34. ^ Peirce, CS (1882)、「論理学入門講義」1882年9月、ジョンズ・ホプキンス大学回覧誌第2巻、第19号、11~12頁、1882年11月、11頁を参照、 Google Books Eprint。Collected Papers第7巻、59~76段落、59頁と63頁を参照、 Writings of Charles S. Peirce第4巻、378~382頁、378頁と379頁を参照、 The Essential Peirce第1巻 210~214頁、210~211頁を参照、また211頁の下部にも転載。

参考文献

さらに詳しい情報

実務家と学生のための教科書

回帰分析と応答曲面法を強調した教科書

Atkinson、Donev、Tobias による教科書は、大学のコースだけでなく、産業界の実務家向けの短期コースでも使用されてきました。

ブロック設計を重視した教科書

最適ブロック設計は、ベイリーとバパットによって論じられています。バパットの本の第1章では、ベイリー(または下記の上級者向けの書籍)が用いた線型代数を復習しています。ベイリーの演習問題とランダム化に関する議論はどちらも、代数計算ではなく統計的概念に重点を置いています

最適なブロック設計については、Shah と Sinha による高度なモノグラフと Cheng および Majumdar による調査記事で説明されています。

プロの統計学者や研究者向けの書籍

論文と章

  • キャサリン・チャロナー&イザベラ・ヴェルディネッリ(1995)ベイズ実験デザイン:レビュー」統計科学10 3):273–304。CiteSeerX 10.1.1.29.5355。doi10.1214/ss/1177009939 
  • Ghosh, S.; Rao, CR編 (1996).実験計画法と分析. 統計ハンドブック. 第13巻. 北ホラント. ISBN 978-0-444-82061-7
    • モデルロバスト設計」。実験計画法と分析。統計ハンドブック。1055  1099ページ
    • Cheng, C.-S. 「最適設計:厳密な理論」.実験計画法と分析. 統計ハンドブック. pp.  977– 1006.
    • DasGupta, A.「最適ベイズ計画のレビュー」実験計画法と分析法、統計ハンドブック、pp.  1099– 1148。
    • Gaffke, N. & Heiligers, B.「多項式回帰の近似計画:不変性許容性、そして最適性」。実験計画法と分析、統計ハンドブック、pp.  1149– 1199。
    • マジュムダール, D.「最適かつ効率的な治療・対照設計」。実験計画法と分析。統計ハンドブック。pp.  1007– 1054。
    • スタッケン, J.「最適クロスオーバー計画実験計画法と分析法、統計ハンドブック、pp.  63– 90。
    • Zacks, S.「パラメトリックモデルのための適応型デザイン」実験計画法と分析法、統計ハンドブック、pp.  151– 180。
  • 河野一正 (1962). 「 k -cube上の2次回帰の最適設計」(PDF) .九州大学理学部紀要. シリーズA. 数学. 16 (2): 114– 122. doi : 10.2206/kyushumfs.16.114 .

歴史的