グスタフ・エルヴィングは 実験の最適計画を開発し、 嵐に見舞われたグリーンランドの テントに閉じ込められていた測量士による経緯儀測定 (写真) の必要性を最小限に抑えました。[ 1 ] 実験計画法 において、最適実験計画 (または最適計画 [ 2 ] )とは、ある統計的 基準 に関して最適な 実験計画 の一種である。この統計学の分野は、デンマークの統計学者カースティン・スミス によって創始されたとされている。[ 3 ] [ 4 ]
統計モデル を推定する ための実験計画法 において、最適な計画は バイアスなく 、かつ分散を最小に抑えて パラメータ を推定することを可能にする。最適でない計画では、最適な計画と同じ精度 でパラメータを推定する ために、より多くの実験実行 が必要となる。実際的には、最適な実験は実験コストを削減することができる。
計画の最適性は統計モデル に依存し、推定値の分散行列に関連する統計基準に基づいて評価されます。適切なモデルと適切な基準関数を指定するには、統計理論の理解と 実験計画 に関する実践的な知識が必要です。
利点 最適な実験計画は、最適ではない実験計画 に比べて3つの利点があります。[ 5 ]
最適設計により、より少ない実験実行で統計モデル を推定できるため、実験コストが削減されます。 最適設計では、プロセス、混合、離散要因など、複数の種類の要因に対応できます。 設計空間が制約されている場合、たとえば数学的プロセス空間に実際には実行不可能な要因設定(たとえば、安全上の懸念のため)が含まれている場合、設計を最適化できます。
推定値の分散を最小化する 実験デザインは統計的基準を用いて評価される。[ 6 ]
最小二乗 推定量は、ガウス・マルコフ定理 の条件下で、平均 不偏推定量 の 分散を 最小化することが知られています。1つの実 パラメータを持つ 統計モデル の推定 理論において、 ( 「効率的な」 )推定量の分散の逆数は、その推定量の「 フィッシャー情報 量」と呼ばれます。[ 7 ] この相互性により、分散 を 最小化すること は、情報 を 最大化する ことに対応します。
しかし、統計モデルが複数の パラメータ を持つ場合、パラメータ推定値の平均は ベクトル であり、その分散は 行列 である。分散行列の逆行列は「情報行列」と呼ばれる。パラメータベクトルの推定値の分散は行列であるため、「分散を最小化する」問題は複雑である。 統計理論を用いて、統計学者は実数値 要約統計 量を用いて情報行列を圧縮する。実数値関数であるため、これらの「情報基準」を最大化することができる。[ 8 ] 従来の最適性基準は情報 行列の不変量 であり、代数的には、従来の最適性基準は情報行列の 固有値 の関数である。
A - 最適性(「平均 」またはトレース ) 一つの基準はA最適性 であり、これは情報行列の逆行列 のトレース を最小化することを目指します。この基準は、回帰係数の推定値の平均分散を最小化するという結果をもたらします。 C 最適性 D 最適性(行列式 ) よく使われる基準はD-最適性 であり、これは|(X'X) −1 |を最小化すること、つまり計画の情報行列 X'Xの行列式 を最大化することを目指す。この基準は、パラメータ推定値の微分シャノン情報 量を最大化することを意味する。 E 最適性(固有値 ) S 最適性[ 9 ] この基準は、X の相互列直交性と情報行列の行列式 を測定する量を最大化します。 T 最適性 この基準は、設計地点における2つの提案モデル間の差異を最大化します。[ 10 ] 他の最適性基準は予測 の分散に関係している。
G 最適性 一般的な基準はG最適性であり、 ハット行列 X(X'X) −1X 'の対角成分 の最大値を最小化することを目指します。これは予測値の最大分散を最小化する効果があります I- 最適性(統合 ) 予測分散に関する2番目の基準はI-最適性であり、これは 設計空間全体の 平均予測分散を最小化することを目指します。 V 最適性(分散 ) 予測分散に関する3番目の基準はV最適性 であり、これはm個の特定の点の集合にわたって平均予測分散を最小化することを目指すものである。[ 11 ]
対比 多くの応用において、統計学者は「不要なパラメータ」 よりも「関心のあるパラメータ 」に最も関心を持っています。より一般的には、統計学者は実験計画法 や分散分析 において、処理平均の線形結合によって推定されるパラメータの線形結合を考慮します。このような線形結合は 対比 と呼ばれます。統計学者は、このような関心のあるパラメータ と対比 に対して適切な最適性基準を使用することができます。[ 12 ]
実装 最適な設計のカタログは、書籍やソフトウェアライブラリにあります
さらに、SAS やR などの主要な統計システム には、ユーザーの指定に従って計画を最適化する手順が備わっています。実験者は、最適な計画を計算する前に、計画のモデルと最適性基準を指定する必要があります。 [ 13 ]
実践上の考慮事項 最適設計における高度なトピックの中には、実験の設計において より多くの統計理論と実践的な知識を必要とするものがあります
モデルの依存性と堅牢性 ほとんどの最適設計の最適性基準は情報行列の何らかの関数に基づいているため、与えられた設計の「最適性」はモデル に依存します 。つまり、最適な設計は特定のモデルでは最適ですが、他の モデル ではパフォーマンスが低下する可能性があります。また、他のモデル では、最適な 設計が非最適な設計よりも優れている場合もあれば、劣っている場合もあります。 [ 14 ] したがって、代替モデル における設計のパフォーマンスをベンチマーク することが重要です。[ 15 ]
最適基準と堅牢性の選択 適切な最適性基準の選択にはある程度の検討が必要であり、複数の最適性基準に関して設計のパフォーマンスをベンチマークすることは有用である。コーネルは次のように書いている。
[従来の最適性]基準は分散を最小化する基準であるため、ある基準のうちの1つを使用して特定のモデルに対して最適な設計は、通常、他の基準に関しても同じモデルに対してほぼ最適です。
実際、キーファー の「普遍的最適性」理論によれば、従来の最適性基準がすべて一致する設計のクラスがいくつかあります。[ 17 ] コーネルのような実務家の経験とキーファーの「普遍的最適性」理論は、最適性基準 の変化に対する堅牢性は、モデル の変化に対する堅牢性よりもはるかに大きいことを示唆しています。
柔軟な最適性基準と凸解析 高品質な統計ソフトウェアは、指定されたモデルと最適性基準に応じて、最適設計のライブラリまたは近似最適設計を構築するための反復法の組み合わせを提供します。ユーザーは標準的な最適性基準を使用することも、カスタムメイドの基準をプログラムすることもできます。
従来の最適性基準はすべて凸(または凹)関数 であるため、最適設計は凸解析 の数学的理論に従順であり、その計算には凸最小化 の特殊な手法を使用することができる。[ 18 ] 実践者は、従来の最適性基準を厳密に1つ 選択する必要はなく、カスタム基準を指定することができる。特に、実践者は凸最適性基準の最大値と最適性基準の非負の組み合わせ を使用して凸基準を指定することができる(これらの操作は凸関数 を保存するため)。凸 最適性基準の場合、キーファー -ウォルフォウィッツ 同値定理 により、実践者は与えられた設計が大域的に最適であることを検証することができる。[ 19 ] キーファー-ウォルフォウィッツ 同値定理は 、 凸関数 のルジャンドル -フェンシェル 共役性 と関連している。[ 20 ]
最適性基準に凸性 がない場合、グローバル最適値 を見つけてその最適性を検証することは困難になることが多いです。
モデルの不確実性とベイズ的アプローチ
モデル選択 科学者が複数の理論を検証したい場合、統計学者は特定のモデル間の最適な検証を可能にする実験を設計することができます。このような「判別実験」は、コックス とアトキンソンの研究に倣い、薬物動態学 と薬力学を 支える 生物統計学 において特に重要です。[ 21 ]
ベイズ実験計画法 実務家が複数のモデル を検討する必要がある場合、モデルに確率測度を指定し、そのような実験の 期待値 を最大化する計画を選択することができます。このような確率に基づく最適計画は、最適ベイズ 計画 と呼ばれます。このようなベイズ計画は、特に 一般化線型モデル (応答が指数分布族 に従う)に使用されます。[ 22 ]
しかし、ベイズ計画 を採用したからといって、統計学者がデータ解析にベイズ的手法 を用いることを強制されるわけではありません。実際、確率に基づく実験計画を「ベイズ的」と呼ぶことを嫌う研究者もいます。 [ 23 ] 「ベイズ的」最適性の別名としては、「平均的」最適性や「集団的」最適性などがあります。
反復実験 科学的実験は反復的なプロセスであり、統計学者は連続的な実験の最適な設計に向けていくつかのアプローチを開発してきました
逐次解析 逐次分析は アブラハム・ワルド によって開拓されました。[ 24 ] 1972年、ハーマン・チャーノフは 最適な逐次設計の概要を執筆し、[ 25 ] 適応設計は 後にS・ザックスによって調査されました。[ 26 ] もちろん、実験の最適設計に関する多くの研究は、最適決定 の理論、特にアブラハム・ワルド の統計的決定理論 に関連しています。[ 27 ]
応答曲面法 応答曲面モデル の最適設計については、アトキンソン、ドネフ、トビアスの教科書、ガフケとハイリガースの概説、プケルスハイムの数学的テキストで議論されています。最適設計のブロッキングについて は、アトキンソン、ドネフ、トビアスの教科書、およびグースのモノグラフで議論されています
最も初期の最適設計は、連続変数を持つ回帰モデルのパラメータを推定するために開発されました。例えば、 1815年にJ.D. Gergonneによって開発されました(スティグラー)。英語では、 Charles S. Peirce とKirstine Smith による初期の貢献が2件ありました。
多変量応答曲面 の先駆的なデザインは、ジョージ・E・P・ボックス によって提案されました。しかし、ボックスのデザインは最適性に関する特性がほとんどありません。実際、ボックス・ベンケンデザインは、 変数の数が3を超えると過剰な実験回数を必要とします。[ 28 ] ボックスの「中心複合」デザインは、 河野の最適デザインよりも多くの実験回数を必要とします。[ 29 ]
システム同定と確率近似 逐次実験の最適化は、確率 計画法 やシステム 制御においても研究されている。よく用いられる手法には、確率近似法やその他の 確率最適化 手法などがある。この研究の多くは、システム同定 という分野と関連している。[ 30 ] 計算最適制御 において、D. Judin、A. Nemirovskii、そしてBoris Polyakは、 GEP Boxが 応答曲面法 で導入した( Armijoスタイルの )ステップサイズ規則 よりも効率的な手法を報告している。[ 31 ]
適応型デザインは 臨床試験 で使用されており、最適な適応型デザインについて は、 Shelemyahu Zacks 著の 「Handbook of Experimental Designs」の 章で概説されています。
実験実行回数の指定
コンピュータを使って良いデザインを見つける 実験回数または反復回数に事前 制約がある場合、最適な計画を見つける方法はいくつかあります。これらの方法のいくつかは、アトキンソン、ドネフ、トビアス、およびハーディンとスローン による論文で議論されています。もちろん、実験回数を事前に 固定することは現実的ではありません。賢明な統計学者は、実験回数が異なる他の最適な計画を検討します。
確率測度計画の離散化 最適実験に関する数学理論において、最適計画とは、観測場所の無限集合に基づく 確率測度 である。このような最適確率測度計画は、観測と実験実行のコストを特定しない数学的問題を解決する。しかしながら、このような最適確率測度計画は離散化することで、 近似的に 最適な計画を提供することができる。[ 32 ]
場合によっては、観測点の有限集合で最適設計をサポートするのに十分である。このような結果は、二次関数モデルの 応答曲面設計 に関する研究において、KônoとKieferによって証明された。Kôno-Kiefer分析は、応答曲面の最適設計が離散的なサポートを持つことができる理由を説明する。これは、 応答曲面法 において従来用いられてきた効率の低い設計と非常によく似ている。[ 33 ]
歴史 スティグラー によれば、1815 年にジョセフ・ディアス・ジェルゴンヌ によって多項式回帰 の最適設計に関する論文が出版された。
チャールズ・S・パースは 1876年に科学実験の経済理論を提唱し、推定値の精度を最大化することを目指しました。パースの最適配分は重力実験の精度を即座に向上させ、パースとその同僚によって数十年にわたって用いられました。1882年にジョンズ・ホプキンス大学 で発表された講演で、パースは実験計画法を次のように紹介しました。
論理は、重力加速度やオームの値を最もよく決定するためにどのような実験を行うべきかを教えてくれるわけではありません。しかし、実験計画を立てるためにどのように進めればよいかは教えてくれます。 [....] 残念ながら、実践は理論に先行することが多く、最初は何かと途方もない方法で物事を成し遂げ、後になってもっと簡単に完璧にできたはずなのに、と気づくのが人類の通常の運命なのです。[ 34 ]
カースティン・スミスは1918 年に多項式モデルの最適設計を提案しました。(カースティン・スミスはデンマークの統計学者 トーヴァル・N・ティーレ の弟子であり、ロンドンでカール・ピアソン と共に研究していました。)
参照
注記 ^ ノルドストローム(1999年 、176ページ)^ 形容詞「optimum」(「optimal」ではない)は「英語ではやや古い形式で、「optim(um) + al」という構文を避けています。ラテン語には「optimalis」はありません」(Atkinson、Donev、Tobias著『Optimum Experimental Designs, with SAS』のxページ)。 ^ Guttorp, P.; Lindgren, G. (2009). 「カール・ピアソンとスカンジナビア統計学派」. International Statistical Review . 77 : 64. CiteSeerX 10.1.1.368.8328 . doi : 10.1111/j.1751-5823.2009.00069.x . S2CID 121294724 . ^ スミス、カースティン (1918). 「観測された多項式関数とその定数の調整値および補間値の標準偏差、ならびにそれらが観測分布の適切な選択に向けて与える指針について」 . Biometrika . 12 (1/2): 1– 85. doi : 10.2307/2331929 . JSTOR 2331929 . ^ これら 3 つの利点 (最適設計の) は、Atkinson、Donev、Tobias の教科書に記載されています。 ^ このような基準は最適化理論 では目的関数 と呼ばれます。 ^ フィッシャー情報量 やその他の「情報 」関数は 統計理論 における基本的な概念です。 ^ 伝統的に、統計学者は、共分散行列(平均 -不偏推定量 )の何らかの要約統計量(通常は正の実数値( 行列式 または行列トレース など))を考慮して推定量と計画を評価してきた。正の実数を扱うことにはいくつかの利点がある。単一のパラメータの推定量が正の分散を持つ場合、分散とフィッシャー情報量は両方とも正の実数である。したがって、これらは非負の実数の凸錐の要素である(その非ゼロの要素は同じ錐内に逆数を持つ)。 いくつかのパラメータについては、共分散行列と情報行列は、 Loewner (Löwner) 順序の下、半 順序ベクトル空間 の非負定値対称行列の凸錐の要素である。この錐は、行列間の加算、行列の反転、および正の実数と行列の乗算に対して閉じている。行列理論と Loewner 順序の説明が Pukelsheim に掲載されています。 ^ Shin, Yeonjong; Xiu, Dongbin (2016). 「最小二乗線形回帰における非適応的準最適点選択」. SIAM Journal on Scientific Computing . 38 (1): A385– A411. Bibcode : 2016SJSC...38A.385S . doi : 10.1137/15M1015868 . ^ Atkinson, AC; Fedorov, VV (1975). 「2つの競合モデルを区別するための実験計画法」 . Biometrika . 62 (1): 57– 70. doi : 10.1093/biomet/62.1.57 . ISSN 0006-3444 . ^ 上記の最適性基準は、対称正半正定値行列 の領域上の凸関数です。多くの図解と統計的応用が掲載されている実務家向けのオンライン教科書を参照してください。 Boyd, Stephen P.; Vandenberghe, Lieven (2004).凸最適化 (PDF) . Cambridge University Press. ISBN 978-0-521-83378-3 2011年 10月15日 閲覧 (PDF版書籍) Boyd と Vandenberghe は 384 ~ 396 ページで最適な実験設計について説明しています。 ^ 「関心パラメータ」 と コントラスト の最適性基準については、Atkinson、Donev、Tobias によって議論されています。 ^ 反復法と近似アルゴリズムについては、Atkinson、Donev、Tobias の教科書、Fedorov (歴史的) と Pukelsheim のモノグラフ、および Gaffke と Heiligers の概説記事で概説されています。 ^ Kiefer(「バイアス付きマルチレスポンス表面のフィッティングのための最適設計」289〜299ページ)を参照。 ^ このようなベンチマークについては、Atkinsonらによる教科書やKieferの論文で議論されています。モデル ロバスト設計(「ベイズ」設計を含む)については、 ChangとNotzが概説しています。 ^ コーネル、ジョン(2002年) 『混合物の実験:デザイン、モデル、そして混合物データの分析』 (第3版)ワイリー社 ISBN 978-0-471-07916-3 。 (400~401ページ)^ 「普遍最適性」の入門書は、アトキンソン、ドネフ、トビアスの教科書に掲載されています。より詳細な解説は、プケルスハイムの上級教科書とキーファーの論文に記載されています ^ 計算方法については、Pukelsheim と Gaffke および Heiligers によって議論されています。 ^ キーファー-ウォルフォウィッツ 同値定理については 、 アトキンソン、ドネフ、トビアスの第 9 章で説明されています。 ^ プケルシャイムは凸解析を用いて、 凸関数 のルジャンドル -フェンシェル共役性と関連したキーファー-ウォルフォウィッツ 同値 定理を 研究し て いる。対称正半定値行列 の領域における凸関数 の 最小化は 、多くの図解と統計的応用を含む実践者向けのオンライン教科書で説明されている。 凸最適化 ケンブリッジ大学出版局 2004年 (PDF版書籍) Boyd と Vandenberghe は 384 ~ 396 ページで最適な実験設計について説明しています。 ^ Atkinison、Donev、Tobiasの第20章を参照。 ^ ベイズ設計 については、アトキンソン、ドネフ、トビアスによる教科書の第18章で解説されています。より高度な議論は、フェドロフとハックルのモノグラフ、チャロナーとヴェルディネリ、そしてダスグプタの論文で展開されています。ベイズ設計 と「モデルロバスト」設計のその他の側面については、チャンとノッツが解説しています。^ 「ベイズ 最適性」 の代替としてフェドロフとハックルは「平均最適性」を提唱している。 ^ Wald, Abraham (1945年6月). 「統計的仮説の逐次検定」 . 数理統計年報 . 16 (2): 117–186 . doi : 10.1214/aoms/1177731118 . JSTOR 2235829 . ^ Chernoff, H. (1972)逐次分析と最適設計、 SIAM モノグラフ。 ^ Zacks, S. (1996)「パラメトリックモデルのための適応型デザイン」Ghosh, S.およびRao, CR, (編) (1996).実験計画法と分析, 統計ハンドブック, 第13巻. North-Holland. ISBN 0-444-82061-2 (151~180ページ) ヘンリー ・P・ウィン は、以下の巻の17~24ページにある序文「ジャック・キーファーの実験計画への貢献」の中で、「現代の最適設計理論は、 アブラハム・ウォルド によって創設された米国統計学の意思決定理論学派にその起源を持つ」と述べている キーファーは 、この記事の多くのページ(273ページ(再版では55ページ)、280ページ(62ページ)、289~291ページ(71~73ページ)、294ページ(76ページ)、297ページ(79ページ)、315ページ(97ページ)、319ページ(101ページ))で、ワルドの影響と成果を認めている。 ^ 応答曲面法 の分野では、 Box-Behnken設計 の非効率性が WuとHamadaによって指摘されています(422ページ)。 「フォローアップ」実験のための最適な設計については、ウーとハマダが議論しています ^ Box の 「中心複合」計画 の 非効率性 については、Atkinson、Donev、Tobias(165ページ)によって議論されている。これらの著者は、二次応答曲面 におけるKôno型計画のブロッキング についても議論している。 ^ システム識別においては、以下の書籍に最適実験設計に関する章があります。 ^ Judin & Nemirovskii とPolyak のステップサイズ規則は、 Kushner と Yin の教科書で説明されてい ます。 ^ 近似 最適設計を提供するための最適確率測度設計の 離散化について は、アトキンソン、ドネフ、トビアス、およびプケルシャイム(特に第12章)によって議論されています ^ 二次応答曲面 の設計に関しては、河野とキーファー の結果はアトキンソン、ドネフ、トビアスで議論されている。数学的には、これらの結果はチェビシェフ多項式 、マルコフシステム、モーメント空間と関連している。 ^ Peirce, CS (1882)、「論理学入門講義」1882年9月、ジョンズ・ホプキンス大学回覧誌 第2巻、第19号、11~12頁、1882年11月、11頁を参照、 Google Books Eprint。Collected Papers第7巻、59~76段落、59頁と63頁を参照、 Writings of Charles S. Peirce 第4巻、378~382頁、378頁と379頁を参照、 The Essential Peirce第1巻 、 210~214頁、210~211頁を参照、また211頁の下部にも転載。
参考文献 アトキンソン, AC; ドネフ, AN; トビアス, RD (2007). SAS を用いた最適実験計画 オックスフォード大学出版局 pp. 511+xvi. ISBN 978-0-19-929660-6 。 チャーノフ、ハーマン (1972).逐次解析と最適設計 . 応用数学協会. ISBN 978-0-89871-006-9 。フェドロフ、VV (1972).最適実験理論 . アカデミックプレス Fedorov, Valerii V.; Hackl, Peter (1997).モデル指向実験計画法 . 統計学講義ノート. 第125巻. Springer-Verlag. グース、ピーター (2002).ブロック実験と分割実験の最適設計 . 統計学講義ノート. 第164巻. シュプリンガー. 2020年10月31日時点のオリジナルよりアーカイブ. 2009年5月28日 閲覧 . Kiefer, Jack Carl (1985). Brown ; Olkin, Ingram ; Sacks, Jerome ; et al. (eds.). Jack Carl Kiefer: Collected papers III—Design of experiments . Springer-Verlag and the Institute of Mathematical Statistics. pp. 718+xxv. ISBN 978-0-387-96004-3 。ロゴテティス, N.;ウィン, H. P. (1989).デザインによる品質:実験デザイン、オフライン品質管理、そして田口の貢献 . オックスフォード大学出版局, pp. 464+xi. ISBN 978-0-19-851993-5 。 ノルドストローム, ケネス (1999年5月). 「グスタフ・エルヴィングの生涯と業績」 .統計科学 . 14 (2): 174–196 . doi : 10.1214/ss/1009212244 . JSTOR 2676737. MR 1722074 . Pukelsheim, Friedrich (2006).実験の最適計画 . 応用数学の古典. 第50巻(Wiley (0-471-61971-X) 1993版の正誤表と新しい序文を追加した再出版). Society for Industrial and Applied Mathematics . pp. 454+xxxii. ISBN 978-0-89871-604-7 。Shah, Kirti R. & Sinha, Bikas K. (1989).最適計画理論 . 統計学講義ノート. 第54巻. Springer-Verlag. pp. 171+viii. ISBN 978-0-387-96991-6 。
さらに詳しい情報
実務家と学生のための教科書
回帰分析と応答曲面法を強調した教科書 Atkinson、Donev、Tobias による教科書は、大学のコースだけでなく、産業界の実務家向けの短期コースでも使用されてきました。
ブロック設計を重視した教科書 最適ブロック設計は 、ベイリーとバパットによって論じられています。バパットの本の第1章では、ベイリー(または下記の上級者向けの書籍)が用いた線型代数 を復習しています。ベイリーの演習問題とランダム化 に関する議論はどちらも、代数計算ではなく統計的概念に重点を置いています
最適なブロック設計 については、Shah と Sinha による高度なモノグラフと Cheng および Majumdar による調査記事で説明されています。
プロの統計学者や研究者向けの書籍
論文と章
歴史的