
統計学において、層別ランダム化とは、まず調査対象集団全体を同じ属性または特徴を持つ層と呼ばれるサブグループに層別化し、次に層別グループから単純ランダムサンプリングを行うサンプリング方法である。この場合、同じサブグループ内の各要素は、サンプリング プロセスのどの段階でも偏りなく、無作為に、完全に偶然に選択される。[1] [2]層別ランダム化は、層別サンプリングの一部であると考えられており、調査対象集団のサブグループ間で部分的に共有属性が存在し、そのサブグループ間で大きく異なるため、サンプリング中に特別な考慮や明確な区別が必要な場合に採用されるべきである。[3]このサンプリング方法は、集団全体を代表するためにいくつかのクラスター全体の単純ランダムサンプルが選択されるクラスターサンプリングや、層別プロセスの後に体系的なサンプリングが実行される層別体系的サンプリングとは区別されるべきである。
層別ランダムサンプリングの手順
層別ランダム化は、対象集団が異質である場合に非常に有用であり、研究対象の傾向や特性が層間でどのように異なるかを効果的に示すことができる。[1]層別ランダム化を実施する際には、以下の8つの手順を実行する必要がある。[4]
- 対象集団を定義します。
- 層化変数を定義し、作成する層の数を決定します。層化変数を定義する基準には、年齢、社会経済的地位、国籍、人種、教育水準などがあり、研究目的に沿ったものでなければなりません。理想的には4~6層とするのが良いでしょう。層化変数の数が増えると、一部の変数が他の変数の影響を打ち消す可能性が高くなるためです。
- サンプリングフレームを用いて、対象集団内のすべての要素を評価します。評価後、対象範囲とグループ分けに基づいて変更を加えます。
- すべての要素を列挙し、標本抽出結果を考慮する。各層は相互に排他的で、母集団の全構成員をカバーするように合計される必要がある。一方、母集団の各構成員は、他の構成員との差異が最小限であるのと同様に、それぞれ独自の層に属する必要がある。 [4]
- ランダムサンプリングの選択基準を決定します。これは手動で行うことも、設計されたコンピュータプログラムを使用して行うこともできます。
- すべての要素にランダムで一意の番号を割り当て、割り当てられた番号に従ってこれらの要素を並べ替えます。
- 各層の規模と、各層における全要素の数値分布を確認します。サンプリングの種類(比例抽出法または不比例抽出法)を決定します。
- ステップ5で定義した選択ランダムサンプリングを実施します。最終サンプルにすべての層の代表が含まれるように、各層から少なくとも1つの要素を選択する必要があります。各層から2つ以上の要素を選択した場合、収集されたデータの誤差範囲を計算できます。
層別ランダム割り当て
層別ランダム化は、上で説明したように、母集団から被験者をランダムにサンプリングすることを指すだけでなく、被験者に治療法をランダムに割り当てることも指します。
この文脈において、層別ランダム化は、1つまたは複数の予後因子を用いて、平均的に同様の参加特性を持つサブグループを作成する。患者因子は、先行研究における転帰を検討することで正確に決定することができる。[5]
サブグループの数は、各因子の層数を乗じることで計算できます。因子はランダム化の前またはランダム化時に測定され、被験者は測定結果に基づいて複数のサブグループまたは層に分割されます。[6]
各層内では、単純ランダム化、ブロックランダム化、最小化など、いくつかのランダム化戦略を適用できます。
層内単純ランダム化
単純無作為化は、各層における被験者の割り当てにおいて最も容易な方法と考えられています。被験者は、各割り当てにおいて、純粋に無作為に各グループに割り当てられます。実施は容易ですが、サンプル数が少ないと割り当てが不平等になるため、100以上のサンプルを含む層では単純無作為化が一般的に適用されます。[6]
層内のブロックランダム化
ブロックランダム化(並べ替えブロックランダム化とも呼ばれる)は、同じ層の被験者を研究の各グループに均等に割り当てるブロック方式です。ブロックランダム化では、割り当て比率(特定のグループに対する他のグループの数の比率)とグループサイズが指定されます。ブロックサイズは、各層のサンプルを意図した比率で治療グループに割り当てることができるように、治療数の倍数でなければなりません。[6]例えば、年齢とリンパ節転移状態が2つの予後因子であり、各因子が2つのレベルに分割されている乳がんの臨床試験では、4つまたは8つの層が必要です。異なるブロックは、ランダムリストやコンピュータプログラミングなど、複数の方法でサンプルに割り当てることができます。[7] [8]
ブロックランダム化は、比較的大きなサンプルサイズを持つ実験において、重要な特性を持つサンプルの不均衡な割り当てを避けるために一般的に用いられる。臨床試験など、ランダム化の要件が厳しい分野では、実施者に対する盲検化プロセスがなく、ブロックサイズが限られている場合、割り当ては予測可能である。層内のブロックを並べ替えるランダム化は、層数が増加し、サンプルサイズが限られている場合、層間でサンプルの不均衡を引き起こす可能性がある。例えば、特定の層の特性を満たすサンプルが見つからない可能性がある。[9]
最小化法
各治療群の類似性を保証するために、「最小化」法が試みられます。これは、層内のランダムなブロック順列法よりも直接的な方法です。最小化法では、各層内のサンプルは、各治療群のサンプルの合計に基づいて治療群に割り当てられます。これにより、群間の被験者数のバランスが保たれます。[6]複数の治療群の合計が同じ場合は、単純ランダム化によって治療群が割り当てられます。実際には、最小化法では、予後因子による治療群の割り当てを毎日記録する必要があります。これは、インデックスカードを使用して記録することで効果的に行うことができます。最小化法は、群間の不均衡を効果的に回避しますが、ランダム化処理は治療群の合計が同じ場合にのみ行われるため、ブロックランダム化よりもランダム化処理が少なくなります。実行可能な解決策は、追加のランダムリストを適用し、周辺合計の合計が小さい治療群の確率を高くし(例:¾)、他の治療群の確率を低くする(例:¼)ことです。[10]
応用

層別ランダムサンプリングは、特定の層に異なる重み付けが必要な状況において有用かつ生産的です。これにより、研究者は各層の選択メカニズムを操作することで、調査結果における望ましい特性を増幅または最小化することができます。[11]
層別ランダム化は、研究者が2つ以上の層間の関連性を探る際に有用です。単純ランダムサンプリングでは、対象集団の代表性が不平等になる可能性が高くなるためです。また、層別ランダムサンプリングでは共分散とp値を調整できるため、観察研究において交絡因子を排除したい場合にも有用です。[12]
層別無作為抽出法は、母集団を代表する要素の関連性が高いため、単純無作為抽出法と比較して統計的精度が高くなります。層内の差異は、層間の差異に比べてはるかに小さくなります。したがって、標本間の差異が最小化されると、標準偏差も縮小され、最終結果の精度が向上し、誤差も小さくなります。これにより、必要な標本サイズが効果的に削減され、研究資金が限られている場合の標本抽出の費用対効果が向上します。
現実世界では、層別無作為抽出法は選挙の世論調査の結果、社会集団間の所得格差の調査、あるいは国々間の教育機会の測定などに応用することができます。[1]
臨床試験における層別ランダム化
臨床試験では、患者は社会的背景や個人的背景、あるいは研究に関連するあらゆる要因に応じて層別化され、患者集団全体の中で各グループが適合するようにする。その目的は、臨床因子と予後因子のバランスをとることである。なぜなら、研究デザインのバランスが取れていなければ、試験は有効な結果をもたらさないからである。[13]層別ランダム化のステップは、意図的であろうと偶発的であろうと、偏りが研究対象の患者サンプルの代表性に影響を与えないようにするための試みとして、極めて重要である。[14]特に小規模臨床試験(n<400)においては、層別化された既知の臨床特性が介入の結果に影響を及ぼすと考えられるため、研究の検出力が向上する。[15]これは、臨床試験で高く評価される第1種の過誤の発生を防ぐのに役立つ。 [16] また、これは実薬対照同等性試験のサンプルサイズにも重要な影響を及ぼし、理論的にはサブグループ解析や中間解析を容易にする。[16]
アドバンテージ
層別ランダム化の利点は次のとおりです。
- 層別ランダム化は、サンプル全体を層別化し、サンプルの重要な特性を治療群間でバランスさせるために影響因子を適用するため、一般集団の結果を正確に反映することができます。例えば、層別ランダム化を適用して母集団から100人のサンプルを作成すると、各治療群における男女のバランスが保証されます。一方、単純ランダム化では、あるグループには男性が20人しかいないのに、別のグループには男性が80人しかいないといった結果になる可能性があります。[6]
- 層別ランダム化は、クラスターサンプリング、単純ランダムサンプリング、系統的サンプリング、非確率法といった他のサンプリング方法よりも分散を低く抑えることができます。これは、層内の測定値の標準偏差を低く抑えることができるためです。分割層ランダム化は、一般サンプルを単純にランダム化するよりも管理しやすく、場合によってはコストも低くなります。[10]
- 層別ランダム化の性質が正確であるため、チームがサンプルを層別化するためのトレーニングを受けることは容易です。[6]
- 集団内のグループの母集団パラメータの推定値を得るために、層別ランダム化が望ましい場合がある。[10]
デメリット
層別ランダム化の限界は次のとおりです。
- 層別ランダム化では、まず予後因子に基づいてサンプルを複数の層に分割しますが、サンプルを分割できない場合もあります。適用に際しては、予後因子の重要性が厳密に認められない場合があり、それがさらなるバイアスにつながる可能性があります。そのため、因子を層別化に含める前に、結果に影響を与える可能性を検討する必要があります。因子が結果に与える影響が認められない場合には、非層別ランダム化が提案されます。[17]
- 利用可能なデータがサブグループ全体の人口を代表できない場合、サブグループサイズは同等の重要性を持つものとみなされます。一部の応用では、サンプルサイズをサブグループサイズに合わせてスケーリングするのではなく、利用可能なデータ量を参照してサブグループサイズが決定されます。これは要因の影響にバイアスをもたらす可能性があります。データを分散によって層別化する必要がある場合、サブグループ間の分散が大きく異なるため、各サブグループのサンプルサイズがサブグループ全体の人口に比例することが保証されません。[18]
- 層の選択が適切でない場合、他の手法よりもパフォーマンスが低下します。特に、層内の分散が大きい場合に顕著です。
- サンプルをサブグループに割り当てるプロセスでは、被験者が複数層の包含基準を満たしている場合、重複が発生する可能性があり、その結果、母集団が誤って表現される可能性があります。[18]
参照
参考文献
- ^ abc Nickolas, Steven (2019年7月14日). 「層別ランダムサンプリングの仕組み」. Investopedia . 2020年4月7日閲覧。
- ^ 「単純無作為標本」、Wikipedia、2020年3月18日、 2020年4月7日閲覧
- ^ 「層別サンプリング」、Wikipedia、2020年2月9日、 2020年4月7日閲覧
- ^ ab Stephanie (2013年12月11日). 「層別ランダムサンプル:定義と例」.統計ハウツー. 2020年4月7日閲覧。
- ^ シルベスター, リチャード (1982年12月). 「臨床試験の基礎」.対照臨床試験. 3 (4): 385– 386. doi :10.1016/0197-2456(82)90029-0. ISSN 0197-2456.
- ^ abcdef Pocock, Stuart J. (2013年7月1日). 『臨床試験:実践的アプローチ』 チチェスター: John Wiley & Sons Ltd. ISBN 978-1-118-79391-6. OCLC 894581169。
- ^ 「Sealed Envelope | Random permuted blocks」. www.sealedenvelope.com . 2020年2月25日. 2020年4月7日閲覧。
- ^ Friedman, Lawrence M.; Furberg, Curt D.; DeMets, David L. (2010)「臨床試験入門」『臨床試験の基礎』 Springer New York, pp. 1– 18, doi :10.1007/978-1-4419-1586-3_1, ISBN 978-1-4419-1585-6
{{citation}}: CS1 maint: ISBNによる作業パラメータ(リンク) - ^ 臨床試験の基礎. Friedman, Lawrence M., 1942-, Furberg, Curt,, DeMets, David L., 1944-, Reboussin, David,, Granger, Christopher B. (第5版). ニューヨーク. 2015年8月27日. ISBN 978-3-319-18539-2. OCLC 919463985.
{{cite book}}: CS1 メンテナンス: 場所の発行元がありません (リンク) CS1 メンテナンス: その他 (リンク) - ^ abc Pocock, SJ (1979年3月). 「臨床試験における患者の治療への割り当て」.バイオメトリクス. 35 (1): 183– 197. doi :10.2307/2529944. ISSN 0006-341X. JSTOR 2529944. PMID 497334.
- ^ Crossman, Ashley (2020年1月27日). 「層別サンプルの理解とその作成方法」ThoughtCo . 2020年4月7日閲覧。
- ^ ヘネケンス, チャールズ H. (1987). 『医学における疫学』 ジュリー E. バーリング, シェリー L. メイレント (第1版). ボストン, マサチューセッツ州: リトル・ブラウン. ISBN 0-316-35636-0. OCLC 16890223。
- ^ Polit, DF; Beck, CT (2012). 『看護研究:看護実践のためのエビデンスの生成と評価』第9版. フィラデルフィア、米国: Wolters Klower Health: Lippincott Williams & Wilkins.
- ^ 「臨床試験における患者層別化」Omixon | HLA用NGS . 2014年12月1日. 2020年4月26日閲覧。
- ^ Stephanie (2016年5月20日). 「臨床試験における層別ランダム化」.統計学入門. 2020年4月26日閲覧。
- ^ ab Kernan, W (1999年1月). 「臨床試験のための層別ランダム化」. Journal of Clinical Epidemiology . 52 (1): 19– 26. doi : 10.1016/S0895-4356(98)00138-3 . PMID 9973070.
- ^ Murphy, Chris B. (2019年4月13日). 「層別ランダムサンプリングの長所と短所」. Investopedia . 2020年4月7日閲覧。
- ^ ab Glass, Aenne; Kundt, Guenther (2014),ランダム化法における層別化の潜在的な利点と欠点、Springer Proceedings in Mathematics & Statistics、vol. 114、Springer New York、pp. 239– 246、doi :10.1007/978-1-4939-2104-1_23、ISBN 978-1-4939-2103-4