デフレートシャープレシオ(DSR)は、投資戦略のシャープレシオが統計的に有意かどうかを判断するために使用される統計手法であり、2014年にグッゲンハイム・パートナーズとコーネル大学のマルコス・ロペス・デ・プラドと、ローレンス・バークレー国立研究所のデビッド・H・ベイリーによって開発されました。DSRは、選択バイアス、バックテストの過剰適合、サンプルの長さ、およびリターン分布の非正規性を補正し、特に多くの試行を評価する場合に、財務パフォーマンスのより信頼性の高いテストを提供します。[1] DSRを適用することで、実務家は誤った投資戦略を検出できます。
DSRは、シダック補正のような従来の手法と比較して、多重検定に対してより正確で堅牢な調整を提供します。これは、多くの試行の中から最良のものを選択することから生じる選択バイアスと、シャープ比に固有の推定不確実性の両方を明示的にモデル化するためです。独立性を仮定し、検定回数のみに基づいてp値を調整するシダックとは異なり、DSRはシャープ推定値の分散、検定回数、およびクラスタリングによって推定されることが多いそれらの実効独立性を考慮します。これにより、データマイニング環境における誤った発見の真の確率を反映した、より現実的な統計的有意性の閾値が得られます。その結果、DSRは特に金融分野に適しています。金融分野では、研究者は強力な事前仮説なしに、収益性の高い戦略を求めて大規模で相関のある探索を行うことが多いからです。[2] [3]
シャープ比との関係
投資戦略のパフォーマンスを評価するための最も重要な統計の一つは、シャープレシオ(SR)です。シャープレシオはウィリアム・F・シャープによって開発され、リスク調整後リターンの指標として広く使用されています。これは、リスクフリーレートに対する超過リターンの年率とリターンの標準偏差の比率として計算されます。シャープレシオは有用ですが、特に複数の戦略評価に適用する場合、重要な限界があります。大規模なセットから最高のパフォーマンスを示す戦略を選択する選択バイアスや、戦略が過去のデータに合わせて調整されるバックテストの過剰適合などの問題により、シャープレシオが過大評価され、戦略の有効性について誤った結論につながる可能性があります。さらに、シャープレシオは正規分布のリターンを前提としていますが[4] 、実際にはこの前提に反することが多く、サンプルの長さも考慮されていません[5] 。
デフレートされたシャープレシオの実際の適用
1. すべての試行の記録を取得する
DSRを適用するには、研究者は実行したすべてのバックテストについて、投資パフォーマンスをリターン(%)で記録する必要があります。これは、単一の特定の戦略の開発に関連しています。例えば、終値で取引するモメンタムベースの戦略を構築する場合、パフォーマンスを評価するために100回のヒストリカルシミュレーションを実行し、最終的な戦略に最適なパラメータセットを選択しました。ここでは、100回のシミュレーションすべてを、戦略の日次リターン(%)とともに記録する必要があります。
2. 有効試行回数の推定N
実際には、多くの試行は特徴の重複のために独立していません。有効な独立試行数Nを推定するために、López de Prado (2018)は、教師なし学習技術 を用いて類似の戦略をクラスタリングする3つの手法を提案しています。
- 最適クラスター数(ONC)アルゴリズム。[2] [6] [7]
- 階層的クラスタリングは、 Nの保守的な下限値を得るために使用できます。
- あるいは、スペクトル法(例:相関行列の固有値分布)によってもNを推定できます。[2]
ヒント:
- 不必要に多数の試行を実行することを避けるため、多重検定は事前に慎重に計画する必要があります。計算能力ではなく投資理論が、どのような実験を行う価値があるかを判断するべきです。[1]
Nを推定する手順:
2.1.相関行列を距離行列に変換する
リターンデータにクラスタリングアルゴリズムを適用するには、統計的関連尺度(相関行列など)を使用し、それを距離行列(角距離など)に変換する必要があります。これにより、互いに非常に類似した要素が高次元空間で互いに近くなります。[8] [9]
2.2.クラスタリングアルゴリズムを適用して独立試行回数を推定する
クラスター数Nは、独立試行回数の推定値です。
2.3ブロック相関行列をプロットする
下の図は、クラスタリングを適用する前と適用後の相関行列を示しています。対角線上にブロックが表示されていることに注目してください。各ブロックはクラスターに対応しています。[7]

ヒント:ONCアルゴリズムを使用してクラスタリングを行わない場合、ブロック内の試行があまり一致しない可能性があります。ONCアルゴリズムは、シルエットスコアを使用して各試行が最適なクラスターに含まれるようにしますが、計算の複雑さが増し、実行時間が長くなります。
3. クラスター間のシャープ比の分散を計算します
3.1各クラスターのシャープ比を計算します。
各クラスターは時系列リターン(%)の集合を形成します。各クラスターについて、逆分散ポートフォリオ(IVP)を使用してそのクラスターを表す新しい時系列を作成し、各IVPポートフォリオのシャープレシオを計算します。IVPを使用する必要はありません。目標は、集約されたクラスターリターンの時系列を形成することです。そのためには加重スキームを使用する必要がありますが、別の方法としては最小分散ポートフォリオがあります。[7]
3.2これらのシャープレシオの分散を計算する
は次のステップで使用され、フォールス戦略定理を適用して期待最大シャープレシオを決定します。
4. フォールス戦略定理を使用して期待最大シャープレシオを計算する
誤った戦略定理(FST) [10]の式を用いて、未熟な戦略 から期待される最高のシャープレシオを反映する閾値シャープレシオを計算できます。
ここで、
- は試行全体にわたるシャープレシオの横断的分散、
- はオイラー・マスケロニ定数(約0.5772)、
- はオイラー数、
- は逆標準正規CDF、
- は独立した戦略試行の数です。[1]
注:
FSTは、未知の数の過去のシミュレーションの最適な結果は右非有界であり、十分な試行回数があれば、戦略が誤りである、つまり過剰適合しておりサンプル外データでは一般化しないという仮説を棄却するのに十分な大きさのシャープレシオは存在しないことを強調しています。[5] [7]

5. 各クラスターのDSRを計算する
これで、DSRを計算するために必要なすべての変数が揃いました。
ここで、
- は観測されたシャープ・レシオ(年率化されていない)、
- は未熟練戦略から期待される最高のシャープ・レシオを反映する閾値シャープ・レシオ、
- はリターンの歪度です。
- はリターンの尖度、
- はリターンのサンプル長です
- は標準正規累積分布関数です。
注記:
- 読者は、DSRが確率的シャープレシオ(PSR)[11]であることに気付くかもしれません。ここで、は単純な閾値SR(多くの場合0)ではなく、期待される最大のシャープレシオ(フォールスストラテジー定理を使用して推定)です
- PSRは、1回の試行のみが実行されたと仮定し、観測されたSRが0より大きいかどうかを判断するためによく使用されます。
- 多重検定を考慮するには、DSRを使用します。
- DSRは以下の場合に増加します。
- 観測されたSRが大きい。
- 実績が長い。
- 正に歪んだリターン。
- DSRは以下の場合に減少します。
- 裾が厚い(尖度が高い)。
6. 多重検定を開示するためのテンプレートを完成させる
6.1統計を表に集計する
いくつかの査読済み論文では、クラスター統計を表形式で集約することを推奨しています。[6] [12] [13]
以下の表は、「最適なクラスター数アルゴリズムの実践者ガイド」の図表7です。[6]
![多重検定開示テンプレート [6]](http://upload.wikimedia.org/wikipedia/commons/thumb/6/65/Cluster_statistics.jpg/440px-Cluster_statistics.jpg)
ここで、
- クラスターはクラスターのインデックスです。クラスターはN個あります。
- 戦略数は、そのクラスターに含まれる戦略の数です。
- aSRは、そのクラスターの逆分散ポートフォリオ(IVP)の年率シャープレシオです。
- SRは、そのクラスターのIVPの非年率シャープレシオです。
- 歪度は、そのクラスターのIVPのリターンの歪度です。
- Kurtは、そのクラスターのIVPのリターンの尖度です。
- Tは、クラスターのIVP内の観測値の数です
- sqrt(V[SR])は、ステップ3で計算されたシャープレシオの分散の平方根です。
- E[max SR]は、ステップ4で計算された期待最大シャープレシオ()です。
- DSRは、そのクラスターのIVPのデフレートシャープレシオです。
6.2各クラスターのシャープレシオをプロットします。

上の図は、この投資戦略の開発においてテストされた26の独立した試行の非年次化シャープレシオの集合を示しています。棒グラフは、95%の信頼水準でDSRをクリアしたかどうかに基づいて強調表示されています
この棒グラフは上記の図7の表とは対応していませんが、1つのクラスターのみがDSRに合格したという結果を共有していることに注意してください。この分析の目的は、1つを除くすべてのクラスターがDSRに不合格であったことを示すことです。これは、戦略が過剰適合しており、誤った投資戦略である可能性が高いことを示しています。
6.3戦略の累積リターンをプロットします。

上の図では、累積リターンがプロットされています。y軸は%で表した総リターン、x軸は時間指標です。非常に直線的な線(外れ値のパフォーマンスを持つ戦略)が見えますか?
7. これらの結果から結論を導き出してください。
累積リターンのプロットからわかるように、外れ値の戦略が1つあります。この外れ値は、自身のクラスターや他のクラスターと比較して非常に高いパフォーマンスを示しているため、誤った投資戦略である可能性があります
棒グラフを見ると、この外れ値戦略を含むポートフォリオを除いて、すべてのクラスターポートフォリオが95%の信頼度でDSRをパスできなかったことがわかります。
数学的定義
デフレート・シャープ・レシオ(DSR)
ここで、
- は観測されたシャープ・レシオ(年率化されていない)、
- は未熟練戦略から期待される最高のシャープ・レシオを反映する閾値シャープ・レシオ、
- はリターンの歪度、
- はリターンの尖度、
- はリターンのサンプル長です
- は標準正規累積分布関数です。
閾値は次のように近似されます。
ここで、
- は試行全体にわたるシャープレシオの横断的分散、
- はオイラー・マスケロニ定数(約0.5772)、
- はオイラー数、
- は逆標準正規CDF、
- は独立した戦略試行の数です。[1]
誤った戦略定理:記述と証明
誤った戦略定理は、多くの未熟な戦略の中で最良のシャープレシオが、純粋に偶然によってどれだけゼロを超えると予想されるかを定量化することにより、縮小シャープレシオ(DSR)の理論的根拠を提供します。テストされたすべての戦略の真のシャープレシオがゼロであっても、観測される最高のシャープレシオは通常、修正されない限り正で統計的に有意になります。DSRはこの膨張を修正します。[10]
記述
平均がゼロで分散がの正規分布から独立して抽出されたシャープレシオをそれぞれとします。これらの試行における期待される最大シャープレシオは、おおよそ次のようになります。
ここで、
- は標準正規分布の分位関数(逆CDF)です。
- はオイラー・マスケロニ定数です。
- はオイラー数です。
- は独立した試行回数です。
この値は、スキルがないという帰無仮説の下での**期待最大シャープレシオ**です。これは、観測されたシャープレシオが統計的に有意であるとみなされるために超えなければならないベンチマークを表しています。
証明の概略
を独立した標準正規変数とします。これらの変数の期待最大値は次のように近似されます。
ここで、各についてとします。すると、
2つの式を組み合わせると、
をシャープレシオの横断的分散として推定すると、
これで導出が完了します。
DSRへの示唆
誤った戦略定理は、大規模なテストでは、熟練していない戦略であっても、明らかに「有意な」シャープレシオを生み出すことを示しています。これを修正するために、DSRは、ノイズから期待最大値を差し引き、帰無仮説の周りの標準誤差でスケーリングすることで、 観測されたシャープレシオを調整します。
これにより、観測されたシャープレシオが選択バイアスや過剰適合ではなく、真のスキルを反映している確率が得られます。DSRは試行間の分散を考慮するため、シダック 補正に基づく方法よりも正確です
多重検定におけるシャープ比の信頼性と検出力
多重検定におけるシャープ比の有意性を評価するために、ロペス・デ・プラド(2018)はタイプIの誤りとタイプIIの誤りの閉形式の表現を導出しました。
信頼性
DSRは、多重検定調整ベースラインがである、推定値よりも極端でないシャープ比を観測する確率です(ただし、真であることが前提です)。これは、を観測した後に帰無仮説を棄却できる最大の信頼度として解釈することもできます。[14]
ここで、帰無仮説の標準偏差は:
検出力
検定の検出力とは、正しく識別された陽性の割合です。これは、機械学習では検定の真陽性率または再現率、医学では感度としても知られています。 対立仮説の期待値を とします。例えば、これは正の超過収益をもたらした戦略間で観測された平均シャープ比である可能性があります。次に、偽陰性率( 、第2種の誤り)は、 が真である 場合にを棄却しない確率として定義されます。
は偽陽性率(第1種の誤り)であり、
最後に、検出力は帰無仮説が偽である場合にそれを棄却する確率です。つまり、
上記の式は、検定力が試行回数を減少させることを示しています。これは、検定力が与える効果によるものです。これらの式は、多重検定における観測されたシャープレシオの信頼性を定量化し、非正規性を返します。[14]これらは、与えられた検定力で棄却するために必要なサンプルサイズを評価するために使用できます。
最小トラックレコード長
関連する概念は、最小追跡記録長(MinTRL)であり、観測されたが与えられた場合に、帰無仮説を信頼度で棄却するために必要な最小サンプルサイズを計算します。[11]正式には、この問題は次のように表すことができます 。
解は
例えば、観測された年率換算のリターンが与えられた場合、帰無仮説を95%の信頼度で棄却するには、約3年分の日次戦略リターンが必要です。これは、ヘッジファンドは最低3年間のトラックレコードを保有しなければならないという、投資家の間で一般的に期待されていることを数学的に裏付けています。シャープレシオが1.15を超える場合は、2年に短縮される可能性があります。MinTRLは1回の試行を想定しているため、最低要件として理解することが重要です(試行回数が増えると、より長いトラックレコードが必要になります)。
参照
参考文献
- ^ abcd Bailey, DH, & López de Prado, M. (2014). 「縮小されたシャープレシオ:選択バイアス、バックテストの過剰適合、非正規性の修正」The Journal of Portfolio Management , 40(5), 94–107.
- ^ abc López de Prado, M., & Lewis, MJ (2019): 教師なし学習法を用いた誤った投資戦略の検出。Quantitative Finance、19(9)、pp. 1555–1565.
- ^ Prado, Marcos López de (2018-07-02). 「ほとんどの機械学習ファンドが失敗する10の理由」。The Journal of Portfolio Management、44 (6): 120– 133. doi :10.3905/jpm.2018.44.6.120. ISSN 0095-4918
- ^ Lo, Andrew W. (2002-07-01). 「シャープレシオの統計」 . Financial Analysts Journal . 58 (4): 36– 52. doi :10.2469/faj.v58.n4.2453. ISSN 0015-198X.
- ^ ab Bailey, DH, Borwein, J. & López de Prado, M. (2014): 「疑似数学と金融詐欺:バックテストの過剰適合がサンプル外パフォーマンスに与える影響」.アメリカ数学会報, 61(5), pp. 458–471
- ^ abcd Andrews, Michelle (2023-08-01). 「最適クラスター数アルゴリズムの実践者向けガイド」 . The Journal of Financial Data Science . 5 (3): 66– 79. doi :10.3905/jfds.2023.1.133. ISSN 2640-3943.
- ^ abcd López de Prado, Marcos M. (2020). 資産運用会社のための機械学習. 定量金融の要素. ケンブリッジ: ケンブリッジ大学出版局. ISBN 978-1-108-79289-9.
- ^ Lopez de Prado, Marcos (2020年1月15日). 「統計協会(プレゼンテーションスライド)」. SSRN . SSRN 3512994
- ^ ゴーティエ・マルティ、フランク・ニールセン、ミコワイ・ビンコフスキ、フィリップ・ドナット (2021)、フランク・ニールセン編、「金融市場における相関、階層、ネットワーク、クラスタリングの20年間のレビュー」、情報幾何学の進歩:理論と応用、Cham: Springer International Publishing、pp. 245– 274、doi :10.1007/978-3-030-65459-7_10、ISBN 978-3-030-65459-7、 2025年5月21日閲覧
- ^ ab López de Prado, M., & Bailey, DH (2018). 「誤った戦略定理:実験数学の金融応用」アメリカ数学月刊誌、第128巻、第9号、pp. 825-831.
- ^ ab Bailey, David; Lopez de Prado, Marcos (2012年冬). 「シャープ比有効フロンティア」. Journal of Risk . 15 (2): 36. doi :10.21314/JOR.2012.255. SSRN 1821643.
- ^ López de Prado, M. (2019): A Data Science Solution to the Multiple-Testing Crisis in Financial Research. Journal of Financial Data Science, 1(1), pp. 99–110.
- ^ Fabozzi, Frank J.; Prado, Marcos López de (2018-11-01). "Being Honest in Backtest Reporting: A Template for Disclosing Multiple Tests". The Journal of Portfolio Management. 45 (1): 141–147. doi:10.3905/jpm.2018.45.1.141. ISSN 0095-4918.
- ^ a b López de Prado, M. (2022): "Type I and Type II Errors of the Sharpe Ratio under Multiple Testing", The Journal of Portfolio Management, 49(1), pp. 39–46