累積局所効果(ALE)は機械学習の解釈可能性手法である。[1]
概念
ALEは条件付き特徴分布を入力として使用し、拡張データを生成し、周辺分布よりも現実的なデータを作成します。[2]
分布から大きく外れた値(外れ値)は無視されます。[1]部分従属図や周辺図とは異なり、ALEは相関のある予測変数があっても無効になりません。[3]
これは、予測値自体の平均ではなく、拡張データに対するモデル予測値の差の平均を計算することで、予測値を平均化するのではなく、予測値の差を分析します。[2]
例
市街地からの距離と建築面積に基づいて住宅価格を予測するモデルを用いて、ALEは異なるサイズの住宅の予測値の差を比較します。その結果、サイズの影響が、他の相関関係にある特徴から分離されます。[1]
制限事項
評価ウィンドウの定義は主観的です。特徴量間の相関が高いと、この手法は効果を発揮しない可能性があります。[1] [3] ALEでは、条件付き分布を確実に決定するために、PDPよりも多くの均一分布の観測値が必要になります。高次元データでより一般的に見られるように、データが非常にスパースな場合、この手法は不適切な結果をもたらす可能性があります(次元の呪い)。[2]
参照
参考文献
- ^ abcd Rodriguez, Jesus (2022年12月27日). 「Edge 255: 解釈可能性手法:累積的局所効果(ALE)」. theseqence.substack.com . 2022年12月27日閲覧。
- ^ abc 「Accumulated Local Effects — ADS 2.7.0ドキュメント」。docs.oracle.com 。2022年12月31日閲覧。
- ^ ab Gupta, Aman (2020年10月25日). 「Accumulated Local Effects (ALE)-Feature Importance Technique」. Analytics Vidhya . 2022年12月27日閲覧。
外部リンク
- マン、マイケル(2022年)『実践者のための説明可能なAI』オライリーメディア社、ISBN 978-1-0981-1910-2. OCLC 1350433516。