隆起モデリング

予測モデリング技術

アップリフト モデリングは、増分モデリングトゥルー リフト モデリングネット モデリングとも呼ばれ、個人の行動に対する処理 (ダイレクト マーケティング アクションなど) の増分影響を直接モデル化する 予測モデリング手法です。

アップリフトモデリングは、顧客関係管理(CRM)におけるアップセル、クロスセル、リテンションモデリングに応用されています。また、政治選挙や個別化医療にも応用されています。心理学における関連する差分予測の概念とは異なり、アップリフトモデリングは能動的なエージェントを前提としています。

導入

アップリフトモデリングは、ランダム化科学的コントロールを用いて、ある行動の効果を測定するだけでなく、その行動に対する増分的な反応を予測する予測モデルを構築します。反応は、バイナリ変数(例えば、ウェブサイト訪問)[1]または連続変数(例えば、顧客収益)のいずれかです。[2]アップリフトモデリングは、主に金融サービス、通信、小売ダイレクトマーケティング業界において、アップセルクロスセル解約顧客維持活動に応用されているデータマイニング手法です。

上昇の測定

マーケティングキャンペーンのアップリフトは通常、実験群とランダム化対照群の反応率の差として定義されます。これにより、マーケティングチームはマーケティング活動の効果を分離し、個々のマーケティング活動の有効性を測定することができます。誠実なマーケティングチームは、キャンペーンの増分効果のみを自分の功績として認めます。

ただし、多くのマーケティング担当者は、リフト(アップリフトではなく)を治療とコントロールの応答率の差として定義しているため、アップリフト モデリングは予測モデリングを通じてリフトを改善(増加)することとして定義できます。

以下の表は、架空のマーケティングキャンペーンにおけるレスポンス数と計算されたレスポンス率の詳細を示しています。このキャンペーンは、レスポンス率が5%上昇したと定義されます。これにより、50,000件(100,000 - 50,000)のレスポンスが獲得されました。

グループ 顧客数 回答 応答率
治療済み 1,000,000 10万 10%
コントロール 1,000,000 5万 5%

従来の応答モデリング

従来の応答モデリングでは、通常、処理された顧客のグループを取得し、意思決定ツリー回帰分析などのいくつかの予測モデリング手法の 1 つを使用して、応答する可能性のある顧客と応答しない顧客を分離する予測モデルを構築しようとします

このモデルでは、処理された顧客のみを使用してモデルを構築します。

対照的に、アップリフトモデリングでは、治療対象顧客と対照顧客の両方を用いて、増分的な反応に焦点を当てた予測モデルを構築します。この種のモデルを理解するために、顧客を以下のグループに分ける基本的なセグメンテーションが提案されています(これらの名称はN. Radcliffeによって提案され、[3]で説明されています)。

  • 説得可能な顧客:ターゲットにされていたため、マーケティング活動に反応するだけの顧客
  • 確実なもの:ターゲットかどうかに関わらず反応したであろう顧客
  • 失われた原因:ターゲットかどうかに関係なく反応しない顧客
  • 起こさないでくださいまたは眠っている犬:ターゲットにされているため、応答する可能性が低い顧客

本当の意味で漸進的な反応を示す唯一のセグメントは、説得可能な層です。

アップリフト モデリングは、顧客をこれらのグループに分けるためのスコアリング手法を提供します。

従来の応答モデリングでは、確実なものを対象にすることが多く、説得可能なものと区別することができません

投資収益率

アップリフトモデリングは漸進的な反応のみに焦点を当てているため、従来の需要創出・維持活動に適用した場合、非常に高い投資収益率(ROI)が得られます。例えば、アウトバウンドマーケティングキャンペーンにおいて、説得可能な顧客のみをターゲットにすることで、コンタクトコスト、ひいては単位支出あたりのROIを大幅に向上させることができます。

悪影響の除去

アップリフトモデリングの最も効果的な活用方法の一つは、顧客維持キャンペーンのマイナス効果を排除することです。通信業界や金融サービス業界では、顧客維持キャンペーンが顧客の契約や保険の解約を促す可能性があります。アップリフトモデリングを用いることで、こうした顧客(「邪魔しないで」顧客)をキャンペーンから除外することが可能になります。

A/Bテストおよび多変量テストへの応用

単一のトリートメントグループとコントロールグループが存在するケースは稀です。多くの場合、「トリートメント」とは、複数のシンプルなメッセージのバリエーション、あるいは単一のトリートメントとして分類される多段階のコンタクト戦略を指します。A /Bテストや多変量テストの場合、アップリフトモデリングは、テストにおけるバリエーションが、行動指標や人口統計指標などの他のターゲティング基準と比較して、有意なアップリフトをもたらすかどうかを判断するのに役立ちます。

広告増分アプリケーション

デジタル広告の分野では、アップリフトモデリングはインクリメンタリティ測定の一環としてますます利用されています。インクリメンタリティ測定は、単に反応やコンバージョンの可能性を予測するのではなく、キャンペーンの因果効果、つまりマーケティング施策に起因する成果の変化を推定することを目的としています。この文脈において、アップリフトモデルは、(a)施策を受けた場合に増分リフトを生み出す可能性が最も高い顧客を予測するため、または(b)ランダムに選択された対照群を施策から除外する実験的ホールドアウト設計の結果を較正または検証するために利用されます。これにより、真の因果リフトを測定できます。[4] [5] [6] [7] [8]

隆起モデルの歴史

真の応答モデリングの最初の登場は、ラドクリフとサリーの研究であると思われる。[9]

Victor LoもこのテーマについてThe True Lift Model(2002)[10]で論文を発表しており、その後RadcliffeもUsing Control Groups to Target on Predicted Lift: Building and Assessing Uplift Models(2007)[11]で論文を発表している。

ラドクリフは自身のウェブサイト「Scientific Marketer」でよくある質問(FAQ)セクションも提供しています。[12] Lo(2008)は、プログラム設計から予測モデリング、最適化に至るまで、より一般的な枠組みと将来の研究分野を提供しています。[13]

ピオトル・ジェパコフスキは独立してアップリフトモデリングを研究した。彼はシモン・ヤロシェヴィッチと共同で情報理論を応用し、多クラスアップリフト決定木を構築し、2010年に論文を発表した。 [14]そして2011年後半には、このアルゴリズムを複数処理のケースに拡張した。[15]

同様のアプローチは個別化医療でも研究されてきた。[16] [17]

Szymon JaroszewiczとPiotr Rzepakowski(2014)は生存分析のためのアップリフト法を設計し、ランダム化比較試験分析に適用した。[18]

ヨン(2015)は、動的計画法による数学的最適化アルゴリズムと機械学習手法を組み合わせて、患者を最適に層別化した。[19]

アップリフトモデリングは、心理学の古い概念である差分予測の特殊なケースです。[20]

アップリフトモデリングは最近帰納的論理プログラミング [ 20] 、ベイジアンネットワーク[21]、統計的関係学習[17] 、サポートベクターマシン、[22] 、 [23] 、生存分析[18] 、アンサンブル学習など、多様な機械学習アプローチに拡張されています。[24]

アップリフトモデリングはマーケティング実務(政治選挙を含む)において広く適用されているにもかかわらず、マーケティング文献にはほとんど登場していません。Kane、Lo、Zheng(2014)は、複数の手法を用いた3つのデータセットの徹底的な分析結果をマーケティングジャーナルに発表し、より新しいアプローチ(「4象限法」)が実践において優れたパフォーマンスを発揮したという証拠を示しました。[25]

LoとPachamanova(2015)は、アップリフトモデリングを複数の治療状況に対する処方的分析に拡張し、大規模な決定論的および確率的最適化問題を解決するためのアルゴリズムを提案した。[26]

最近の研究では、大量のデータを用いたベンチマーク研究で、さまざまな最先端の隆起モデルのパフォーマンスを分析しています。[27] [1]

隆起モデリングの詳細な説明、その歴史、隆起特有の評価手法、ソフトウェアの比較、そして様々な経済シナリオについては、以下を参照のこと。[28]

実装

Pythonの場合

  • CausalML、因果推論とアップリフトアルゴリズムの実装[29]
  • DoubleMLは、Chernozhukovらのdouble/debiased MLフレームワークを実装しています[30]
  • EconML、異種治療効果推定ツール
  • UpliftML、実験からのスケーラブルな隆起モデリング
  • PyLift (アーカイブ)
  • scikit-uplift、sklearnスタイルのアップリフトモデリング

Rでは

  • DoubleML、同じフレームワーク[30]
  • アップリフトパッケージ(2022年にCRANから削除)

その他の言語

  • SASによるJMP
  • ピツニーボウズによるポートレートアップリフト
  • DymatrixによるKNIME用Upliftノード
  • Stochastic SolutionsによるMiróの隆起モデリング

データセット

  • Hillstrom Eメールマーケティングデータセット
  • Criteo アップリフト予測データセット
  • Lenta Uplift モデリング データセット
  • X5 RetailHero アップリフトモデリングデータセット
  • MegaFon Uplift 競争データセット

注釈と参考文献

  1. ^ ab Devriendt, Floris; Moldovan, Darie; Verbeke, Wouter (2018). 「隆起モデリングにおける最先端技術に関する文献調査と実験的評価:処方的分析の開発に向けた足がかり」. Big Data . 6 (1): 13– 41. doi :10.1089/big.2017.0104. PMID  29570415.
  2. ^ Gubela, Robin M.; Lessmann, Stefan; Jaroszewicz, Szymon (2020). 「収益向上モデリングのためのレスポンス変換と利益分解」. European Journal of Operational Research . 283 (2): 647– 661. arXiv : 1911.08729 . doi :10.1016/j.ejor.2019.11.030. S2CID  208175716.
  3. ^ N. ラドクリフ (2007).顧客維持活動によって誰が救われ、誰が失ってしまうのかを特定する. Stochastic Solution Limited
  4. ^ Lewis, Randall A.; Rao, Justin M. (2015). 「広告の収益測定における不利な経済学」 . Quarterly Journal of Economics . 130 (4): 1941– 1973. doi :10.1093/qje/qjv023.
  5. ^ Bakshy, Eytan; Eckles, Dean (2018). 「メタプラットフォームにおけるインクリメンタリティを測定するための実験の設計」arXiv : 1806.02588 [cs.CY].
  6. ^ Gordon, Brett R.; Provost, Foster; Zhang, Jiyuan (2023). 「実験による予測的増分性(PIE)」. arXiv : 2304.06828 [cs.LG].
  7. ^ Gordon, Brett R.; Zettelmeyer, Florian; Bhargava, Sagar (2023). 「十分近い?広告効果測定における非実験的アプローチの大規模探究」 .マーケティングサイエンス. 42 (4): 768– 793. doi :10.1287/mksc.2022.1413.
  8. ^ Dutton, Chandler (2025年9月4日). 「インクリメンタリティ実験:包括的ガイド」. Haus . 2025年2月15日閲覧
  9. ^ Radcliffe, NJ; Surry, PD (1999); Differential response analysis: Modelling true response by isolating the effect of a single action , in Proceedings of Credit Scoring and Credit Control VI , Credit Research Centre, University of Edinburgh Management School
  10. ^ Lo, VSY (2002);真の揚力モデル、ACM SIGKDD探査ニュースレター、第4巻、第2号、78–86
  11. ^ Radcliffe, NJ (2007);予測リフトに基づくターゲット設定のためのコントロールグループの使用:アップリフトモデルの構築と評価、Direct Marketing Analytics Journal
  12. ^ サイエンティフィック・マーケターによるアップリフト・モデリングに関するFAQ
  13. ^ Lo, VSY (2008). 「マーケティングデータマイニングにおける新たな機会」『データウェアハウスとマイニング百科事典』第2版。
  14. ^ ジェパコウスキー、ピョートル;ヤロシェヴィチ、シモン (2010)。 「上昇モデリングのためのディシジョン ツリー」。2010 年のデータ マイニングに関する IEEE 国際会議。 IEEE。 pp.  441–450土井:10.1109/ICDM.2010.62。ISBN 978-1-4244-9131-5
  15. ^ Rzepakowski, Piotr; Jaroszewicz, Szymon (2011). 「単一および複数の処理による隆起モデリングのための決定木」.知識情報システム. 32 (2): 303– 327. doi : 10.1007/s10115-011-0434-0 .
  16. ^ Cai, T.; Tian, L.; Wong, PH; Wei, LJ (2009);個別化治療選択のためのランダム化比較臨床試験データの分析、ハーバード大学生物統計ワーキングペーパーシリーズ
  17. ^ ab Nassif, Houssam; Kuusisto, Finn; Burnside, Elizabeth S.; Page, David; Shavlik, Jude; Santos Costa, Vitor (2013). 「Score as You Lift (SAYL): 統計的関係学習アプローチによるアップリフトモデリング」. Advanced Information Systems Engineering . Lecture Notes in Computer Science. Vol. 8190. Springer. pp.  595– 611. doi :10.1007/978-3-642-40994-3_38. ISBN 978-3-642-38708-1. PMC  4492311 . PMID  26158122 .
  18. ^ ab ヤロシェヴィチ、シモン;ジェパコウスキー、ピョートル (2014)。 「生存データを使用したモデリングの向上」(PDF)健康情報学に関する ACM SIGKDD ワークショップ (HI KDD'14)
  19. ^ Yong, FH (2015)、「層別医療のための定量的手法」、博士論文、ハーバードTHチャン公衆衛生大学院。
  20. ^ ab Nassif, Houssam; Santos Costa, Vitor; Burnside, Elizabeth S.; Page, David (2012). 「リレーショナル差分予測」.データベースにおける機械学習と知識発見. コンピュータサイエンス講義ノート. 第7523巻. Springer. pp.  617– 632. doi :10.1007/978-3-642-33460-3_45. ISBN 978-3-642-33459-7
  21. ^ Nassif, Houssam; Wu, Yirong; Page, David; Burnside, Elizabeth (2012). 「論理差分予測ベイズネットによる高齢女性の乳がん診断の改善」アメリカ医療情報学会シンポジウム (AMIA'12) : 1330– 1339. PMC 3540455. PMID  23304412 . 
  22. ^ Kuusisto, Finn; Santos Costa, Vitor; Nassif, Houssam; Burnside, Elizabeth; Page, David; Shavlik, Jude (2014). 「差分予測のためのサポートベクターマシン」.データベースにおける機械学習と知識発見. コンピュータサイエンス講義ノート. 第8725巻. Springer. pp.  50– 65. doi :10.1007/978-3-662-44851-9_4. ISBN 978-3-662-44850-2
  23. ^ ザニェヴィチ、ルカシュ;ヤロシェヴィチ、シモン (2013)。 「Uplift モデリングのためのサポート ベクター マシン」。原因究明に関する ICDM ワークショップ
  24. ^ ソルティス、ミハウ;ヤロシェヴィチ、シモン。ジェパコウスキー、ピョートル (2015)。 「隆起モデリングのためのアンサンブル手法」。データマイニングと知識発見29 (6): 1531–1559土井: 10.1007/s10618-014-0383-9
  25. ^ Kane, K.; Lo, VSY; Zheng, J. (2014). 「True-Liftモデリングを用いた真に反応の良い顧客と見込み客のマイニング」. Journal of Marketing Analytics . 2 (4): 218– 238. doi :10.1057/jma.2014.18. S2CID  256513132.
  26. ^ Lo, VSY; Pachamanova, D. (2015). 「予測的向上モデリングから処方的向上分析へ」. Journal of Marketing Analytics . 3 (2): 79– 95. doi :10.1057/jma.2015.5. S2CID  256508939.
  27. ^ Gubela, Robin M.; Bequé, Artem; Lessmann, Stefan; Gebert, Fabian (2019). 「Eコマースにおけるコンバージョン率の向上:モデリング戦略の体系的ベンチマーク」. International Journal of Information Technology & Decision Making . 18 (3): 747– 791. doi :10.1142/S0219622019500172. hdl :10419/230773. S2CID  126538764.
  28. ^ R. Michel, I. Schnakenburg, T. von Martens (2019). Targeting Uplift . Springer. ISBN 978-3-030-22625-1
  29. ^ Chen, Huigang; Harinen, Totte; Lee, Jeong-Yoon; Yung, Mike; Zhao, Zhenyu (2020). 「CausalML: 因果機械学習のためのPythonパッケージ」. arXiv : 2002.11631 [cs.LG].
  30. ^ ab Chernozhukov, Victor; Chetverikov, Denis; Demirer, Mert; Duflo, Esther; Hansen, Christian; Newey, Whitney; Robins, James (2018-02-01). 「治療と構造パラメータのための二重/バイアス除去機械学習」. The Econometrics Journal . 21 (1): C1 – C68 . doi :10.1111/ectj.12097. hdl : 10419/189736 .

参照

  • 入門ホワイトペーパー
  • エリック・シーゲル:隆起モデリング
  • 隆起モデリングのユーザーガイド
「https://en.wikipedia.org/w/index.php?title=Uplift_modelling&oldid=1325087382」より取得