| ドッキング用語集 |
|---|
|
| 編集 |
計算化学および分子モデリングの分野において、スコアリング関数は、2つの分子をドッキングさせた後の結合親和性を近似的に予測するために使用される数学関数です。最も一般的なのは、一方の分子が薬剤などの小さな有機化合物であり、もう一方の分子がタンパク質受容体などの薬剤の生物学的標的である場合です。[1]スコアリング関数は、 2つのタンパク質間[2]やタンパク質とDNA間の分子間相互作用 の強度を予測するためにも開発されています。[3]
ほとんどのスコアリング関数は、ギブスの自由エネルギーの変化に関連する何らかの量をkcal/mol 単位で推定するため、スコアが負の値であるほどドッキングが良好であることを示しますが、すべてのスコアリング関数が でゼロになるわけではないため、スコアの符号は必ずしも意味を持ちません。
ユーティリティ
スコアリング関数は、創薬やその他の分子モデリングアプリケーションで広く使用されています。これには以下が含まれます。[4]
- 候補リガンドの小分子データベースを仮想的にスクリーニングし、興味のあるタンパク質標的に結合し、創薬の有用な出発点となる新規小分子を同定する[5]
- タンパク質標的に結合する新規小分子のデノボデザイン(ゼロからの設計)[6]
- スクリーニングヒットのリード最適化による親和性と選択性の最適化[7]
スコアリング関数よりも信頼性が高く、計算負荷がはるかに高い代替手法として、自由エネルギー摂動計算がある。[8]
前提条件
スコアリング関数は通常、予測したい種に類似した分子種間の実験的に決定された結合親和性で構成されるデータ セットに対してパラメーター化 (またはトレーニング) されます。
タンパク質に対するリガンドの親和性を予測することを目的とした現在使用されている方法では、まず以下のことが分かっているか予測されている必要があります。
- タンパク質の三次構造– 三次元空間におけるタンパク質原子の配置。タンパク質の構造は、X線結晶構造解析や溶液相NMR法などの実験技術によって決定されたり、ホモロジーモデリングによって予測されたりすることがあります。
- リガンド活性コンフォメーション–タンパク質に結合した際のリガンドの3次元形状
- 結合モード– 複合体中の2つの結合パートナーの相対的な向き
上記の情報から、複合体の三次元構造が得られます。この構造に基づき、スコアリング関数は、以下に概説するいずれかの方法を用いて、複合体中の2つの分子間の結合強度を推定します。最終的に、スコアリング関数自体を用いて、複合体中の小分子の結合様式と活性コンフォメーションの両方を予測することもできますし、あるいは、より単純で計算速度が速い関数をドッキングラン内で利用することもできます。
クラス
スコアリング関数には4つの一般的なクラスがあります: [9] [10] [11]
- 力場– 親和力は、力場を用いて複合体中の2つの分子のすべての原子間の分子間ファンデルワールス力と静電相互作用の強度を合計することによって推定されます。2つの結合パートナーの分子内エネルギー(ひずみエネルギーとも呼ばれる)もしばしば考慮されます。最後に、結合は通常水の存在下で起こるため、GBSAやPBSAなどの暗黙的溶媒和法を用いて、リガンドとタンパク質の脱溶媒和エネルギーが考慮されることがあります。[12]
- 経験的- 2つの結合パートナー間の様々な種類の相互作用の数を数えることに基づく。[6]相互作用の数は、互いに接触しているリガンドと受容体の原子の数に基づいて算出される場合もあれば、複合体を形成していないリガンドとタンパク質と比較した複合体の溶媒接触面積(ΔSASA)の変化を計算する場合もある。スコアリング関数の係数は、通常、多重線形回帰法を用いてフィッティングされる。関数の相互作用項には、例えば以下が含まれる。
- 知識ベース– 大規模3Dデータベース(ケンブリッジ構造データベースやタンパク質データバンクなど)における分子間近接接触の統計的観察に基づき、統計的な「平均力のポテンシャル」を導出する。この手法は、特定の種類の原子または官能基間の近接した分子間相互作用が、ランダム分布から予想されるよりも頻繁に発生する場合、エネルギー的に有利であり、したがって結合親和性に有利に寄与する可能性が高いという仮定に基づいている。 [15]
- 機械学習– これらの古典的なスコアリング関数とは異なり、機械学習スコアリング関数は、結合親和性とタンパク質-リガンド複合体を記述する構造的特徴との関係について事前に決定された関数形を想定しないことを特徴としています。[16]このように、関数形はデータから直接推論されます。機械学習スコアリング関数は、多様なタンパク質-リガンド複合体の結合親和性予測において、古典的なスコアリング関数よりも一貫して優れていることがわかっています。[17] [18]これは、ターゲット特異的な複合体の場合にも当てはまりますが、[19] [20]利点はターゲットに依存し、主に利用可能な関連データの量に依存します。[11] [21]適切な注意を払うと、機械学習スコアリング関数は、構造ベースの仮想スクリーニングの関連問題において、古典的なスコアリング関数を大幅に上回る傾向があります。[22] [23] [24] [25] [26] [27] [28] [29]さらに、ターゲット固有のデータが利用可能な場合、このパフォーマンスのギャップは拡大します[30]これらのレビューは、構造に基づく医薬品設計のための機械学習スコアリング関数に関するより広範な概要を提供します。[11] [31] [32] [33]特定のターゲットに対するデコイの選択は、スコアリング関数のトレーニングとテストにおいて最も重要な要素の1つです。[34]
最初の3つのタイプ、すなわち力場、経験的、知識ベースのものは、一般的に古典的スコアリング関数と呼ばれ、結合への寄与が線形結合されると仮定する点が特徴です。この制約のため、古典的スコアリング関数は大量の訓練データを活用することができません。[35]
洗練
異なるスコアリング関数は比較的共線的であるため、コンセンサススコアリング関数は精度を大幅に向上させない可能性がある。[36]この主張は、これまでの研究でコンセンサススコアリングが有益であると示唆されていたため、この分野の一般的な見解とは多少矛盾していた。[37]
完璧なスコアリング関数であれば、リガンドとその標的間の結合自由エネルギーを予測できるはずです。しかし、現実には計算手法と計算資源の両方が、この目標達成に制約を課します。そのため、多くの場合、偽陽性および偽陰性のリガンドの数を最小限に抑える手法が選択されます。結合定数と構造に関する実験的トレーニングデータが利用可能な場合、分子ドッキングで使用されるスコアリング関数を改良するための簡便な手法が開発されています。[38]
参考文献
- ^ Jain AN (2006年10月). 「タンパク質-リガンドドッキングのためのスコアリング関数」. Current Protein & Peptide Science . 7 (5): 407–20 . doi :10.2174/138920306778559395. PMID 17073693.
- ^ Lensink MF, Méndez R, Wodak SJ (2007年12月). 「タンパク質複合体のドッキングとスコアリング:CAPRI第3版」. Proteins . 69 (4): 704–18 . doi :10.1002/prot.21804. PMID 17918726. S2CID 25383642.
- ^ Robertson TA, Varani G (2007年2月). 「構造からタンパク質-DNA相互作用を予測するための全原子距離依存スコアリング関数」. Proteins . 66 (2): 359–74 . doi :10.1002/prot.21162. PMID 17078093. S2CID 24437518.
- ^ Rajamani R, Good AC (2007年5月). 「構造に基づくリード化合物の発見と最適化におけるランキングポーズ:スコアリング機能開発の最新動向」 Current Opinion in Drug Discovery & Development 10 ( 3): 308–15 . PMID 17554857.
- ^ Seifert MH, Kraus J, Kramer B (2007年5月). 「分子データベースの仮想ハイスループットスクリーニング」. Current Opinion in Drug Discovery & Development . 10 (3): 298– 307. PMID 17554856.
- ^ ab Böhm HJ (1998年7月). 「タンパク質リガンドの結合定数の予測:de novo設計または3Dデータベース検索プログラムから得られたヒットの優先順位付けのための高速手法」. Journal of Computer-Aided Molecular Design . 12 (4): 309–23 . Bibcode :1998JCAMD..12..309B. doi :10.1023/A:1007999920146. PMID 9777490. S2CID 7474036.
- ^ Joseph-McCarthy D, Baber JC, Feyfant E, Thompson DC, Humblet C (2007年5月). 「ハイスループット分子ドッキングによるリード化合物の最適化」. Current Opinion in Drug Discovery & Development . 10 (3): 264–74 . PMID 17554852.
- ^ Foloppe N, Hubbard R (2006). 「自由エネルギーに基づく計算手法を用いた予測的リガンド設計に向けて?」Current Medicinal Chemistry . 13 (29): 3583– 608. doi :10.2174/092986706779026165. PMID 17168725.
- ^ Fenu LA, Lewis RA, Good AC, Bodkin M, Essex JW (2007). 「第9章 スコアリング関数:結合自由エネルギーから仮想スクリーニングにおけるエンリッチメントへ」 Dhoti H, Leach AR (編). Structure-Based Drug Discovery . ドルドレヒト: Springer. pp. 223– 246. ISBN 978-1-4020-4407-6。
- ^ Sotriffer C, Matter H (2011). 「第7.3章 スコアリング関数のクラス」 Sotriffer C (編). 『バーチャルスクリーニング:原則、課題、そして実践ガイドライン』 第48巻. John Wiley & Sons, Inc. ISBN 978-3-527-63334-0。
- ^ abc Ain QU, Aleksandrova A, Roessler FD, Ballester PJ (2015-11-01). 「構造に基づく結合親和性予測と仮想スクリーニングを改善するための機械学習スコアリング関数」. Wiley Interdisciplinary Reviews: Computational Molecular Science . 5 (6): 405– 424. doi :10.1002/wcms.1225. PMC 4832270. PMID 27110292 .
- ^ Genheden S, Ryde U (2015年5月). 「リガンド結合親和性を推定するためのMM/PBSA法とMM/GBSA法」. Expert Opinion on Drug Discovery . 10 (5): 449–61 . doi :10.1517/17460441.2015.1032936. PMC 4487606. PMID 25835573 .
- ^ Schneider N, Lange G, Hindle S, Klein R, Rarey M (2013年1月). 「タンパク質-リガンド複合体における水素結合と脱水エネルギーの一貫した記述:HYDEスコアリング関数の背後にある手法」. Journal of Computer-Aided Molecular Design . 27 (1): 15– 29. Bibcode :2013JCAMD..27...15S. doi :10.1007/s10822-012-9626-2. PMID 23269578. S2CID 1545277.
- ^ Lange G, Lesuisse D, Deprez P, Schoot B, Loenze P, Bénard D, Marquette JP, Broto P, Sarubbi E, Mandine E (2003年11月). 「(pp60)SrcのSH2ドメインへの低親和性阻害剤断片の特異的結合の要件は、全長阻害剤の高親和性結合の要件と同一である」. Journal of Medicinal Chemistry . 46 (24): 5184–95 . doi :10.1021/jm020970s. PMID 14613321.
- ^ Muegge I (2006年10月). 「PMFスコアリングの再考」. Journal of Medicinal Chemistry . 49 (20): 5895–902 . doi :10.1021/jm050038s. PMID 17004705.
- ^ Ballester PJ, Mitchell JB (2010年5月). 「機械学習によるタンパク質-リガンド結合親和性の予測と分子ドッキングへの応用」バイオインフォマティクス26 (9): 1169–75 . doi :10.1093/bioinformatics/btq112. PMC 3524828. PMID 20236947 .
- ^ Li H, Leung KS, Wong MH, Ballester PJ (2015年2月). 「ランダムフォレストを用いたAutoDock Vinaの改良:大規模データセットの有効活用による結合親和性予測の精度向上」. Molecular Informatics . 34 ( 2–3 ): 115–26 . doi :10.1002/minf.201400132. PMID 27490034. S2CID 3444365.
- ^ Ashtawy HM, Mahapatra NR (2015-04-01). 「タンパク質-リガンド結合親和性予測における従来型スコアリング関数と機械学習スコアリング関数の予測精度の比較評価」IEEE/ACM Transactions on Computational Biology and Bioinformatics . 12 (2): 335– 47. doi : 10.1109/TCBB.2014.2351824 . PMID 26357221.
- ^ Zhan W, Li D, Che J, Zhang L, Yang B, Hu Y, Liu T, Dong X (2014年3月). 「ドッキングスコア、相互作用プロファイル、分子記述子の統合による分子ドッキングの精度向上:新規Akt1阻害剤の発見に向けて」. European Journal of Medicinal Chemistry . 75 : 11–20 . doi :10.1016/j.ejmech.2014.01.019. PMID 24508830.
- ^ Kinnings SL, Liu N, Tonge PJ, Jackson RM, Xie L, Bourne PE (2011年2月). 「機械学習に基づくドッキングスコアリング機能の改善法と医薬品再利用への応用」. Journal of Chemical Information and Modeling . 51 (2): 408–19 . doi :10.1021/ci100369f. PMC 3076728. PMID 21291174 .
- ^ Li H, Sze KH, Lu G, Ballester PJ (2020-02-05). 「構造ベースの医薬品リード化合物最適化のための機械学習スコアリング関数」. Wiley Interdisciplinary Reviews: Computational Molecular Science . 10 (5). doi : 10.1002/wcms.1465 .
- ^ Li L, Wang B, Meroueh SO (2011年9月). 「受容体-リガンド複合体のサポートベクトル回帰スコアリングによる化学ライブラリの順位付けと仮想スクリーニング」. Journal of Chemical Information and Modeling . 51 (9): 2132–8 . doi :10.1021/ci200078f. PMC 3209528. PMID 21728360 .
- ^ Durrant JD, Friedman AJ, Rogers KE, McCammon JA (2013年7月). 「ニューラルネットワークのスコアリング関数と最先端技術の比較:共通ライブラリスクリーニングへの応用」. Journal of Chemical Information and Modeling . 53 (7): 1726–35 . doi :10.1021/ci400042y. PMC 3735370. PMID 23734946 .
- ^ Ding B, Wang J, Li N, Wang W (2013年1月). 「小分子結合の特性評価. I. 仮想スクリーニングにおける強力な阻害剤の正確な同定」. Journal of Chemical Information and Modeling . 53 (1): 114–22 . doi :10.1021/ci300508m. PMC 3584174. PMID 23259763 .
- ^ Wójcikowski M, Ballester PJ, Siedlecki P (2017年4月). 「構造ベースバーチャルスクリーニングにおける機械学習スコアリング関数の性能」. Scientific Reports . 7 46710. Bibcode :2017NatSR...746710W. doi :10.1038/srep46710. PMC 5404222. PMID 28440302 .
- ^ Ragoza M, Hochuli J, Idrobo E, Sunseri J, Koes DR (2017年4月). 「畳み込みニューラルネットワークを用いたタンパク質-リガンドスコアリング」. Journal of Chemical Information and Modeling . 57 (4): 942– 957. arXiv : 1612.02751 . doi :10.1021/acs.jcim.6b00740. PMC 5479431. PMID 28368587 .
- ^ Li H, Peng J, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (2018年3月). 「タンパク質構造と配列類似性が結合親和性予測のための機械学習スコアリング関数の精度に与える影響」. Biomolecules . 8 (1): 12. doi : 10.3390/biom8010012 . PMC 5871981. PMID 29538331 .
- ^ Imrie F, Bradley AR, Deane CM (2021年2月). 「ディープラーニングを用いた特性マッチングデコイ分子の生成」.バイオインフォマティクス. 37 (btab080): 2134– 2141. doi :10.1093/bioinformatics/btab080. PMC 8352508. PMID 33532838 .
- ^ Adeshina YO, Deeds EJ, Karanicolas J (2020年8月). 「機械学習分類は構造ベース仮想スクリーニングにおける偽陽性の低減を可能にする」. Proceedings of the National Academy of Sciences of the United States of America . 117 (31): 18477– 18488. Bibcode :2020PNAS..11718477A. doi : 10.1073/pnas.2000585117 . PMC 7414157. PMID 32669436 .
- ^ Xiong GL, Ye WL, Shen C, Lu AP, Hou TJ, Cao DS (2020年6月). 「スコアリング機能コンポーネントからの学習による構造ベース仮想スクリーニング性能の向上」. Briefings in Bioinformatics . 22 (bbaa094). doi :10.1093/bib/bbaa094. PMID 32496540.
- ^ Shen C, Ding J, Wang Z, Cao D, Ding X, Hou T (2019-06-27). 「機械学習からディープラーニングへ:タンパク質–リガンドドッキングにおけるスコアリング関数の進歩」. Wiley Interdisciplinary Reviews: Computational Molecular Science . 10. doi :10.1002/wcms.1429. S2CID 198336898.
- ^ Yang X, Wang Y, Byrne R, Schneider G, Yang S (2019-07-11). 「コンピュータ支援創薬における人工知能の概念」. Chemical Reviews . 119 (18): 10520– 10594. doi : 10.1021/acs.chemrev.8b00728 . PMID 31294972.
- ^ Li H, Sze KH, Lu G, Ballester PJ (2020-04-22). 「 構造ベース仮想スクリーニングのための機械学習スコアリング関数」. Wiley Interdisciplinary Reviews: Computational Molecular Science . 11. doi :10.1002/wcms.1478. S2CID 219089637.
- ^ Ballester PJ (2019年12月). 「構造ベースバーチャルスクリーニングのための機械学習スコアリング関数の選択」. Drug Discovery Today: Technologies . 32– 33: 81– 87. doi : 10.1016/j.ddtec.2020.09.001 . PMID 33386098. S2CID 224968364.
- ^ Li H, Peng J, Sidorov P, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (2019年3月). 「ドッキングのための従来のスコアリング関数は、大量の構造データと相互作用データを活用できない」. バイオインフォマティクス. 35 (20). オックスフォード、イギリス: 3989– 3995. doi :10.1093/bioinformatics/btz183. PMID 30873528.
- ^ Englebienne P, Moitessier N (2009年6月). 「柔軟かつ溶媒和した高分子へのリガンドのドッキング.4. このクラスのタンパク質に対して、一般的なスコアリング関数は正確か?」Journal of Chemical Information and Modeling . 49 (6): 1568–80 . doi :10.1021/ci8004308. PMID 19445499.
- ^ Oda A, Tsuchida K, Takakura T, Yamaotsu N, Hirono S. (2006). 「タンパク質-リガンド複合体の計算モデル評価におけるコンセンサススコアリング戦略の比較」. Journal of Chemical Information and Modeling . 46 (1): 380–91 . doi :10.1021/ci050283k. PMID 16426072.
- ^ Hellgren M, Carlsson J, Ostberg LJ, Staab CA, Persson B, Höög JO (2010年9月). 「分子ドッキングによるリガンドの濃縮とヒトアルコール脱水素酵素3の特性評価」. Cellular and Molecular Life Sciences . 67 (17): 3005–15 . doi :10.1007/s00018-010-0370-2. PMC 11115504. PMID 20405162. S2CID 2391130 .