タンパク質‐リガンド ドッキングは分子モデリング技術です。タンパク質‐リガンド ドッキングの目的は、リガンド(小分子)がタンパク質受容体または酵素に結合したときの位置と方向を予測することです。[ 1 ]医薬品研究では、さまざまな目的でドッキング技術が使用されていますが、最も顕著なのは、可能性のある薬物候補を選択するために、利用可能な化学物質の大規模なデータベースを仮想的にスクリーニングすることです。 AlphaFoldなどのプログラムにより、タンパク質構造を決定する計算能力が急速に進歩しており、[ 2 ]対応するタンパク質‐リガンド ドッキング予測の需要が、正確なモデルを見つけることができるソフトウェアの実装を促進しています。 タンパク質の折り畳みと、さまざまな構造のリガンドがタンパク質に結合する方法を正確に予測できるようになれば、医薬品開発をより迅速に進めることが可能になります。
コンピュータ支援薬物設計(CADD)は、1980年代に新薬スクリーニングのために導入されました。[ 3 ]その根底にある前提は、特定の医薬品の製造に有効な可能性のある化合物に関する膨大なデータセットを解析することで、研究者はすべての化合物を実験的に試験することなく、新規化合物の量を最小限に抑えることができるというものです。しかし、標的結合部位を正確に予測する能力は新しい現象であり、化合物のデータセットを単純に解析する能力を拡張したものです。現在では、計算能力の向上により、in vitroでタンパク質-リガンド結合部位の実際の形状を調べることが可能になっています。計算におけるハードウェアの進歩により、これらの構造指向の創薬手法は、21世紀のバイオ医薬品における新たなフロンティアとなっています。タンパク質-リガンド結合能の正確な形状を捉えるための新しいアルゴリズムを細かく訓練するために、X線結晶構造解析やNMR分光法などの技術を適用することで、実験的に収集されたデータセットを使用することができます。[ 3 ]
AutoDockやAutoDock Vina、rDock、FlexAID、Molecular Operating Environment、Glideなど、タンパク質と相互作用する小分子やペプチドの位置、形状、エネルギーを計算するタンパク質-リガンド ドッキング ソフトウェア アプリケーションがいくつか利用可能です。ペプチドは、タンパク質結合プログラムでは予測が難しいタイプの構造であることが判明している、非常に柔軟なタイプのリガンドです。DockThor は、最大 40 個の回転可能な結合を実装し、ターゲット サイトにおけるこれらの複雑な物理化学的結合をモデル化するのに役立ちます。[ 4 ]平均二乗平方根偏差は、タンパク質-リガンド構造の結合モード内でさまざまなソフトウェアのパフォーマンスを評価する標準的な方法です。具体的には、ソフトウェアが予測したリガンドのドッキング ポーズと実験的な結合モードの間の平均二乗平方根偏差です。RMSD 測定値は、タンパク質とリガンドの間の可能な結合のコンピューターによって生成されたすべてのポーズに対して計算されます。候補間のRMSDを評価する際、プログラムは必ずしも実際の物理的なポーズを完全に予測できるとは限りません。タンパク質ドッキングを予測するコンピュータアルゴリズムの強度を評価するには、コンピュータが生成した候補間のRMSDの順位を調べ、実験的なポーズが実際には生成されたものの選択されなかったかどうかを判断する必要があります。
過去20年間で計算能力は劇的に向上し、コンピュータ支援による医薬品設計において、より洗練された計算集約型の手法を利用できるようになった。しかし、ドッキング手法において受容体の柔軟性を扱うことは、依然として難しい問題である。[ 5 ]この困難さの主な理由は、この種の計算で考慮しなければならない自由度の数が多いことである。しかし、ほとんどの場合、これを無視すると、現実世界の設定での結合ポーズ予測という点でドッキング結果が悪くなる。[ 6 ]この問題を克服するために粗視化タンパク質モデルを使用することは、有望なアプローチであると思われる。[ 5 ]粗視化モデルは、タンパク質受容体の大規模な構造変化を伴うことが多いため、タンパク質-ペプチドドッキングの場合によく実装される。[ 7 ] [ 8 ]
AutoDockは、創薬プロセスにおいてタンパク質とリガンドの相互作用をモデル化するために頻繁に用いられる計算ツールの一つです。効果的なポーズを探索するために従来用いられてきたアルゴリズムでは、受容体タンパク質は剛体であり、リガンドは中程度の柔軟性を持つと仮定することがよくありますが、新しいアプローチでは、受容体の柔軟性も制限されたモデルが実装されています。AutoDockFRは、受容体タンパク質内のこの部分的な柔軟性を、タンパク質の側鎖がそのコンフォメーション空間内で様々なポーズをとることでシミュレートできる新しいモデルです。これにより、アルゴリズムは、試験される各リガンドについて、エネルギー的に関連するポーズの非常に広い空間を探索することができます。[ 9 ]
予測アルゴリズムの探索空間の複雑さを簡素化するために、様々な仮説が検証されてきました。そのような仮説の一つは、より多くの原子とより大きな回転を含む側鎖のコンフォメーション変化は、エネルギー障壁が生じるため、実際にはより小さな回転よりも起こりにくいというものです。これらの大きな変化に伴って生じる立体障害と回転エネルギーコストは、それらが実際のタンパク質-リガンドポーズに含まれる可能性を低くします。[ 10 ]このような発見は、科学者が探索空間の複雑さを低減し、アルゴリズムを改善するためのヒューリスティックスを開発することを容易にする可能性があります。
様々な結合部位の分子モデルを検証する最初の方法は1980年代に導入され、受容体は表面の溝を占める球体によって大まかに推定されました。[ 11 ]リガンドは、関連する体積を占めるより多くの球体によって近似されました。次に、結合球体と受容体球体の両方の球体間の立体的重なりを最大化するための探索が実行されました。
しかし、分子動力学とタンパク質-リガンドドッキングポテンシャルを評価するための新しいスコアリング関数は、教師あり分子動力学[ 3 ]アプローチを実装しています。本質的には、シミュレーションはリガンドとタンパク質の質量中心間の距離を計算するための小さな時間ウィンドウのシーケンスです。距離の値は一定の頻度で更新され、その後回帰線形近似されます。傾きが負の場合、リガンドは結合部位に近づいており、逆もまた同様です。リガンドが結合部位から離れる場合、可能性のツリーはその瞬間に刈り込まれ、不要な計算を回避します。この手法の利点は、モデルを実験事実に正確にマッピングすることを妨げる可能性のあるエネルギーバイアスを導入することなく、高速であることです。[ 3 ]