RAPTOR(ソフトウェア)

ラプター
原作者ジンボ・シュウ博士
開発者バイオインフォマティクスソリューションズ株式会社
安定版リリース
4.2 / 2008年11月 (2008-11
オペレーティング·システムWindowsLinux
タイプタンパク質構造予測
Webサイトbioinfor.com /ラプター

RAPTORは、タンパク質構造予測に使用されるタンパク質スレッディングソフトウェアです。RAPTORは、RAPTORよりもはるかに精度の高い RaptorXに置き換えられました。

技術の比較

タンパク質スレッドモデリングと相同性モデリング

タンパク質の構造を解明しようとする研究者は、タンパク質配列から少し情報を得て研究を開始します。最初のステップでは、PSI-BLASTまたはPatternHunter検索を実行して、タンパク質データバンク(PDB)で構造が既知の配列を見つけます。構造が既知の配列と非常に類似した配列がある場合、このタンパク質の構造も機能もそれらの既知の構造と非常に類似している可能性が高くなります。相同性が見つからない場合、研究者はX 線結晶構造解析または核磁気共鳴 (NMR) 分光法のいずれかを実行する必要がありますが、どちらも構造を明らかにするのにかなりの時間とリソースを要します。これらの手法が高価すぎたり、時間がかかりすぎたり、対象範囲が限られている場合、研究者は RAPTOR などのタンパク質スレッディング ソフトウェアを使用して、信頼性の高いタンパク質モデルを作成できます。

タンパク質スレッディングは、特に配列アライメントによって検出可能な相同遺伝子が少ないタンパク質の場合、相同性モデリングよりも効果的です。これら2つの手法はどちらもテンプレートからタンパク質の構造を予測します。タンパク質配列が与えられた場合、タンパク質スレッディングはまず、配列構造アライメントの適合度を測定するスコアリング関数を最適化することで、構造ライブラリ内の各テンプレートに配列をアライメント(スレッド化)します。選択された最適なテンプレートを用いて構造モデルを構築します。相同性情報(配列アライメント)のみに基づいてテンプレートを選択する相同性モデリングとは異なり、タンパク質スレッディングで使用されるスコアリング関数は、相同性と構造情報(配列構造アライメント)の両方を利用します。

配列に有意な相同性が見られない場合、ホモロジーモデリングでは信頼性の高い予測が得られない可能性があります。相同性情報がない場合でも、タンパク質スレッディングは構造情報を用いて良好な予測結果を得ることができます。BLASTで適切なテンプレートが得られなかった場合、多くの場合、ユーザーはRAPTORを使用して結果を処理することになります。

整数計画法と動的計画法

RAPTORの整数計画法アプローチは、他のタンパク質スレッディング手法よりも高品質なモデルを生成します。ほとんどのスレッディングソフトウェアは、配列をテンプレートにアラインメントする際に、スコアリング関数を最適化するために動的計画法を用いています。動的計画法は整数計画法よりもはるかに簡単に実装できますが、スコアリング関数にペアワイズコンタクトポテンシャルが含まれている場合、動的計画法ではそのようなスコアリング関数をグローバルに最適化することはできず、局所的な最適なアラインメントを生成するだけです。

タンパク質構造においてペアワイズコンタクトは非常に保存されており、予測精度にとって極めて重要です。整数計画法は、ペアワイズコンタクトポテンシャルを含むスコアリング関数をグローバルに最適化し、グローバルな最適アライメントを生成することができます。

コンポーネント

スレッドエンジン

RAPTORには、NoCore、NPCore、IPの3つの異なるスレッドエンジンが実装されています。NoCoreとNPCoreは動的計画法に基づいており、IPよりも高速です。両者の違いは、NPCoreではテンプレートが多数の「コア」領域に解析されることです。コアとは構造的に保存された領域です。IPはRAPTOR独自の整数計画法に基づくスレッドエンジンです。他の2つのスレッドエンジンよりも優れたアライメントとモデルを生成します。NoCoreとNPCoreから始めるのも良いでしょう。予測が十分でない場合は、IPの方がより良い選択肢となるかもしれません。3つの手法をすべて実行した後、単純なコンセンサスによって最適な予測を見つけることができるかもしれません。

3D構造モデリングモジュール

RAPTOR で使用されるデフォルトの 3D 構造モデリングツールは OWL です。3D 構造モデリングは 2 つのステップで構成されます。最初のステップはループモデリングで、テンプレートではマッピングされていないターゲット配列の領域をモデリングします。すべてのループがモデリングされバックボーンが準備できたら、サイドチェーンをバックボーンに接続してパックします。ループモデリングでは、ループを埋めて衝突を回避するために、巡回座標降下アルゴリズムが使用されます。サイドチェーンパッキングでは、ツリー分解アルゴリズムを使用してすべてのサイドチェーンをパックし、衝突を回避します。OWL は RAPTOR によって自動的に呼び出され、3D 出力を生成します。

研究者がMODELLERをお持ちの場合は、RAPTORを設定してMODELLERを自動的に呼び出すこともできます。RAPTORはICM-Proの入力ファイルを生成することも可能で、ユーザーはそれを使ってICM-Proを自分で実行することができます。

PSI-BLASTモジュール

RAPTORを包括的なツールセットにするために、PSI-BLASTも含まれており、ユーザーはホモロジーモデリングを行うことができます。必要なパラメータはすべて自分で設定できます。PSI-BLASTの実行には2つのステップがあります。最初のステップは、配列プロファイルを生成することです。このステップでは、NR非冗長データベースが使用されます。次のステップは、PSI-BLASTにターゲット配列をProtein Data Bankの配列と比較させることです。ユーザーは各ステップで独自のデータベースを指定することもできます。

タンパク質構造ビューア

様々な構造ビューアがあります。RAPTORでは、生成された予測結果を確認するための構造ビューアとして Jmolが使用されます。

出力

スレッディング/PSI-BLASTジョブを実行すると、すべてのテンプレートのランキングリストが表示されます。各テンプレートについて、アライメント、E値、その他多数のスコアを確認できます。また、テンプレートの機能情報とSCOP分類も提供されます。さらに、配列のPSMマトリックスと二次構造予測も表示できます。テンプレートが複数の手法で報告されている場合は、報告回数がマークされます。これは、最適なテンプレートを特定するのに役立ちます。

CASPでのパフォーマンス

CASP(タンパク質構造予測技術の批判的評価)は、NIHが後援する2年ごとの実験です。CASPはタンパク質構造予測コミュニティのオリンピックとも言えるもので、1994年に設立されました。

RAPTORは2002年にCAFASP 3(CASP5)に初めて登場し、その年の個別サーバーグループで1位を獲得しました。それ以来、RAPTORは評価目的ですべてのCASPに積極的に参加し、常にトップティアにランクされています。

直近のCASP8は2008年5月から8月にかけて開催されました。世界中から80台以上の予測サーバーと100以上の専門家グループがこのイベントに登録し、参加者はタンパク質配列から3D構造を予測する課題に取り組みました。Zhang氏らのグループのランキングによると、RAPTORは全サーバー(メタサーバーと個別サーバー)の中で2位にランクインしました。Baker研究室のROBETTAは、同じランキングリストで5位にランクインしています。

CASP8のトップ5予測サーバー

ランク 予測者 使用されたターゲット TMスコア 最大サブスコア GDTスコア GHAスコア
1 張サーバー 171 120.65 108.78 114.69 85.55
2 ラプター 171 116.13 104.69 110.79 82.92
3 プロsp3-TASSER 171 116.05 103.38 109.95 80.88
4 Phyre_de_novo 171 115.35 103.47 110.00 82.51
5 ベイカー・ロベッタ171 115.12 102.68 109.27 80.71

参考文献

  • Xu J, Li M, Kim D, Xu Y (2003). 「RAPTOR: 線形計画法による最適タンパク質スレッディング、創刊号」J Bioinform Comput Biol . 1 (1): 95– 117. doi : 10.1142/S0219720003000186 . PMID  15290783 .
  • Xu J, Li M (2003). 「CAFASP3におけるRAPTOR線形計画法の評価」. Proteins . 53 (Suppl 6): 579– 584. doi : 10.1002/prot.10531 . PMID  14579349 .
  • Xu J, Li M, Lin G, Kim D, Xu Y (2003). 「線形計画法によるタンパク質のスレッド化」. Pac Symp Biocomput : 264– 275. PMID  12603034 .
  • Xu J (2005). 「予測アライメント精度によるタンパク質フォールド認識」IEEE/ACM Trans. on Computational Biology and Bioinformatics .
  • Xu J (2005). 「ツリー分解による迅速なタンパク質側鎖パッキング」RECOMB .