格子タンパク質

格子タンパク質は、タンパク質の折り畳みを研究するために用いられる、格子構造空間上のタンパク質様ヘテロポリマー鎖の高度に単純化されたモデルである。[ 1 ]格子タンパク質における単純化は2つの段階から成る。各残基(アミノ酸)は、有限の種類の集合(通常は2種類のみ)の単一の「ビーズ」または「点」としてモデル化され、各残基は(通常は立方体の)格子の頂点上に配置できるように制限される。[ 1 ]タンパク質鎖の連結性を保証するために、バックボーン上の隣接する残基は、格子の隣接する頂点上に配置する必要がある。[ 2 ]立体的制約は、同じ格子頂点に複数の残基を配置できないという制約によって表現される。[ 2 ]

タンパク質は非常に大きな分子であるため、全原子レベルで詳細にモデル化した場合、その挙動をシミュレートする時間スケールには厳しい計算上の限界があります。全原子シミュレーションがミリ秒単位に到達したのは2010年になってからであり[ 3 ]、現実のタンパク質すべてをコンピュータ上で折り畳むことは依然として不可能です。この単純化されたシナリオでさえ、タンパク質折り畳み問題はNP完全ですが、モデルを単純化することで計算量を大幅に削減できます[ 4 ] 。

概要

格子タンパク質の異なるバージョンは、2次元または3次元で異なるタイプの格子(典型的には正方形と三角形のもの)を採用する場合がありますが、汎用的な格子は均一なアプローチで使用および処理できることが示されています。[ 2 ]

格子タンパク質は、エネルギー関数(隣接する格子サイトを占めるビーズ間の相互作用エネルギーを指定する条件のセット)を導入することで、実際のタンパク質に似せて作られています。 [ 5 ]エネルギー関数は、立体効果疎水性効果、水素結合効果を含む、実際のタンパク質中のアミノ酸間の相互作用を模倣しています。[ 2 ]ビーズはタイプに分けられ、異なるタイプのアミノ酸が異なるタイプの相互作用を示すのと同じように、エネルギー関数はビーズタイプに応じて相互作用を指定します。[ 5 ]最も人気のある格子モデルの 1 つである疎水性極性モデル ( HP モデル) [ 6 ]は、疎水性(H) と極性(P)の 2 種類のビーズのみを特徴としており、 H ビーズ間の好ましい相互作用を指定することによって疎水性効果を模倣しています。 [ 5 ]

特定の構造における任意の配列のエネルギーは、エネルギー関数から迅速に計算できる。単純なHPモデルでは、これは構造内では隣接しているが鎖内では隣接していないH残基間のすべての接触を列挙したものである。[ 7 ]ほとんどの研究者は、格子タンパク質配列が他のどの構造よりも低いエネルギー状態を持つ単一の構造を有する場合にのみ、その配列をタンパク質に類似しているとみなすが、可能な折り畳み状態の集合を考慮する例外もある。[ 8 ]これはエネルギー的基底状態、すなわち天然状態である。天然状態におけるビーズの相対的な位置は、格子タンパク質の三次構造を構成する。格子タンパク質は真の二次構造を持たないが、異なる物質の相図を互いに重ね合わせることができるのと同じ法則(対応状態定理)を適用することで、二次構造を含む実際のタンパク質構造に格子タンパク質を外挿できると主張する研究者もいる。[ 9 ]

エネルギー関数と鎖のビーズ配列(一次構造)を変化させることで、天然状態の構造と折り畳みの速度論への影響を調べることができ、これにより、実際のタンパク質の折り畳みに関する知見が得られる可能性がある。 [ 10 ]その一例には、タンパク質の2段階折り畳み速度論に類似するとして議論されてきた格子タンパク質の折り畳み過程の研究が含まれる。格子タンパク質は急速にコンパクト状態に崩壊し、その後ゆっくりと天然状態へと構造が再配置されることが示されている。[ 11 ]タンパク質折り畳みにおけるレビンサルのパラドックスを解決しようとする試みも、この分野におけるもう一つの取り組みである。一例として、FiebigとDillが行った研究では、格子タンパク質における残基接触の形成に制約を伴う探索法を検討し、グローバルな網羅的探索を行わずにタンパク質が天然構造を見つける方法に対する知見を提供した。[ 12 ]格子タンパク質モデルは、タンパク質のエネルギーランドスケープ、すなわち、構造の関数として の内部自由エネルギーの変化を調査するためにも使用されてきた。

格子

格子とは、「辺」で結ばれた整然とした点の集合である。[ 2 ]これらの点は頂点と呼ばれ、格子内の他の一定数の頂点と辺で結ばれている。各頂点が結ばれている頂点の数は格子の配位数と呼ばれ、格子の形状または次元(例えば2次元から3次元へ)を変更することで、配位数を拡大または縮小することができる。 [ 2 ]この数は、特定の残基に隣接できる他の残基の数を制御するため、格子タンパク質の特性を形作る上で重要である。 [ 2 ]ほとんどのタンパク質において、使用される格子の配位数は3から20の間であることが示されているが、最も一般的に使用される格子の配位数は、この範囲の下限にある。[ 2 ]

格子形状は、格子タンパク質モデルの精度において重要な要素である。格子形状を変えると、エネルギー的に好ましい立体配座の形状が劇的に変化する可能性がある。[ 2 ]また、正方格子や立方格子では同じパリティ(奇数または偶数)の残基が疎水性接触を形成できないというパリティ問題の場合のように、タンパク質構造に非現実的な制約を加える可能性がある。 [ 5 ]また、結晶構造データと比較した場合、三角格子は他の格子形状よりも正確な構造を生み出すことが報告されている。 [ 2 ]パリティ問題に対処するため、複数の研究者が、可能な場合は三角格子を使用し、理論的な応用では正方行列の方が適している可能性のある場合には対角線を含む正方行列を使用することを提案している。[ 5 ]三角格子で隣接する残基が急に曲がるのを緩和するために六角格子が導入された。[ 13 ]対角線を持つ六角形格子もパリティ問題に対処する方法として提案されている。[ 2 ]

疎水性極性モデル

一般的なポリペプチドの熱力学的に安定な構造の模式図。疎水性接触の数が多いことに注目してください。アミノ酸残基は白線に沿った点で表されています。疎水性残基は緑色、極性残基は青色で示されています。LabbyFoldのこの例も参照してください。
一般的なポリペプチドの熱力学的に不安定な構造の模式図。上図よりも疎水性の接触数が少ないことに注目してください。疎水性残基は緑色、極性残基は青色で示されています。LabbyFoldのこの例も参照してください。

疎水性-極性タンパク質モデルは、格子タンパク質モデルの元祖です。1985年にDillらによって初めて提案されたこのモデルは、タンパク質構造予測の大きなコストと困難さを克服する方法として、タンパク質中のアミノ酸疎水性のみを用いてタンパク質構造を予測する方法でした。 [ 5 ]これは格子タンパク質モデルのパラダイムと考えられています。[ 2 ]この手法は、タンパク質を「2次元正方格子上の短い鎖」として表現することで、タンパク質構造を迅速に推定することができ、以来、疎水性-極性モデルとして知られるようになりました。このモデルは、タンパク質の折り畳み問題を3つの別々の問題に分解します。すなわち、タンパク質の立体配座のモデル化、アミノ酸が相互作用して立体配座を見つける際のエネルギー特性の定義、そしてこれらの立体配座を予測するための効率的なアルゴリズムの開発です。これは、タンパク質中のアミノ酸を疎水性または極性に分類し、タンパク質が水性環境で折り畳まれていると仮定することによって行われます。格子統計モデルは、疎水性アミノ酸間の接触の自由エネルギーを最小化することで、タンパク質の折り畳みを再現しようとする。疎水性アミノ酸残基は互いに凝集し、親水性残基は周囲の水と相互作用すると予測される。[ 5 ]

HPモデルを用いたタンパク質フォールディングの研究には、様々な格子タイプとアルゴリズムが用いられた。2次元および3次元、正方格子および三角格子において、近似アルゴリズムを用いてより高い近似比を得るための努力がなされた。近似アルゴリズムの代替として、正方格子、三角格子、面心立方格子において、遺伝的アルゴリズムもいくつか利用された。[ 14 ]

問題と代替モデル

疎水性-極性モデルは単純であるがゆえに、これまでいくつかの問題を抱えており、代替の格子タンパク質モデルを用いてこれらの問題を解決しようと試みられてきた。[ 5 ]これらの問題の中で最も深刻なのは縮退の問題である。縮退とは、モデル化されたタンパク質に最小エネルギー配座が複数存在し、どの配座が本来の配座であるかが不確実になる現象である。この問題に対処する試みとしては、アミノ酸をその電荷に応じて疎水性 (H)、(P)、負 (N)、中性 (X) に分類する HPNX モデル[ 15 ]があり、低エネルギー配座の数を減らすためのパラメータを追加することで、より現実的なタンパク質シミュレーションを可能にしている。[ 5 ]もう 1 つのモデルは、結晶構造から取得したタンパク質特性を用いて本来の配座の選択を通知するCrippen モデルである。 [ 16 ]

格子モデルのもう一つの問題は、一般的にアミノ酸の側鎖 が占める空間を考慮せず、α炭素のみを考慮していることである。[ 2 ]側鎖モデルは、α炭素に隣接する頂点に側鎖を追加することでこの問題に対処している。[ 17 ]

参考文献

  1. ^ a b Lau KF, Dill KA (1989). 「タンパク質のコンフォメーション空間と配列空間の格子統計力学モデル」. Macromolecules . 22 (10): 3986–97 . Bibcode : 1989MaMol..22.3986L . doi : 10.1021/ma00200a030 .
  2. ^ a b c d e f g h i j k l m Bechini A (2013). 「一般タンパク質格子モデル特性評価とソフトウェア実装について」 . PLOS ONE . 8 (3) e59504. Bibcode : 2013PLoSO...859504B . doi : 10.1371/journal.pone.0059504 . PMC 3612044. PMID 23555684 .  
  3. ^ Voelz VA, Bowman GR, Beauchamp K, Pande VS (2010年2月). 「ミリ秒フォルダーNTL9(1-39)のab initioタンパク質フォールディングの分子シミュレーション」. Journal of the American Chemical Society . 132 (5): 1526–8 . doi : 10.1021/ja9090353 . PMC 2835335. PMID 20070076 .  
  4. ^ Berger B, Leighton T (1998). 「疎水性-親水性(HP)モデルにおけるタンパク質フォールディングはNP完全である」. Journal of Computational Biology . 5 (1): 27– 40. doi : 10.1089/cmb.1998.5.27 . PMID 9541869 . 
  5. ^ a b c d e f g h i Dubey SP, Kini NG, Balaji S, Kumar MS (2018). 「格子モデルを用いたタンパク質構造予測のレビュー」.生物医学工学批評レビュー. 46 (2): 147– 162. doi : 10.1615/critrevbiomedeng.2018026093 . PMID 30055531 . 
  6. ^ Dill KA (1985年3月). 「球状タンパク質のフォールディングと安定性の理論」.生化学. 24 (6): 1501–9 . doi : 10.1021/bi00327a032 . PMID 3986190 . 
  7. ^ Su SC, Lin CJ, Ting CK (2010年12月). 「2次元三角形タンパク質構造予測のためのヒルクライミング法と遺伝的アルゴリズムの効率的なハイブリッド」. 2010 IEEE International Conference on Bioinformatics and Biomedicine Workshops (BIBMW) . IEEE. pp.  51– 56. doi : 10.1109/BIBMW.2010.5703772 . ISBN 978-1-4244-8303-7. S2CID  44932436 .
  8. ^バートラム、ジェイソン;マセル、ジョアンナ(2020年4月) 「進化は、地形に広がる谷や迷路にもかかわらず格子タンパク質の安定性と凝集を急速に最適化する」遺伝学214 ( 4): 1047– 1057. doi : 10.1534/genetics.120.302815 . PMC 7153934 . PMID 32107278 .  
  9. ^ Onuchic JN, Wolynes PG, Luthey-Schulten Z, Socci ND (1995年4月). 「現実的なタンパク質フォールディングファネルのトポグラフィーの概略に向けて」 . Proceedings of the National Academy of Sciences of the United States of America . 92 (8): 3626–30 . Bibcode : 1995PNAS...92.3626O . doi : 10.1073/pnas.92.8.3626 . PMC 42220. PMID 7724609 .  
  10. ^ Moreno-Hernández S, Levitt M (2012年6月). 「2次元格子上の疎水性極性モデルの比較モデリングとタンパク質類似特性」 . Proteins . 80 ( 6): 1683–93 . doi : 10.1002/prot.24067 . PMC 3348970. PMID 22411636 .  
  11. ^ Socci ND, Onuchic JN (1994-07-15). 「タンパク質類似ヘテロポリマーのフォールディング速度論」. The Journal of Chemical Physics . 101 (2): 1519– 1528. arXiv : cond-mat/9404001 . Bibcode : 1994JChPh.101.1519S . doi : 10.1063/1.467775 . ISSN 0021-9606 . S2CID 10672674 .  
  12. ^ Fiebig KM, Dill KA (1993-02-15). 「タンパク質コアの組み立てプロセス」. The Journal of Chemical Physics . 98 (4): 3475– 3487. Bibcode : 1993JChPh..98.3475F . doi : 10.1063/1.464068 .
  13. ^ Jiang M, Zhu B (2005年2月). 「HPモデルにおける六角形格子上のタンパク質フォールディング」. Journal of Bioinformatics and Computational Biology . 3 (1): 19– 34. doi : 10.1142/S0219720005000850 . PMID 15751110 . 
  14. ^ Shaw D, Shohidull Islam AS, Sohel Rahman M, Hasan M (2014-01-24). 「対角線を含む六角形格子上のHPモデルにおけるタンパク質フォールディング」 . BMC Bioinformatics . 15 Suppl 2 (2): S7. doi : 10.1186/1471-2105-15-S2-S7 . PMC 4016602. PMID 24564789 .  
  15. ^ Backofen R, Will S, Bornberg-Bauer E (1999年3月). 「拡張アルファベットを用いた格子タンパク質の構造予測における制約プログラミング技術の応用」 .バイオインフォマティクス. 15 (3): 234–42 . doi : 10.1093/bioinformatics/15.3.234 . PMID 10222411 . 
  16. ^ Crippen GM (1991年4月). 「離散的コンフォメーション空間におけるアミノ酸配列からのタンパク質フォールディングの予測」.生化学. 30 (17): 4232–7 . doi : 10.1021/bi00231a018 . PMID 2021616 . 
  17. ^ Dill KA, Bromberg S, Yue K, Fiebig KM, Yee DP, Thomas PD, Chan HS (1995年4月). 「タンパク質フォールディングの原理 ― 単純厳密モデルからの視点」 . Protein Science . 4 (4): 561– 602. doi : 10.1002/pro.5560040401 . PMC 2143098. PMID 7613459 .