タンパク質化学シフト予測は、生体分子核磁気共鳴分光法の一分野であり、タンパク質座標からタンパク質化学シフトを正確に計算することを目的としています。タンパク質化学シフト予測は、1960年代後半に、 X線結晶構造解析によって解明されたタンパク質構造に半経験的手法を適用することで初めて試みられました。[ 1 ]それ以来、タンパク質化学シフト予測は、量子力学、機械学習、経験的に導かれた化学シフト超曲面 など、より洗練された手法を採用するように進化してきました。 [ 1 ]最近開発された手法は、驚異的な精度と正確性を示しています。
NMR化学シフトは、核磁気共鳴分光法のマイルストーンと呼ばれることがよくあります。化学者は50年以上もの間、小さな有機分子の共有結合構造を解明するために、再現性が高く測定しやすいパラメータとして化学シフトを使用してきました。実際、近隣の原子の種類と特徴に対するNMR化学シフトの敏感さと、その合理的に予測可能な傾向が組み合わさって、何千もの新しく合成または新しく単離された化合物の構造を解読および記述するためにNMR化学シフトが非常に貴重になっています[ 1 ] [ 2 ] [ 3 ] [ 4 ]さまざまな重要なタンパク質構造特性に対する同じ敏感さにより、タンパク質化学シフトはタンパク質化学者と生体分子NMR分光法の専門家にとって同様に貴重になっています。[ 4 ]特に、タンパク質の化学シフトは置換基や共有結合原子の効果(電気陰性度、酸化還元状態、環電流など)だけでなく、バックボーンのねじれ角(二次構造)、水素結合、局所的な原子運動、溶媒のアクセシビリティ にも敏感です。
予測または推定されたタンパク質化学シフトは、化学シフトの割り当てプロセスを支援するために使用できます。これは、類似(または同一)のタンパク質構造がX線結晶構造解析によって解明されている場合に特に当てはまります。この場合、3次元構造を使用してNMR化学シフトが何であるかを推定し、実験的に観察された化学シフトを割り当てるプロセスを簡素化できます。予測/推定されたタンパク質化学シフトは、不正確な割り当てや誤った割り当ての特定、誤って参照された化学シフトの修正、化学シフトの改良によるタンパク質構造の最適化、核特異的シフトに対する異なる電子的または幾何学的効果の相対的な寄与の特定にも使用できます。[ 1 ]タンパク質化学シフトは、二次構造の特定、バックボーンのねじれ角の推定、芳香環の位置の決定、システインの酸化状態の評価、溶媒曝露の推定、バックボーンの柔軟性の測定にも使用できます。[ 4 ]
化学シフト予測は、化学シフト変化に寄与する主要な物理化学的因子に関する理解の継続的な向上によって 大きく進歩してきました。これらの進歩は、計算技術の大幅な進歩[ 5 ] [ 6 ] [ 7 ] [ 8 ]と生体分子化学シフトデータベースの急速な拡大 [ 9 ] [ 10 ]にも支えられています 。 過去40年間で、タンパク質の化学シフトを計算または予測するための少なくとも3つの異なる方法が登場しました。1つ目は、タンパク質化学シフトデータベースに対する配列/構造アライメントを使用する方法、2つ目は原子座標から直接シフトを計算する方法、そして3つ目はこれら2つのアプローチを組み合わせる方法です。[ 1 ] [ 4 ]
2000年初頭までに、いくつかの研究グループは、図1に示すように、異なる方法を組み合わせることで、タンパク質の化学シフトをより効率的かつ正確に計算できることに気付きました。これにより、タンパク質の座標データが提供されるとタンパク質の化学シフトを迅速に計算するいくつかのプログラムとウェブサーバーが開発されました。[ 1 ]これらの「ハイブリッド」プログラムとその機能およびURLの一部を以下の表1に示します。
| 名前 | 方法 | Webサイト |
|---|---|---|
| シフトカルク[ 11 ] | ハイブリッド – 経験的化学シフト超曲面と半古典的計算の組み合わせ | https://archive.today/20140324204821/http://nmr.group.shef.ac.uk/NMR/mainpage.html |
| シフト[ 12 ] | ハイブリッド – 半古典的計算と組み合わせたQM化学シフト超曲面 | http://casegroup.rutgers.edu/qshifts/qshifts.htm |
| チェシフト[ 13 ] | QM計算による化学シフト超曲面 | http://cheshift.com/ |
| シフトTX [ 2 ] | ハイブリッド – 経験的化学シフト超曲面と半古典的計算の組み合わせ | http://shiftx.wishartlab.com |
| プロシフト[ 14 ] | 原子パラメータと配列情報を用いたニューラルネットワークモデル | http://www.meilerlab.org/index.php/servers/show?s_id=9 |
| スパルタ[ 15 ] | ハイブリッド - 半古典的計算と組み合わせたデータベースへのシーケンスとシフトのマッチング | https://spin.niddk.nih.gov/bax/software/SPARTA/index.html |
| スパルタ+ [ 16 ] | ハイブリッド - 半古典的計算と人工ニューラルネットワークを組み合わせたデータベースへのシーケンスとシフトのマッチング | https://spin.niddk.nih.gov/bax/software/SPARTA+/ |
| カムシフト[ 17 ] | 距離ベースの方法とパラメータ化された多項式展開を組み合わせたもの | https://web.archive.org/web/20140109151911/http://www-vendruscolo.ch.cam.ac.uk/camshift/camshift.php |
| シフト2 [ 4 ] | ハイブリッド – 原子パラメータを用いた機械学習手法と半古典的計算(SHIFTX+)を組み合わせたもの。最後に、アンサンブルルールと配列相同性に基づく予測(SHIFTY+)を組み合わせたもの。 | http://www.shiftx2.ca |
この表 (図 2) には、61 個のテスト タンパク質の同一テスト セットを使用して、実験的に観測されたバックボーンの化学シフトと、さまざまな化学シフト予測子について計算/予測されたバックボーンのシフトとの相関係数がリストされています。
計算手法によって計算範囲や計算速度は異なります。一部の手法は、バックボーン原子(6種類の原子)のみの化学シフトを計算または予測します。また、バックボーン原子と特定の側鎖原子(CとNのみ)の化学シフトを計算するものや、すべての原子(40種類の原子)のシフトを計算できるものもあります。化学シフトの精密化には、分子動力学法やシミュレーテッドアニーリング法の実行中に数千もの構造が生成されるため、それらの化学シフトを同様に迅速に計算する必要があるため、高速計算が求められます。
| プログラム | 予測される原子の種類数 | 速度(秒/100残基) |
|---|---|---|
| シフトTX | 27 | 0.59 |
| スパルタ | 6(バックボーンのみ) | 17.92 |
| スパルタ+ | 6(バックボーンのみ) | 2.47 |
| カムシフト | 6(バックボーンのみ) | 0.91 |
| シフト | 31 | 3.66 |
| プロシフト | 40 | 12.82 |
| シフトTX2 | 40 | 2.10 |
SPARTA、SPARTA+、SHIFTS、CamShift、SHIFTX、SHIFTX2の計算速度テストはすべて、同じコンピューターで同じタンパク質セットを用いて実施されました。PROSHIFTの計算速度は、ウェブサーバーの応答速度に基づいています。[ 4 ]