

GCスキューとは、DNAまたはRNAの特定の領域において、ヌクレオチドの グアニンとシトシンが過剰または不足している状態を指します。GCスキューは、鎖特異的なグアニンの過剰発現を測定する統計的手法でもあります。[1]
平衡状態(突然変異や選択圧がなく、ヌクレオチドがゲノム内にランダムに分布している状態)では、DNA分子の両方の一本鎖において、4つのDNA塩基(アデニン、グアニン、チミン、シトシン)の頻度が等しくなります。 [2]しかし、ほとんどの細菌(大腸菌など)と一部の古細菌(サルフォロバス・ソルファタリカスなど)では、リーディング鎖とラギング鎖のヌクレオチド組成は非対称です。リーディング鎖にはグアニン(G)とチミン(T)が多く含まれ、ラギング鎖にはアデニン(A)とシトシン(C)が多く含まれます。[2]この現象はGCおよびATスキューと呼ばれ、対応する統計は[2]次のように定義されています。
GCスキュー = (G - C)/(G + C)
ATスキュー = (A − T)/(A + T)
非対称ヌクレオチド組成
1950年のエルヴィン・シャルガフの研究は、DNAにおいてグアニンとシトシン、アデニンとチミンという2つの塩基が同量存在することを実証しました。しかし、一方の塩基対ともう一方の塩基対の量は等しくありませんでした。 [ 3]シャルガフのこの発見は、シャルガフの法則またはパリティ則と呼ばれています。[3] 3年後、ワトソンとクリックはこの事実を用いてDNAの構造を導き出し、二重らせんモデルを提唱しました。
パリティルール1の自然な帰結として、2本のDNA鎖のいずれにも突然変異や選択バイアスがない平衡状態において、置換率が等しい場合、各鎖上の相補ヌクレオチドは、特定の塩基とその相補塩基の量が等しくなります。[4]言い換えれば、置換率が等しいと推定されるため、各DNA鎖においてTの出現頻度はAと等しく、Gの出現頻度はCと等しくなります。この現象はパリティルール2と呼ばれます。したがって、2番目のパリティルールは、突然変異や置換がない場合にのみ存在します。
パリティルール2からの逸脱は、リーディング鎖(すなわち順方向に複製されるDNA鎖)とラギング鎖を区別する非対称な塩基構成をもたらします。この非対称性はGCスキューまたはATスキューと呼ばれます。[2]
一部の細菌ゲノムでは、リーディング鎖ではグアニンがシトシンより、チミンがアデニンより多く、ラギング鎖ではその逆になっています。ヌクレオチド組成の偏りのスペクトルは、G = 0 または A = 0 に対応する -1 から、T = 0 または C = 0 に対応する +1 までの範囲になります。[2]そのため、正の GC 偏りは C よりも G が豊富であることを表し、負の GC 偏りは G よりも C が豊富であることを表します。結果として、リーディング鎖では正の GC 偏りと負の AT 偏りが見られ、ラギング鎖では負の GC 偏りと正の AT 偏りが見られることが予想されます。[5] GC または AT 偏りは、DNA 複製開始点または終結点に対応する2 つのレプリコアの境界で符号が変わります。 [2] [4] [5]当初、この非対称なヌクレオチド構成は、DNA複製におけるリーディング鎖とラギング鎖の異なるメカニズムとして説明されていました。DNA複製は半保存的かつ非対称的なプロセスです。[6]この非対称性は、複製フォークの形成と、それが新生リーディング鎖とラギング鎖に分裂することによって生じます。リーディング鎖は連続的に合成され、リーディング鎖と並置されます。ラギング鎖は、5'から3'方向への短いポリヌクレオチド断片(岡崎断片)を介して複製されます。[6]
計算とGCスキュープロット
GC スキューとその特性を計算し、グラフで示すには、主に 3 つの方法があります。
GC非対称性
最初のアプローチは、GCとATの非対称性です。[2] Jean R. Lobryは1996年に初めて、大腸菌、枯草菌、インフルエンザ菌の3種類の細菌のゲノムに組成の非対称性が存在することを報告しました。 [7]当時の元の式はskewではなく、[A] = [T]または[C] = [G]からの偏差と呼ばれていました。
[A] = [T]からの偏差は(A − T)/(A + T)となる。
[C] = [G]からの偏差は(C − G)/(C + G)となる。
ここで、A、T、G、Cは、定義された長さの特定の配列における等価塩基の出現頻度を表す。ウィンドウスライディング戦略は、ゲノム全体でCからの偏差を計算するために使用される。これらのプロットでは、Cからの正の偏差はラギング鎖に対応し、Cからの負の偏差はリーディング鎖に対応する。[8]さらに、偏差の符号が切り替わるサイトは、起点または末端に対応する。x軸は5’から3’にプロットされた染色体の位置を表し、y軸は偏差値を表す。この方法の主な弱点は、ウィンドウサイズに依存する特性である。したがって、適切なウィンドウサイズを選択することは、プロットの結果に大きな影響を与える。DNA複製の起点をより正確に特定して位置を特定するには、他の技術を偏差と組み合わせる必要がある。
CGCスキュー

2つ目のアプローチは、累積GCスキュー(CGCスキュー)と呼ばれます。[9]この手法はスライディングウィンドウ戦略を採用していますが、任意の開始点から隣接するウィンドウの合計を利用します。この手法では、通常、任意の開始点と任意の鎖を用いて、ゲノム全体を5'から3'方向にプロットします。累積GCスキュープロットでは、ピークはスイッチポイント(末端または起点)に対応します。
Lobry の以前の論文とは対照的に、GC skew の最近の実装では元の定義が反転され、次のように再定義されています。
GCスキュー = (G − C)/(G + C)。
GC スキューの定義を反転すると、累積スキューの最大値は端末に対応し、最小値はレプリケーションの起点に対応します。
Z曲線
最後のアプローチはZ曲線である。[10]これまでの方法とは異なり、この方法はスライディングウィンドウ戦略を用いず、複製起点の探索においてより優れた性能を発揮すると考えられている。[10]この方法では、配列の先頭の塩基に対する各塩基の累積頻度を調べる。Z曲線は、以下のパラメータを持つ3次元表現を用いる。
ここで、はプリンのピリミジンに対する過剰を表し、ケトのアミノに対する過剰を表し、は弱い水素結合と強い水素結合の関係を示しています。および成分は単独で複製起点と鎖の非対称構成を検出できます。これらの手法の弱点を補うために、複製起点と終結点の予測にはこれらの手法を組み合わせる必要があります。
機構
DNAの各鎖におけるヌクレオチド組成の偏りのメカニズムについては、科学界においてコンセンサスが得られていません。細菌における鎖特異的なヌクレオチド組成のメカニズムを説明する主要な学説は2つあります。[4]
1 つ目は、複製および転写中の各 DNA 鎖にかかる偏りと非対称な変異圧について説明します。[4] [11]複製プロセスの非対称性により、複製プロセス中の不均等な変異頻度とDNA 修復効率によって、一方の鎖にもう一方の鎖よりも多くの変異が導入される可能性があります。 [5]さらに、2 つの鎖間で複製に使用される時間は異なり、リーディング鎖とラギング鎖の間に非対称な変異圧が発生する可能性があります。[12] DNA 複製中の変異に加えて、転写変異によって鎖固有のヌクレオチド組成の偏りが生じる可能性があります。[5] 1 つの DNA 鎖でのシトシンの脱アミノ化、そして最終的にはシトシンからチミンへの変異によって、シトシンおよびアデニンに対するグアニンおよびチミンの相対数が増加する可能性があります。[5]ほとんどの細菌では、遺伝子の大部分がリーディング鎖にコードされています。[4]例えば、枯草菌のリーディング鎖は遺伝子の 75% をコードしています。[5]さらに、非コード鎖と比較して、コード鎖では脱アミノ化とシトシンからチミンへの変換が過剰であることが報告されています。[4] [5] [13]考えられる説明の 1 つは、転写プロセス中に非転写鎖 (コード鎖) が一本鎖であるため、転写鎖 (非コード鎖)と比較して脱アミノ化に対して脆弱であるということです。[5] [14]別の説明では、転写中の脱アミノ化修復活性はコード鎖では発生しません。[5]転写鎖のみがこれらの脱アミノ化修復イベントの恩恵を受けます。
2番目の学派は、GCおよびATの偏りのメカニズムは、リーディング鎖とラギング鎖間の選択圧の差に起因すると説明しています。 [4] [5] [14]原核生物ゲノムの調査により、3番目のコドン位置ではCよりもG、AよりもTが優先されることが示されています。[5]この区別により、細菌の場合のようにコード鎖がリーディング鎖とラギング鎖に不均等に分布している場合、非対称なヌクレオチド構成が生成されます。さらに、リボソームタンパク質などの転写頻度の高い遺伝子は、細菌では主にリーディング鎖に位置することが示されている。[5]そのため、3番目のコドンでCよりもGが選択されるという偏りが、GCの偏りにつながる可能性があります。さらに、一部のシグナル配列は、キ配列など、グアニンとチミンが豊富であり、これらの配列は、一方の鎖と比較してもう一方の鎖で高い頻度で出現する可能性があります。[4] [5]
突然変異圧と選択圧はどちらも独立してDNA鎖に非対称性をもたらす可能性がある。しかし、GCとATの偏りについては、両メカニズムの組み合わせと累積的な影響が最も妥当な説明である。[4] [14]
用途
GCスキューは、DNAのリーディング鎖、ラギング鎖、複製開始点、複製終結点の指標として有用であることが証明されている。[2] [4] [5]ほとんどの細菌と古細菌は、DNA複製開始点を1つだけ含む。[2] GCスキューは、リーディング鎖では正、ラギング鎖では負である。したがって、DNA複製開始点と終結点のちょうどその点で、GCスキューの符号が切り替わると予想される。[4] GCスキューは、異なる環境における1つの塩基の過剰をその相補塩基よりも計算することにより、鎖のバイアスとそれに関連するメカニズムを研究するためにも使用できる。[4] [5] [14] GCスキュー、CGCスキュー、Z曲線などの方法は、さまざまな生物におけるDNA複製のメカニズムをよりよく調査する機会を提供できるツールである。
参考文献
- ^ ショーン・P・ケネディ、ワイラップ・ビクター・ン、スティーブン・L・ザルツバーグ、リロイ・フード、シラディティア・ダスサーマ (2001年10月1日). 「ゲノム配列の計算解析によるハロバクテリウム属細菌NRC-1の極限環境への適応の解明」ゲノム研究. 11 (10): 1641– 1650. doi :10.1101/gr.190201. ISSN 1088-9051 . PMC 311145. PMID 11591641.
- ^ abcdefghi Lobry, JR「細菌の2本のDNA鎖における非対称置換パターン」分子生物学と進化 13, 660-665 (1996)。
- ^ ab Chargaff, E. 核酸の化学的特異性と酵素分解のメカニズム Experientia 6, 201-209 (1950).
- ^ abcdefghijkl Necsulea, A. & Lobry, JR 「複製がDNA塩基組成の非対称性に及ぼす影響を評価するための新たな方法」分子生物学と進化 24, 2169-2179, doi:10.1093/molbev/msm148 (2007).
- ^ abcdefghijklmno Tillier, ER & Collins, RA 細菌ゲノムにおける複製方向、遺伝子の方向、シグナル配列の塩基組成非対称性への寄与。Journal of molecular evolution 50, 249-257 (2000).
- ^ ab Rocha, EP. 細菌ゲノムの複製関連組織. Microbiology 150, 1609-1627, doi:10.1099/mic.0.26974-0 (2004).
- ^ Lobry, JR (1996年5月). 「細菌の2本のDNA鎖における非対称置換パターン」. Molecular Biology and Evolution . 13 (5): 660– 665. doi : 10.1093/oxfordjournals.molbev.a025626 . ISSN 0737-4038. PMID 8676740.
- ^ 「ロブリー1996年論文の解説」。2015年11月17日時点のオリジナルよりアーカイブ。2015年11月11日閲覧。
- ^ Grigoriev, A. 累積歪度図を用いたゲノム解析 Nucleic Acids Research 26, 2286-2290 (1998).
- ^ ab Zhang, R. & Zhang, CT 古細菌Halobacterium種NRC-1の多重複製起点. 生化学および生物理学的研究通信302, 728-734 (2003).
- ^ Lobry, JR & Sueoka, N. 細菌における非対称な方向性変異圧。ゲノム生物学3, RESEARCH0058 (2002).
- ^ Eppinger, M., Baar, C., Raddatz, G., Huson, DH & Schuster, SC. 4種のカンピロバクター属細菌の比較分析. Nature Reviews. Microbiology 2, 872-885, doi:10.1038/nrmicro1024 (2004).
- ^ Marin, A. & Xia, X. 細菌ゲノムにおけるタンパク質コード遺伝子のリーディング鎖とラギング鎖間のGC偏り:鎖バイアスを考慮した新たな置換モデル. Journal of theory biology 253, 508-513, doi:10.1016/j.jtbi.2008.04.004 (2008).
- ^ abcd Charneski CA, Honti F., Bryant JM, Hurst LD, Feil EJ Firmicuteゲノムにおける非定型AT偏りは突然変異ではなく選択によるものである。PLoS Genetics 7(9):e1002283 (2011)。
- Mewes, HW et al. MIPS: 2005年の全ゲノムからのタンパク質の解析とアノテーション。Nucleic Acids Res 34, D169-172, doi:10.1093/nar/gkj148 (2006)。