無限サイトモデル(ISM)は、 1969年に木村資生によって初めて提唱された分子進化の数理モデルです。[1]他の突然変異モデルと同様に、ISMは、突然変異がDNA配列においてどのように新しい対立遺伝子を生み出すかを理解するための基礎を提供します。対立遺伝子頻度を用いることで、有限集団におけるヘテロ接合性、すなわち遺伝的多様性を計算し、関心のある集団間の遺伝的距離を推定することができます。
ISMの仮定は、(1)突然変異が起こり得る部位は無限に存在する、(2)すべての新しい突然変異は新しい部位で起こる、(3)組み換えは起こらない、というものである。[1] [2] [3]「部位」という用語は、単一のヌクレオチド塩基対を指す。[1]すべての新しい突然変異は新しい部位で起こらなければならないため、ホモプラスシー、つまり以前存在した対立遺伝子への復帰突然変異は起こり得ない。すべての同一の対立遺伝子は、系統的に同一である。4配偶子ルールをデータに適用することで、組み換えが起こらないというモデルの仮定に違反しないことを保証することができる。[4]
突然変異率()は次のように推定できます。ここで、はランダムに選択された DNA 配列内で見つかった突然変異の数(世代ごと)、は有効な集団サイズです。[5]係数は、集団の個体の遺伝子コピー数の 2 倍の積です。二倍体で両親から受け継がれた遺伝子の場合、適切な係数は 4 ですが、ミトコンドリア遺伝子などの片親で半数体の遺伝子の場合、係数は 2 になりますが、ほとんどの種で のおよそ半分である雌の有効な集団サイズに適用されます。
DNA配列の長さを考慮すると、予想される突然変異の数は次のように計算されます。
ここでkはDNA配列の長さであり、その部位で突然変異が発生する確率である。[5]
ワターソンは分離部位の数を考慮した突然変異率の推定値(ワターソン推定値)を開発した。[6]
ISMを考える一つの方法は、ゲノム進化にどのように適用されるかを考えることです。ゲノム進化へのISMの適用を理解するには、このモデルを染色体に適用して考える必要があります。染色体は、A、C、G、またはTで表されるヌクレオチドである部位で構成されています。個々の染色体は無限ではありませんが、染色体を連続した区間、あるいは連続した円として考える必要があります。[7]
ISMをゲノム進化の観点から理解するためには、複数の仮定が適用される。[7]
- これらの染色体にはk個の切断が生じ、2k個の自由端が残ります。これらの2k個の自由端は、染色体セットを再編成する新たな方法(相互転座、融合、分裂、逆位、環状切断、環状切除)で再結合します。
- ブレークポイントは 2 回使用されることはありません。
- 染色体セットは重複したり失われたりすることがあります。
- DNAの水平遺伝子伝達やウイルスの組み込みなど、染色体中にこれまで存在しなかったDNAが観察されることがあります。
- 染色体が十分に異なると、進化によって新しい種が形成される可能性があります。
- 1 つの塩基対を変更する置換は個別には見えず、置換はサイトごとに限られた速度で発生します。
- 置換率は種内のすべてのサイトで同じですが、種間で異なる場合があります (つまり、分子時計は想定されていません)。
- 置換そのものについて考えるのではなく、染色体上の各点における置換の影響を、その部位のゲノムの前のバージョンと子孫の対応する部位のゲノムの次のバージョンとの間の進化距離の連続的な増加として考えてみましょう。[7]
参考文献
- ^ abc 木村 基夫 (1969-04-01). 「有限集団における突然変異の定常的な流れによるヘテロ接合性ヌクレオチド部位の維持数」遺伝学61 ( 4): 893–903 . doi :10.1093/genetics/61.4.893. ISSN 0016-6731. PMC 1212250. PMID 5364968 .
- ^ Tajima, F. (1996). 「集団遺伝学における無限アレルモデルと無限サイトモデル」. Journal of Genetics . 75 : 27–31 . doi :10.1007/bf02931749. S2CID 1330336.
- ^ Watterson, GA (1975). 「組み換えを伴わない遺伝モデルにおける分離部位の数について」.理論集団生物学. 7 (2): 256– 276. Bibcode :1975TPBio...7..256W. doi :10.1016/0040-5809(75)90020-9. PMID 1145509.
- ^ Hudson, Richard R.; Kaplan, Norman L. (1985-09-01). 「DNA配列サンプルの履歴における組換えイベント数の統計的特性」. Genetics . 111 (1): 147–164 . doi :10.1093/genetics/111.1.147. ISSN 0016-6731. PMC 1202594. PMID 4029609 .
- ^ ab Futschik, A; Gach, F (2008). 「Wattersonの推定値の不許容性について」.理論人口生物学. 73 (2): 212– 221. Bibcode :2008TPBio..73..212F. doi :10.1016/j.tpb.2007.11.009. PMID 18215409.
- ^ Ramirez-Soriano, A; Nielsen, R (2009). 「一塩基多型発見プロセスに起因する確認バイアスに対するΘおよびTajimaのD推定値の補正」. Genetics . 181 (2): 701– 710. doi :10.1534/genetics.108.094060. PMC 2644958. PMID 19087964 .
- ^ abc Ma, Jian; Ratan, Aakrosh; Raney, Brian J.; Suh, Bernard B.; Miller, Webb; Haussler, David (2008-09-23). 「ゲノム進化の無限サイトモデル」. Proceedings of the National Academy of Sciences . 105 (38): 14254– 14261. doi : 10.1073/pnas.0805217105 . ISSN 0027-8424. PMC 2533685. PMID 18787111 .
さらに読む
- デグナン, ジェームズ H.; ソルター, ローラ A. (2005). 「合体過程における遺伝子樹の分布」. Evolution . 59 (1): 24– 37. doi :10.1111/j.0014-3820.2005.tb00891.x. PMID 15792224. S2CID 592613.
- Hobolth, Asger; Uyenoyama, Marcy K.; Wiuf, Carsten (2008). 「無限サイトモデルにおける重要度サンプリング」.遺伝学および分子生物学における統計的応用. 7 (1): Article32. doi :10.2202/1544-6115.1400. PMC 2832804. PMID 18976228 .
- Ma, Jian; et al. (2008). 「ゲノム進化の無限サイトモデル」. Proceedings of the National Academy of Sciences . 105 (38): 14254– 14261. doi : 10.1073/pnas.0805217105 . PMC 2533685. PMID 18787111 .
- Tsitrone, Anne; Rousset, François; David, Patrice (2001). 「ヘテロシス、マーカー突然変異過程、そして集団近親交配史」. Genetics . 159 (4): 1845– 1859. doi :10.1093/genetics/159.4.1845. PMC 1461896. PMID 11779819 .