遺伝的連鎖とは、染色体上で近接するDNA配列が、有性生殖の減数分裂期に一緒に遺伝する傾向のことです。物理的に近い2つの遺伝子マーカーは、染色体の交差中に異なる染色分体に分離される可能性が低いため、離れたマーカーよりも連鎖が強いと言われています。言い換えれば、2つの遺伝子が染色体上で近いほど、それらの間の組換えの可能性が低くなり、一緒に遺伝する可能性が高くなります。異なる染色体上のマーカーは完全に連鎖していませんが、潜在的に有害な対立遺伝子の浸透度は他の対立遺伝子の存在によって影響を受ける可能性があり、これらの他の対立遺伝子は、特定の潜在的に有害な対立遺伝子が位置する染色体とは別の染色体に位置する場合があります。[ 1 ]
遺伝的連鎖は、グレゴール・メンデルの独立組み合わせの法則における最も顕著な例外です。連鎖を実証した最初の実験は1905年に行われました。当時、特定の形質が一緒に遺伝する傾向がある理由は不明でした。その後の研究により、遺伝子は物理的な距離によって結びついた物理的構造であることが明らかになりました。
遺伝的連鎖の典型的な単位はセンチモルガン(cM)です。2つのマーカー間の距離が1cMの場合、マーカーは平均して100回の減数分裂産物につき1回、つまり50回の減数分裂につき1回、異なる染色体に分離されます。
グレゴール・メンデルの独立組み合わせの法則は、すべての形質は他のすべての形質から独立して遺伝すると述べています。しかし、メンデルの研究が再発見されて間もなく、この規則の例外が発見されました。1905年、イギリスの遺伝学者ウィリアム・ベイトソン、エディス・レベッカ・サンダース、レジナルド・パネットは、メンデルと同様の実験でエンドウの植物を交配しました。[ 2 ] [ 3 ]彼らはスイートピーの形質の遺伝に興味を持ち、2つの遺伝子、花の色(P、紫、p、赤)と花粉粒の形状(L、長い、l、丸い)を研究していました。彼らは純粋系統PPLLとppllを交配し、その結果生じたPpLl系統 を自家交配しました
メンデル遺伝学によれば、予想される表現型はPL:Pl:pL:plの比率が9:3:3:1で出現するはずでした。ところが驚くべきことに、彼らはPLとplの頻度が増加し、PlとpLの頻度が減少するのを観察しました。
| 表現型と遺伝子型 | 観察 | 9:3:3:1の比率から予想される |
|---|---|---|
| 紫色、長い(P_L_) | 284 | 216 |
| 紫、丸型 ( P_ll ) | 21 | 72 |
| 赤、長い ( ppL_ ) | 21 | 72 |
| 赤、丸い(ppll) | 55 | 24 |
彼らの実験は、PとLの対立遺伝子、およびpとlの対立遺伝子間の連鎖を明らかにしました。PがLと一緒に出現する頻度、およびpがlと一緒に出現する頻度は、組み換えPlとpLの頻度よりも高いです。組み換え頻度は、戻し交配よりもF2交配で計算するのが困難ですが[ 4 ]、上記の表における観察された子孫数と予想される子孫数との間の適合性の欠如は、組み換え頻度が50%未満であることを示しています。これは、2つの要因が何らかの形で相互作用し、他の2つの表現型の出現を隠すことでこの違いを生み出したことを示しています。このことから、染色体上で互いに近接しているため、いくつかの形質は互いに関連しているという結論に至りました
連鎖に関する理解は、トーマス・ハント・モーガンの研究によって深められました。モーガンは、連鎖遺伝子間の乗換えの頻度が異なるという観察から、乗換え頻度が染色体上の遺伝子間の距離を示している可能性があるという考えに至りました。乗換え頻度を表す センチモルガンは、彼にちなんで名付けられました。

連鎖地図(遺伝子地図とも呼ばれる)は、種または実験集団における既知の遺伝子または遺伝子マーカーの相対的な位置を、各染色体上の特定の物理的距離ではなく、組換え頻度に基づいて示す表です。連鎖地図は、トーマス・ハント・モーガンの弟子であったアルフレッド・スターテヴァントによって初めて開発されました。
連鎖地図とは、相同染色体の交差におけるマーカー間の組換え頻度に基づいた地図です。2つの遺伝子マーカー間の組換え(分離)頻度が高いほど、それらのマーカー間の距離は遠いと推定されます。逆に、マーカー間の組換え頻度が低いほど、それらのマーカー間の物理的な距離は近いと推定されます。歴史的に、マーカーとして最初に使用されていたのは、コーディングDNA配列から得られる検出可能な表現型(酵素産生、眼の色)でした。最終的には、マイクロサテライトや制限酵素断片長多型(RFLP )を生成する配列など、確認済みまたは推定済みの非コーディングDNA配列が使用されるようになりました。
連鎖地図は、既知のマーカーの遺伝的連鎖を検査することで、他の遺伝子などのマーカーを見つけるのに役立ちます。連鎖地図作成の初期段階では、データを用いて連鎖群(連鎖することが知られている遺伝子の集合)を構築します。知識が深まるにつれて、連鎖群にさらに多くのマーカーが追加され、最終的には染色体全体を覆うようになります。[ 6 ]よく研究されている生物では、連鎖群は染色体と1対1で対応しています。
連鎖地図は、物理地図(放射線低減雑種地図など)や遺伝子地図ではありません。
連鎖解析は、家族を通じて病気の表現型と共分離する染色体セグメントを探す遺伝学的手法です。 [ 7 ]これは、二値形質と量的形質の両方の遺伝子をマッピングするために使用できます。[ 7 ]連鎖解析は、パラメトリック(表現型と遺伝的類似性の関係がわかっている場合)またはノンパラメトリックのいずれかになります。パラメトリック連鎖解析は、伝統的なアプローチであり、病気に重要な遺伝子が遺伝子マーカーに連鎖する確率を LOD スコアを使用して調べます。LOD スコアは、病気とマーカーが共分離している特定の家系が、連鎖の存在(特定の連鎖値を持つ)によるものか、偶然によるものかの確率を評価します。一方、ノンパラメトリック連鎖解析では、対立遺伝子がそれ自身と系統的に同一である確率を調べます。

ニュートン・モートン[ 8 ]によって開発されたLODスコア(オッズの対数(10を底とする))は、ヒト、動物、植物集団における連鎖解析でよく用いられる統計的検定です。LODスコアは、2つの遺伝子座が実際に連鎖している場合に検定データを取得する尤度と、純粋に偶然に同じデータを観察する尤度(つまり、尤度比(の対数))を比較します。したがって、仮説の事前確率の対数オッズにLODスコアを加算することで、ベイズの法則で規定されている事後対数オッズに更新することができます。つまり、LODスコアは、観測量(本質的には最大尤度または最大事後値)に等しい量の連鎖の証拠の強さ(ビットではなく10を底とする)です。正のLODスコアは連鎖の存在を示唆し、負のLODスコアは連鎖の可能性が低いことを示しますコンピューターによる LOD スコア分析は、メンデル形質間の連鎖(または形質とマーカー間、あるいは 2 つのマーカー間)を 決定するために複雑な家系図を分析する簡単な方法です。
この方法はストラチャンとリードによってさらに詳細に説明されている。[1]簡単に言うと、次のように機能します。
LOD スコアは次のように計算されます。
NR は非組換え子孫の数、R は組換え子孫の数を表します。分母に 0.5 が使用されているのは、完全に連鎖していない対立遺伝子(例えば、別々の染色体上にある対立遺伝子)は、独立組み合わせにより 50% の確率で組換えが起こるためです。θは組換え率、すなわち研究対象の遺伝子マーカーと疾患に関連する推定遺伝子との間で組換えが起こった出生数の割合です。したがって、 R / ( NR + R ) に等しくなります。
慣例的に、LODスコアが3.0を超える場合、観察された連鎖が偶然に発生したのではない確率が1000対1であることを示しているため、連鎖の証拠とみなされます。一方、LODスコアが-2.0未満の場合は、連鎖を除外する証拠とみなされます。単一の家系からLODスコア3が得られる可能性は非常に低いですが、検定の数学的特性により、複数の家系から得られたデータのLODスコアを合計することで、それらのデータを組み合わせることができます。LODスコア3はp値が約0.05に相当し、[ 9 ]多重検定補正(例:ボンフェローニ補正)は必要ありません。[ 10 ]
連鎖解析には、タイプ1エラー率を著しく増加させ、ヒトの量的形質座位(QTL)のマッピングの検出力を低下させる可能性のある、いくつかの方法論的および理論的な限界があります。[ 11 ]連鎖解析は、ハンチントン病などの希少疾患に寄与する遺伝子変異の同定には成功しましたが、心臓病やさまざまな種類の癌などのより一般的な疾患に適用した場合は、それほど良好な結果が得られませんでした。[ 12 ]この理由としては、一般的な疾患に影響を与える遺伝的メカニズムが、一部の希少疾患を引き起こすメカニズムとは異なることが挙げられます。[ 13 ]
組み換え頻度は遺伝的連鎖の尺度であり、遺伝子連鎖地図の作成に使用されます。組み換え頻度 ( θ ) は、減数分裂中に2 つの遺伝子の間で単一の染色体交差が発生する頻度です。センチモルガン(cM) は、1% の組み換え頻度を表す単位です。この方法では、組み換え頻度に基づいて 2 つの遺伝子座間の遺伝的距離を測定できます。これは、実際の距離の良い推定値です。二重交差が発生すると、組み換えは発生しなくなります。この場合、交差が発生したかどうかはわかりません。分析している遺伝子座が非常に近い場合 (7 cM 未満)、二重交差が発生する可能性は非常に低くなります。距離が大きくなると、二重交差の可能性が高くなります。二重交差の可能性が高くなると、適切な数学モデルを使用しない限り、2 つの遺伝子座間の遺伝的距離を系統的に過小評価する可能性があります。
二重連鎖は、植物においてはより歴史的な関心事です。動物では二重交差は稀です。例えばヒトでは、減数分裂中に1つの染色体が平均2回の交差を起こします。さらに、現代の遺伝学者は十分な数の遺伝子を保有しているため、初期の頃のように遺伝子が少数しか知られていなかった時代とは異なり、連鎖解析は近傍の遺伝子のみで十分です。[ 14 ]
減数分裂中、染色体はランダムに配偶子へと分配され、ある遺伝子の対立遺伝子の分離は別の遺伝子の対立遺伝子とは独立しています。これはメンデルの第二法則に示されており、独立組み合わせの法則として知られています。独立組み合わせの法則は、異なる染色体上に位置する遺伝子については常に成り立ちますが、同じ染色体上に位置する遺伝子については必ずしも成り立ちません。
独立した組み合わせの例として、遺伝子型AABB の純血種のホモ接合体の親株と、遺伝子型aabbの異なる純血種の株との交配を考えてみましょう。 A と a 、および B と b は、遺伝子 A と B の対立遺伝子を表します。これらのホモ接合体の親株を交配すると、遺伝子型 AaBb の二重ヘテロ接合体の F1 世代の子孫が生じます。遺伝子 A の対立遺伝子は、減数分裂中に遺伝子 B の対立遺伝子とは独立して組み合わせられるため、F1 子孫 AaBb は、AB 、 Ab、aB、およびabである配偶子を等しい頻度 (25%) で生成します。4 つの配偶子のうち 2 つ (50%)、 AbとaBは、親世代には存在しなかったことに注意してください。これらの配偶子は、組み換え配偶子を表します。組み換え配偶子は、元の二倍体細胞を構成していた両方の半数体配偶子と異なる配偶子です。この例では、4 つの配偶子のうち 2 つが組み換え配偶子であったため、組み換え頻度は 50% です。
2つの遺伝子が異なる染色体上に位置する場合、または同じ染色体上で大きく離れている場合、 組換え頻度は50%になります。これは独立組み合わせの結果です。
2つの遺伝子が同じ染色体上で近接している場合、それらは独立して組み合わせられず、連鎖していると言われます。異なる染色体上に位置する遺伝子は独立して組み合わせられ、組換え頻度は50%ですが、連鎖している遺伝子の組換え頻度は50%未満です。
連鎖の例として、ウィリアム・ベイトソンとレジナルド・パネットによる古典的な実験を考えてみましょう。[ 15 ] 彼らはスイートピーの形質の遺伝に興味があり、2つの遺伝子、つまり花の色の遺伝子(P、紫とp、赤)と花粉粒の形に影響を及ぼす遺伝子(L、長いとl、丸い)を研究していました。彼らは純粋系統のPPLLとppllを交配し、得られたPpLl系統を自家交配しました。メンデル遺伝学によれば、予想される表現型は PL:Pl:pL:pl の比率が 9:3:3:1 で発生します。驚いたことに、彼らは PL と pl の頻度が増加し、 Pl と pL の頻度が減少するのを観察しました(下の表を参照)。
| 表現型と遺伝子型 | 観察 | 9:3:3:1の比率から予想される |
|---|---|---|
| 紫色、長い(P_L_) | 284 | 216 |
| 紫、丸型 ( P_ll ) | 21 | 72 |
| 赤、長い ( ppL_ ) | 21 | 72 |
| 赤、丸い(ppll) | 55 | 24 |

彼らの実験は、 PとLの対立遺伝子、およびpとlの対立遺伝子の間に連鎖があることが明らかになりました。PがLと一緒に出現する頻度、およびpがlと一緒に出現する頻度は、組み換えられたPlとpLの頻度よりも高いです。F2交配では、戻し交配よりも組み換え頻度を計算するのが困難ですが[ 4 ]、上記の表で観察された子孫の数と予想される子孫の数の間の適合性の欠如は、組み換え頻度が50%未満であることを示しています
この場合の子孫は、1 つの染色体上に連鎖した 2 つの優性対立遺伝子を受け継いでいます (カップリングまたはシス配置と呼ばれます)。しかし、交差後、子孫の一部は、1 つの形質 (例: 紫) の優性対立遺伝子が 2 つ目の形質 (例: 丸い) の劣性対立遺伝子に連鎖した、一方の親の染色体を受け継いでいる可能性があります (例: 赤と長い)。これは反発またはトランス配置と呼ばれます。ここでの表現型は依然として紫と長いですが、この個体と劣性親との検定交配により、2 つの交差表現型の割合が大幅に増加した子孫が生成されます。この例からはこのような問題は起こりそうにないように思えるかもしれませんが、一部の作物の耐病性を向上させるために育種を行うと、好ましくない反発連鎖が発生します。
二重ヘテロ接合体における対立遺伝子の 2 つの可能な配置 (シスとトランス) は配偶子段階と呼ばれ、段階分けとは特定の個体にどちらの配置が存在するかを決定するプロセスです。
2つの遺伝子が同じ染色体上に存在する場合、遺伝子間の組み換えを引き起こす交差の確率は、 2つの遺伝子間の距離と関連しています。そのため、組み換え頻度は連鎖地図または遺伝子地図の作成に利用されてきました。
しかし、組換え頻度は、連鎖する2つの遺伝子間の距離を過小評価する傾向があることに注意することが重要です。これは、2つの遺伝子が離れているほど、それらの遺伝子間で2回または偶数の交差が発生する可能性が高くなるためです。2つの遺伝子間で2回または偶数の交差が発生すると、それらは同じ配偶子に共分離され、期待される組換え子孫ではなく、親の子孫が生じます。前述のように、コスアンビ変換とハルデン変換は、多重交差を補正しようとします。[ 16 ]
1950年代初頭には、染色体中の遺伝子は遺伝子組換えによって分割できない個別の実体であり、紐に通されたビーズのように配列されているという見解が一般的でした。1955年から1959年にかけて、ベンツァーはバクテリオファージT4のrII変異体を用いて遺伝子組換え実験を行いました。彼は組換え実験に基づいて、変異部位を直線的にマッピングできることを発見しました。[ 17 ] [ 18 ]この結果は、遺伝子がDNAの長さに相当する直線構造を持ち、独立して変異できる多数の部位が存在する という重要な考えを裏付ける証拠となりました。
Edgarら[ 19 ]は、バクテリオファージT4のr変異体を用いたマッピング実験を行い、rII変異体間の組換え頻度は厳密には加法的ではないことを示した。2つのrII変異体(axd)の交配による組換え頻度は、通常、隣接する内部サブ区間(axb)+(bxc)+(cxd)の組換え頻度の合計よりも低くなる。厳密には加法的ではないものの、遺伝子組換えの根底にある分子メカニズムを反映していると考えられる系統的な関係が観察された[ 20 ]。
染色体の組み換えは減数分裂における重要な過程ですが、生物種間および種内における組み換え頻度には大きなばらつきがあります。性差のある組み換え率はヘテロキアズミーと呼ばれ、オスとメスの間の一般的な組み換え率よりも高い頻度で観察されます。哺乳類では、メスの方がオスよりも組み換え率が高いことがよくあります。この組み換え率の違いには、減数分裂における独自の選択要因やドライバーが影響していると考えられています。また、この組み換え率の違いは、卵子形成と精子形成における減数分裂の環境と条件が大きく異なることを反映している可能性もあります。[ 21 ]
DNAの処理に関与するタンパク質をコードする遺伝子の変異は、しばしば組み換え頻度に影響を与える。バクテリオファージT4では、複製DNAポリメラーゼ[遺伝子産物43(gp43)]の発現を低下させる変異により、組み換え(連鎖の減少)が数倍に増加した。[ 22 ] [ 23 ] 組み換えの増加は、欠陥のあるDNAポリメラーゼによる複製エラーによる可能性があり、それ自体がテンプレートスイッチ、すなわちコピー選択組み換えイベントなどの組み換えイベントである。[ 24 ]組み換えは、 DNAリガーゼ(gp30)[ 25 ] [ 23 ]とdCMPヒドロキシメチラーゼ(gp42)[ 22 ] [ 23 ]の発現を低下させる変異によっても増加した。これら2つの酵素はDNA合成に利用されている。
ヌクレアーゼ機能を持つタンパク質(gp46とgp47)をコードする遺伝子の変異によって組換えが減少(連鎖が増加)する[ 25 ] [ 23 ]およびDNA結合タンパク質(gp32)[ 23 ] バクテリオファージuvsX遺伝子の変異も組換えを大幅に減少させる。[ 26 ] uvsX遺伝子は、組換えにおいて中心的な役割を果たす、よく研究されている大腸菌のrecA遺伝子 に類似している。 [ 27 ]
非常に大規模な家系図や、全ゲノム配列解析などの非常に高密度な遺伝子マーカーデータがあれば、組み換えを正確に特定することが可能です。このタイプの遺伝子解析では、家系図の各減数分裂において、ゲノムの各位置に減数分裂指標が割り当てられます。この指標は、親の染色体のどのコピーが、その位置で伝達された配偶子に寄与しているかを示します。例えば、親の染色体の「最初の」コピーの対立遺伝子が伝達される場合、その減数分裂には「0」が割り当てられます。親の染色体の「2番目の」コピーの対立遺伝子が伝達される場合、その減数分裂には「1」が割り当てられます。親の2つの対立遺伝子は、それぞれ2人の祖父母から1つずつ受け継がれました。これらの指標は、同一性遺伝(IBD)状態または遺伝状態を決定するために使用され、それらは疾患の原因となる遺伝子を特定するために使用されます