ゲノムアイランド(GI)は、水平起源の証拠があるゲノムの一部である。[ 1 ]この用語は通常、微生物学、特に細菌に関して使用される。GIは多くの機能をコード化でき、共生や病原性に関与し、生物の適応を助ける可能性がある。付与する機能に基づいて、GIには多くのサブクラスが存在する。[ 2 ]たとえば、病原性に関連するGIは病原性アイランド(PAI)と呼ばれることが多く、多くの抗生物質耐性遺伝子を含むGIは抗生物質耐性アイランドと呼ばれる。同じGIが、さまざまな種類の水平遺伝子伝達(形質転換、接合、形質導入)の結果として、遠縁の種に発生することがある。これは、塩基組成分析や系統発生推定によって決定できる。
様々なゲノムアイランド予測プログラムが開発されています。これらのツールは、配列に基づく方法と比較ゲノム学/系統発生に基づく方法に大別できます。
配列ベースの手法は、異なる種のゲノム配列構成間に存在する自然発生的な変異に依存します。異常な配列構成(ヌクレオチドバイアスやコドンバイアスなど)を示すゲノム領域は、これらの領域が水平伝播された可能性を示唆します。これらの手法には2つの大きな問題があります。1つは、ゲノム内の自然変異(時には高発現遺伝子によるもの)によって誤った予測が生じる可能性があること、もう1つは、水平伝播したDNAが時間の経過とともに改善(宿主ゲノムに変化)するため、予測が最近獲得したGIに限定されることです。
比較ゲノミクスに基づく手法では、複数の近縁種からの情報を用いて、水平伝播の兆候を示す領域を特定しようと試みます。例えば、ある種には存在するが、他の複数の近縁種には存在しないゲノム領域は、その領域が水平伝播された可能性を示唆します。代替的な説明としては、(i) 共通祖先には存在していたが、比較対象となる他のすべての種では失われている、(ii) 共通祖先には存在していなかったが、現在も存在する種において突然変異と選択によって獲得された、が挙げられます。その領域が共通祖先に存在していたことを示す外集団からの証拠がある場合、または系統発生から実際の欠失イベントが比較的少ないことが示唆される場合、その領域の多重欠失の論拠は強化されます。その領域を持つ種が他の種から大きく分岐したことが分かっている場合、または問題の領域が小さい場合、突然変異による獲得の論拠は強化されます。分類群のサンプリングで、その地域に生息していた可能性のある多くの絶滅種が省略された場合、特に絶滅がその地域の存在と相関関係にあった場合、(i) または (ii) のいずれかの妥当性は修正されるでしょう。
最も正確なGI予測方法のいくつかを統合した方法の一例として、IslandViewerがあります。[ 3 ]
細菌では、多くのタイプIIIおよびタイプIV分泌システムがゲノムアイランド上に存在する。これらの「アイランド」は、その大きなサイズ(> 10 Kb )、 tRNAをコードする遺伝子との頻繁な関連、そしてゲノムの他の部分と比較して異なるG+C含有量を特徴とする。多くのゲノムアイランドは反復構造に挟まれており、ファージやプラスミドなどの他の可動性エレメントの断片を運ぶ。接合エレメント(ICE)に隣接するものなど、一部のゲノムアイランドは染色体から自発的に切り出され、他の適切な受容体に転移することができる。[ 4 ]切り出しは存在するICE機構に依存するが、組み込みはゲノムアイランドに存在するインテグラーゼに起因する。