This article needs additional citations for verification. (January 2008) |
水平相関は、遺伝子配列解析のための手法です。特定の手法を指すのではなく、2つの特定のテーマに統合された、配列解析に対する様々なアプローチを包含します。
- 配列分析は、単一の遺伝子配列の長さに沿って水平方向に比較することによって実行されます。これは、複数の異なる遺伝子配列にわたって比較を行う垂直方向の方法とは対照的です。
- 一般的に、比較では、シーケンスの 2 つの領域間の相互情報量関数の値などの情報理論上の量を測定します。
水平相関アプローチの核となるアイデアは、2000年にGrosse、Herzel、Buldyrev、およびStanleyによって論文(Grosseら、2000年)で初めて発表されました。この最初の定式化では、Grosseらは、大きな遺伝子配列をコーディング領域と非コーディング領域に分割することで、その配列を特徴づけようとしました。コーディング対非コーディング問題に対する従来のアプローチは、一般に、最初に少量の入力でトレーニングし、次に配列全体にわたって実行する高度なパターン認識システムに依存していましたが(Ohlerら、1999年)、Grosseらの水平相関アプローチでは、配列をそれぞれがわずか500塩基対の長さの多数の比較的短い配列フラグメントに分割しました。次に、これらの各フラグメントをコーディングまたは非コーディングとして特徴づけようとしました。これは、フラグメントの長さに沿ったサイズ3の各ウィンドウを、そのフラグメント内の最初のサイズ3のウィンドウと比較し、2つのウィンドウ間の相互情報量関数の値を測定することで達成されました。コード配列は、非コード配列には見られない3周期性の様式化されたパターンを示すことが分かりました。このようなパターンは認識しやすく、コード領域の同定を著しく迅速化し、種に依存しない方法を可能にしました(Grosseら、2000)。
2000 年以降、遺伝子配列の長さに沿った情報理論的量の測定を重視する水平相関法が広く使用されるようになり、ショットガン シーケンシングフラグメント アセンブリにも応用されています (Otu & Sayood、2004)。
参考文献
- Grosse, Ivo; Herzel, Hanspeter; Buldyrev, Sergey V.; Stanley, H. Eugene (2000-05-01). 「コーディングDNAと非コーディングDNAにおける相互情報量の種独立性」. Physical Review E. 61 ( 5). American Physical Society (APS): 5624– 5629. Bibcode :2000PhRvE..61.5624G. doi :10.1103/physreve.61.5624. ISSN 1063-651X. PMID 11031617.
- Ohler, U.; Harbeck, S.; Niemann, H.; Noth, E.; Reese, MG (1999-05-01). 「真核生物プロモーター認識のための補間マルコフ連鎖」.バイオインフォマティクス. 15 (5). Oxford University Press (OUP): 362– 369. doi : 10.1093/bioinformatics/15.5.362 . ISSN 1367-4803. PMID 10366656.
- Otu, HH; Sayood, K. (2003-01-01). 「フラグメントアセンブリへの分割統治法」.バイオインフォマティクス. 19 (1). オックスフォード大学出版局 (OUP): 22– 29. doi :10.1093/bioinformatics/19.1.22. ISSN 1367-4803. PMID 12499289.