![]() | |
| コンテンツ | |
|---|---|
| 説明 | 転写因子データベース |
キャプチャされたデータの種類 | 真核生物の転写因子、その結合部位および結合プロファイル |
| 生物 | 真核生物 |
| 接触 | |
| 研究センター | ヘルムホルツ感染研究センター、BIOBASE GmbH、geneXplain GmbH |
| 主な引用 | ウィンジェンダー(2008)[1] |
| 発売日 | 1988 |
| アクセス | |
| Webサイト | TRANSFAC 7.0 公開 2005 |
TRANSFAC (TRANScription FACtorデータベース)は、真核生物の 転写因子、そのゲノム結合部位、およびDNA結合プロファイルを手動でキュレーションしたデータベースです。このデータベースの内容は、潜在的な転写因子結合部位を予測するために使用できます。
導入
このデータベースの起源は、1988年に公開された初期のデータコレクションです。[2] TRANSFACという名前でリリースされた最初のバージョンは、旧ドイツ国立バイオテクノロジー研究センター(現ヘルムホルツ感染研究センター)で開発され、ローカルインストール用に設計されました。[3] 1993年に開始された最初の公的資金によるバイオインフォマティクスプロジェクトの1つとして、TRANSFACはインターネットで利用可能なリソースへと発展しました。[4]
1997年、TRANSFACはデータベースの長期的な資金調達を確保するため、新たに設立されたBIOBASE社に移管されました。それ以降、最新バージョンはライセンス制となっていますが、旧バージョンは非商用ユーザーには無料で提供されています。[5] [6] 2016年7月以降、TRANSFACはドイツのヴォルフェンビュッテルにあるgeneXplain GmbHによって保守・配布されています。[7]
コンテンツと機能
データベースの内容は、転写因子(TF)とそのDNA結合部位(TFBS)との相互作用を中心に構成されています。TFは、原典の科学文献から抽出された構造的および機能的特徴に基づいて記述されています。TFは、 DNA結合ドメインの特徴に基づいて、ファミリー、クラス、スーパークラスに分類されています。[8] [9] [10] [11]
転写因子(TF)のゲノム部位への結合は、部位の局在、配列、および適用された実験方法を特定することで記録されます。1つの転写因子、または密接に関連する転写因子のグループを参照するすべての部位がアラインメントされ、位置特異的スコアリングマトリックス(PSSM)、またはカウントマトリックスの構築に使用されます。TRANSFACマトリックスライブラリの多くのマトリックスはキュレーターチームによって構築され、その他は科学出版物から引用されています。
アプリケーション
TRANSFACデータベースは、真核生物の転写因子の百科事典として利用できます。各転写因子について、標的配列と制御対象遺伝子をリスト化することができ、これらは転写因子結合部位(TFBS)認識ツールのベンチマークとして、あるいは新しい転写因子結合部位(TFBS)認識アルゴリズムのトレーニングセットとして利用できます。[12]転写因子分類により、このようなデータセットをDNA結合ドメインの特性に関して分析することが可能になります。[13]もう1つの用途は、特定の遺伝子(セット)を制御するすべての転写因子を検索することです。システム生物学研究では、TRANSFACに記録された転写因子と標的遺伝子の関係を用いて、転写制御ネットワークを構築・解析しました。[14] [15] TRANSFACの最も頻繁な用途は、潜在的な転写因子結合部位の計算予測です。この目的のために、個々の結合部位またはマトリックスライブラリを使用するアルゴリズムが数多く存在します。
- Patch – TRANSFACに登録されている結合部位との配列類似性を解析します。データベースとともに提供されます。[16] [17]
- SiteSeer – TRANSFACに記載されている結合部位との配列類似性を解析します。[18] [19]
- マッチ – マトリックスライブラリを使用して潜在的なTFBSを識別します。これはデータベースとともに提供されます。[20] [21]
- TESS(転写要素検索システム)は、TRANSFACの結合部位と潜在的な結合部位との配列類似性を、TRANSFACと他の3つのソースのマトリックスライブラリを使用して解析します。[22] [23] TESSはまた、TRANSFACマトリックスを使用するシス調節モジュール(CRM、TFBSの特徴的な組み合わせ)を同定するためのプログラムも提供しています。[24]
- PROMO – 商用データベース版の支援によるTFBSのマトリックスベースの予測[25] [26]
- TFMエクスプローラー – 遺伝子セットにおける共通の潜在的TFBSの同定[27] [28]
- MotifMogul – さまざまなアルゴリズムを備えたマトリックスベースの配列解析[29]
- ConTra – 保存されたプロモーター領域におけるマトリックスベースの配列解析[30] [31]
- PMS(ポリマトリックスサーチ) – 保存されたプロモーター領域におけるマトリックスベースの配列解析[32] [33]
TRANSFAC のマトリックスライブラリと他のソースのマトリックスの比較:
- T-Regコンパレーター[34]は、個々のマトリックスまたはマトリックスのグループをTRANSFACや他のライブラリのマトリックスと比較します。
- MACO(ポリマトリックスサーチ)[35] [36] – マトリックスライブラリを使用したマトリックス比較。
多くのサーバーがTRANSFACの助けを借りて計算されたゲノムアノテーションを提供しています。[37] [38]他にも、このような解析を利用して標的遺伝子セットを推測するサーバーがあります。[39] [40]
参照
参考文献
- ^ Wingender E (2008年7月). 「ゲノム制御解析を支援するフレームワーク技術の一例としてのTRANSFACプロジェクト」. Brief. Bioinformatics . 9 (4): 326–32 . doi : 10.1093/bib/bbn016 . PMID 18436575.
- ^ Wingender E (1988年3月). 「転写制御タンパク質の集積」. Nucleic Acids Res . 16 (5): 1879–902 . doi :10.1093/nar/16.5.1879. PMC 338188. PMID 3282223 .
- ^ Wingender E, Heinemeyer T, Lincoln D (1991). 「調節DNA配列:その機能の予測可能性」ゲノム解析 - 配列から機能へ; BioTechForum - 分子遺伝学の進歩 (J. Collins, AJ Driesel 編) . 4 : 95–108 .
- ^ Wingender E, Dietze P, Karas H, Knüppel R (1996年1月). 「TRANSFAC: 転写因子とそのDNA結合部位に関するデータベース」. Nucleic Acids Res . 24 (1): 238–41 . doi :10.1093/nar/24.1.238. PMC 145586. PMID 8594589 .
- ^ BIOBASEの遺伝子制御ポータルにおけるTRANSFAC Public
- ^ TESS経由でTRANSFAC Publicにアクセス可能。2012年7月24日アーカイブ。ペンシルバニア大学(ペンシルバニア州)の計算生物学・情報科学研究所(CBIL)のWayback Machineにて。
- ^ TRANSFAC は geneXplain に買収されました
- ^ Wingender E (1997). 「真核生物転写因子の分類」Mol. Biol. (Mosk.) (ロシア語). 31 (4): 584– 600. PMID 9340487.
- ^ Heinemeyer T, Chen X, Karas H, Kel AE, Kel OV, Liebich I, Meinhardt T, Reuter I, Schacherer F, Wingender E (1999年1月). 「TRANSFACデータベースの拡張:調節分子メカニズムのエキスパートシステムに向けて」. Nucleic Acids Res . 27 (1): 318–22 . doi :10.1093/nar/27.1.318. PMC 148171. PMID 9847216 .
- ^ Stegmaier P, Kel AE, Wingender E (2004). 「転写因子のDNA結合ドメインの体系的分類」. Genome Inform . 15 (2): 276–86 . PMID 15706513.
- ^ ウィンジェンダー、E:転写因子の分類
- ^ トンパ M、リー N、ベイリー TL、チャーチ GM、デ ムーア B、エスキン E、ファヴォロフ AV、フリス MC、フー Y、ケント WJ、マケエフ VJ、ミロノフ AA、ノーブル WS、パヴェシ G、ペゾーレ G、レニエ M、シモニス N、シンハ S、ティス G、ヴァン ヘルデン J、ヴァンデンボガート M、ウェン Z、ワークマン C、イェ C、朱 Z (2005 年 1 月)。「転写因子結合部位の発見のための計算ツールの評価」。ナット。バイオテクノロジー。23 (1): 137–44 .土井:10.1038/nbt1053。PMID 15637633。S2CID 3234451 。
- ^ Narlikar L, Gordân R, Ohler U, Hartemink AJ (2006年7月). 「転写因子の構造クラスに基づく有益な事前分布は、de novoモチーフ発見を改善する」.バイオインフォマティクス. 22 (14): e384–92. doi : 10.1093/bioinformatics/btl251 . PMID 16873497.
- ^ Goemann B, Wingender E, Potapov AP (2009). 「制御ネットワークにおけるモチーフやその他のパターンの位相的意義を評価するためのアプローチ」BMC Syst Biol . 3 53. doi : 10.1186/1752-0509-3-53 . PMC 2694767. PMID 19454001 .
- ^ Kozhenkov S, Dubinina Y, Sedova M, Gupta A, Ponomarenko J, Baitaluk M (2010). 「BiologicalNetworks 2.0 - ゲノム生物学データの統合的視点」BMC Bioinformatics . 11 610. doi : 10.1186/1471-2105-11-610 . PMC 3019228 . PMID 21190573.
- ^ BIOBASEの無料ポータルのパッチ
- ^ マティス V、ケル=マルグーリス OV、フリッケ E、リービッヒ I、ランド S、バレ=ディリー A、ロイター I、チェクメネフ D、クルル M、ホルニッシャー K、フォス N、ステッグマイヤー P、レヴィツキ=ポタポフ B、サクセル H、ケル AE、ウィンゲンダー E (2006 年 1 月)。 「TRANSFAC とそのモジュール TRANSCompel: 真核生物における転写遺伝子制御」。核酸研究34 (データベースの問題): D108–10。土井:10.1093/nar/gkj143。PMC 1347505。PMID 16381825。
- ^ SiteSeer 2011年6月25日アーカイブマンチェスター大学のWayback Machine
- ^ Boardman PE, Oliver SG, Hubbard SJ (2003年7月). 「SiteSeer: ヌクレオチド配列中の転写因子結合部位の可視化と解析」Nucleic Acids Res . 31 (13): 3572–5 . doi :10.1093/nar/gkg511. PMC 168918. PMID 12824368 .
- ^ BIOBASEの無料ポータルでマッチ
- ^ Kel AE, Gössling E, Reuter I, Cheremushkin E, Kel-Margoulis OV, Wingender E (2003年7月). 「MATCH: DNA配列中の転写因子結合部位検索ツール」. Nucleic Acids Res . 31 (13): 3576–9 . doi :10.1093/nar/gkg585. PMC 169193. PMID 12824369 .
- ^ ペンシルバニア大学CBIL の TESS (転写要素検索システム)
- ^ TESSのサイト検索 Archived 2012-07-24 at the Wayback Machine
- ^ AnGEL CRM 検索は 2012-07-24 にWayback Machineの TESS システムにアーカイブされています
- ^ カタルーニャ工科大学(UPC)のALGGENサーバー上のPROMO
- ^ メッセゲル X、エスクデロ R、ファレ D、ヌニェス O、マルティネス J、アルバ MM (2002 年 2 月)。 「PROMO: 種に合わせた検索を使用した既知の転写調節エレメントの検出」。バイオインフォマティクス。18 (2): 333–4 .土井: 10.1093/bioinformatics/18.2.333。PMID 11847087。
- ^ TFM Explorer アーカイブ 2011-09-19 at the Wayback Machine on the bioinformatics software server of the SEQUOIA group
- ^ Tonon L, Touzet H, Varré JS (2010年7月). 「TFM-Explorer: ゲノムにおけるシス調節領域のマイニング」. Nucleic Acids Res . 38 (Web Server 版): W286–92. doi :10.1093/nar/gkq473. PMC 2896114. PMID 20522509 .
- ^ シアトルのシステム生物学研究所のMotifMogul
- ^ ゲント大学のConTra
- ^ Hooghe B, Hulpiau P, van Roy F, De Bleser P (2008年7月). 「ConTra: 種を超えた転写因子結合部位の同定のためのプロモーターアラインメント解析ツール」Nucleic Acids Res . 36 (Web Server 版): W128–32. doi :10.1093/nar/gkn195. PMC 2447729. PMID 18453628 .
- ^ PMS 2012年7月10日archive.todayにアーカイブ、南京大学で開発
- ^ Su G, Mao B, Wang J (2006). 「転写因子結合部位予測のためのウェブサーバー」. Bioinformation . 1 (5): 156–7 . doi :10.6026/97320630001156. PMC 1891680. PMID 17597879 .
- ^ T-Regコンパレータは、マックスプランク分子遺伝学研究所のサーバー上のarchive.todayに2012年7月18日(タイムスタンプの長さ)にアーカイブされています。
- ^ MACO アーカイブ 2012-07-10 at archive.today 、南京大学で開発
- ^ Su G, Mao B, Wang J (2006). 「MACO:転写因子結合部位を比較するためのギャップアライメントスコアリングツール」. In Silico Biol. (Gedrukt) . 6 (4): 307–10 . doi :10.3233/ISB-00243. PMID 16922693.
- ^ PReMOD Archived 2008-12-28 at the Wayback Machine : Human and mouse genome of the years 2004 & 2005; IRCM / McGill University, Montreal
- ^ PRIMA: 2004年のヒトゲノム; テルアビブ大学
- ^ MSigDB: 哺乳類転写因子標的遺伝子セット;マサチューセッツ州ケンブリッジにあるMITとハーバード大学のブロード研究所のGSEA wikiサーバー
- ^ Xie X, Lu J, Kulbokas EJ, Golub TR, Mootha V, Lindblad-Toh K, Lander ES, Kellis M (2005年3月). 「ヒトプロモーターおよび3' UTRにおける調節モチーフの系統的発見:複数の哺乳類の比較による」. Nature 434 ( 7031): 338–45 . Bibcode :2005Natur.434..338X. doi :10.1038/nature03441. PMC 2923337. PMID 15735639 .
外部リンク
- エドガー・ウィンジェンダーのホームページにあるTRANSFACデータベースの歴史
