ジーンネットワーク

ジーンネットワーク
開発者テネシー大学 GeneNetwork 開発チーム
初回リリース1994年1月15日 (1994年1月15日
安定版リリース
2.0 / 2016年5月29日 ( 2016年5月29日)
リポジトリgithub .com /genenetwork /genenetwork2
書かれたJavaScriptHTMLPythonCSSCoffeeScriptPHP
ライセンスアフェロ一般公衆ライセンス
Webサイトwww.genenetwork.org

GeneNetworkは、システム遺伝学のためのデータベースとオープンソースのバイオインフォマティクスデータ解析ソフトウェアリソースを組み合わせたものです。[ 1 ]このリソースは、 DNA配列の違いを、対応する遺伝子およびタンパク質発現の違いや、健康や疾患リスクなどの形質の変動に結び付ける遺伝子制御ネットワークを研究するために 使用されます。GeneNetworkのデータ セットは通常、ヒト、マウスとラットの系統、およびDrosophila melanogasterArabidopsis thaliana大麦などの多様な生物を含む個体群からの遺伝子型( SNPなど)と表現型の大規模なコレクションで構成されます。[ 2 ]遺伝子型を含めることで、mRNA、タンパク質、代謝物レベルでの個体間の違い、および細胞機能、解剖学的構造、生理機能、および行動の違いに寄与するゲノム領域を発見するためのWebベースの遺伝子マッピングを実用的に実行できるようになります。

歴史

GeneNetworkの開発は1994年にテネシー大学健康科学センターでPortable Dictionary of the Mouse Genome (1994)のウェブ版として始まりました。[ 3 ] GeneNetworkはバイオメディカル研究における最初で最長の継続運用ウェブサービスです[ https://en.wikipedia.org/wiki/List_of_websites_founded_before_1995を参照]。1999年にPortable Gene DictionaryはKenneth F. ManlyのMap Manager QTマッピングプログラムと統合され、リアルタイム遺伝子解析のオンラインシステムを開発しました。[ 4 ] 2003年初めに、最初の大規模なAffymetrix遺伝子発現データセット(マウス脳全体のmRNAと造血幹細胞)が組み込まれ、システムはWebQTLと改名されました。[ 5 ] [ 6 ] GeneNetworkは現在、国際的な開発者グループによって開発されており、ヨーロッパ、アジア、オーストラリアにミラーサイトと開発サイトがあります。実稼働サービスは、テネシー大学ヘルスサイエンスセンターのシステムでホストされており、バックアップインスタンスはヨーロッパにあります。

GeneNetworkの現在の製品版(GN2とも呼ばれる)は2016年にリリースされました。[ 7 ] GeneNetworkの現在のバージョンは、前身のGN1と同じデータベースを使用していますが、よりモジュール化され、メンテナンスが容易なオープンソースコード(GitHubで入手可能)を備えています。GeneNetworkには現在、以下のサポートを含む重要な新機能も追加されています。

組織と使用

GeneNetwork は、次の 2 つの主要コンポーネントで構成されています。

  • 大規模な個人コホートの遺伝的、ゲノム的、および表現型データの膨大なコレクション
  • 分子および細胞ネットワークと遺伝子型と表現型の関係の分析を可能にする高度な統計分析および遺伝子マッピングソフトウェア

通常、各家族または集団ごとに 4 つのレベルのデータが得られます。

  1. DNA配列と遺伝子型
  2. 分子発現データは、アレイRNA-seq、エピゲノム、プロテオーム、メタボロミクス、メタゲノム法(分子表現型)を使用して生成されることが多い。
  3. 典型的な医療記録の一部であることが多い標準的な定量的表現型(例:血液化学、体重)
  4. 特性とデータセットのアノテーションファイルとメタデータ

統合されたデータタイプは、リレーショナルデータベースとIPSFファイルサーバーにまとめて格納され、種、コホート、科ごとに概念的に整理・グループ化されています。このシステムはLAMP(ソフトウェアバンドル)スタックとして実装されています。コードとMariaDBデータベースの簡易版はGitHubで入手できます。

GeneNetworkは主に研究者によって使用されていますが、遺伝学やバイオインフォマティクス( YouTubeの例を参照)、バイオインフォマティクス、生理学、心理学などの学部および大学院の授業にも導入され、成功を収めています。 [ 11 ]研究者や学生は通常、1つまたは複数のファミリーから遺伝子型と表現型のセットを取得し、組み込みの統計関数とマッピング関数を用いて変数間の関係性を探り、関連ネットワークを構築します。主な手順には、以下の要因の分析が含まれます。

  1. 形質の変異の範囲
  2. 特性間の共変動(散布図と相関関係、主成分分析)
  3. より大きな特性ネットワークの構造
  4. 量的形質遺伝子座マッピングと配列差異と表現型差異の連鎖の因果モデル

データソース

形質および分子発現データセットは、研究者から直接提出されるか、または国立生物工学情報センターの遺伝子発現オムニバスなどのリポジトリから抽出されます。データは、免疫系の単一細胞集団、特定の組織(網膜、前頭前皮質)からシステム全体(脳全体、肺、筋肉、心臓、脂肪、腎臓、花、植物胚全体)まで、さまざまな細胞と組織をカバーしています。典型的なデータセットは、完全に遺伝子型決定された数百の個体をカバーし、技術的および生物学的な複製も含まれる場合があります。遺伝子型と表現型は通常、査読済み論文から取得されます。GeneNetworkには、いくつかのRNAプロファイリングプラットフォーム(Affymetrix、Illumina、およびAgilent)のアノテーションファイルが含まれています。RNA-seqおよび定量的プロテオーム、メタボローム、エピジェネティクス、およびメタゲノムデータも、マウスやヒトを含むいくつかの種について利用できます。

ツールと機能

このサイトには、遺伝子発現やその他の表現型の変異のシンプルなグラフ表示、形質ペアの散布図(ピアソン法または順位順)、単純および複雑なネットワークグラフの構築、主成分分析と合成形質の分析、マーカー回帰を用いたQTLマッピング、区間マッピング、エピスタシス相互作用のペアスキャンなど、幅広い機能のためのツールが用意されています。ほとんどの機能は最大100個の形質に対応し、いくつかの機能はトランスクリプトーム全体に対応しています。

データベースはメインの検索ページで閲覧および検索できます。オンラインチュートリアルもご利用いただけます。また、主要データセットはテキストファイル、Excel、またはネットワークグラフの場合はSBML形式でダウンロードできます。2017年現在、GN2はベータ版として利用可能です。

コード

GeneNetworkは、Affero General Public License (AGPLv3)に基づいてリリースされたオープンソースプロジェクトです。コードの大部分はPythonで書かれていますが、C、R、JavaScriptで書かれたモジュールやその他のコードも含まれます。コードは主にPython 2.4です。GN2は主にPython 2.7で書かれており、FlaskフレームワークとJinja 2 HTMLテンプレートを使用していますが、今後数年間でPython 3.Xへの移行が計画されています。GN2は、Rプログラミング言語で書かれた多くの統計手順を呼び出します。2010年の元のソースコードとコンパクトなデータベースは、SourceForgeで入手できます。GN1は2019年までGitHubで積極的にメンテナンスされていましたが、2020年現在、すべての作業はGN2に集中しています。

参照

参考文献

  1. ^ Morahan, G; Williams, RW (2007). 「システム遺伝学:次世代の遺伝学研究か?」免疫反応のゲノム制御の解読. ノバルティス財団シンポジウム. 第281巻. pp.  181–8 , discussion 188–91, 208–9 . doi : 10.1002/9780470062128.ch15 . ISBN 9780470062128. PMID  17534074 .{{cite book}}:|journal=無視されました (ヘルプ)
  2. ^ Druka, A; Druka, I; Centeno, AG; Li, H; Sun, Z; Thomas, WT; Bonar, N; Steffenson, BJ; Ullrich, SE; Kleinhofs, Andris; Wise, Roger P; Close, Timothy J; Potokina, Elena; Luo, Zewei; Wagner, Carola; Schweizer, Günther F; Marshall, David F; Kearsey, Michael J; Williams, Robert W; Waugh, Robbie (2008). 「大麦におけるシステム遺伝学的解析に向けて:表現型、発現、遺伝子型データGeneNetworkへの統合」 . BMC Genetics . 9 : 73. doi : 10.1186/1471-2156-9-73 . PMC 2630324. PMID 19017390 .  
  3. ^ Williams, RW (1994). 「マウスゲノムのポータブル辞書:遺伝子マッピングと分子生物学のための個人データベース」. Mammalian Genome . 5 (6): 372–5 . doi : 10.1007/bf00356557 . PMID 8043953. S2CID 655396 .  
  4. ^ Chesler, EJ; Lu, L; Wang, J; Williams, RW; Manly, KF (2004). 「WebQTL:脳と行動における遺伝子発現と遺伝子ネットワークの迅速な探索的解析」Nature Neuroscience . 7 (5): 485–6 . doi : 10.1038/nn0504-485 . PMID 15114364 . S2CID 20241963 .  
  5. ^ Chesler, EJ; Lu, L; Shou, S; Qu, Y; Gu, J; Wang, J; Hsu, HC; Mountz, JD; et al. (2005). 「遺伝子発現の複雑形質解析により、神経系機能を調整する多遺伝子性および多面的ネットワークが明らかになる」Nature Genetics . 37 (3): 233– 42. doi : 10.1038/ng1518 . PMID 15711545 . S2CID 13189340 .  
  6. ^ Bystrykh, L; Weersing, E; Dontje, B; Sutton, S; Pletcher, MT; Wiltshire, T; Su, AI; Vellenga, E; et al. (2005). 「『遺伝子ゲノミクス』を用いた造血幹細胞機能に影響を与える制御経路の解明」ネイチャージェネティクス.37 ( 3 ) : 225–32.doi : 10.1038 / ng1497.PMID15711547.S2CID5622506 .  
  7. ^ Sloan, Z (2016). 「GeneNetwork: Webベース遺伝学のフレームワーク」 . The Journal of Open Source Software . 1 (2): 25. Bibcode : 2016JOSS....1...25S . doi : 10.21105/joss.00025 .
  8. ^ Zhou, X (2014). 「ゲノムワイド関連研究のための効率的な多変量線形混合モデルアルゴリズム」 . Nature Methods . 11 (2): 407–9 . doi : 10.1038/nmeth.2848 . PMC 4211878. PMID 24531419 .  
  9. ^ Arends, D (2016). 「相関特性遺伝子座(CTL)マッピング:遺伝子型を考慮した表現型ネットワーク推論」 . The Journal of Open Source Software . 1 (6): 87. Bibcode : 2016JOSS....1...87A . doi : 10.21105/joss.00087 .
  10. ^ Ziebarth, JD (2013). 「ベイジアンネットワークウェブサーバー:生物学的ネットワークモデリングのための包括的なツール」 .バイオインフォマティクス. 29 (21): 2803–3 . doi : 10.1093/bioinformatics/btt472 . PMID 23969134 . 
  11. ^ Grisham, W; Schottler, NA; Valli-Marill, J; Beck, L; Beatty, J (2010). 無料のウェブベースツールを用いたバイオインフォマティクスとニューロインフォマティクスの教育」 . CBE: Life Sciences Education . 9 (2): 98– 107. doi : 10.1187/cbe.09-11-0079 . PMC 2879386. PMID 20516355 .  
関連リソース

その他のシステム遺伝学およびネットワークデータベース