| ジーンネットワーク | |
|---|---|
| 開発者 | テネシー大学 GeneNetwork 開発チーム |
| 初回リリース | 1994年1月15日 (1994年1月15日) |
| 安定版リリース | 2.0 / 2016年5月29日 ( 2016年5月29日) |
| リポジトリ | github |
| 書かれた | JavaScript、HTML、Python、CSS、CoffeeScript、PHP |
| ライセンス | アフェロ一般公衆ライセンス |
| Webサイト | www.genenetwork.org |
GeneNetworkは、システム遺伝学のためのデータベースとオープンソースのバイオインフォマティクスデータ解析ソフトウェアリソースを組み合わせたものです。[ 1 ]このリソースは、 DNA配列の違いを、対応する遺伝子およびタンパク質発現の違いや、健康や疾患リスクなどの形質の変動に結び付ける遺伝子制御ネットワークを研究するために 使用されます。GeneNetworkのデータ セットは通常、ヒト、マウスとラットの系統、およびDrosophila melanogaster、Arabidopsis thaliana、大麦などの多様な生物を含む個体群からの遺伝子型( SNPなど)と表現型の大規模なコレクションで構成されます。[ 2 ]遺伝子型を含めることで、mRNA、タンパク質、代謝物レベルでの個体間の違い、および細胞機能、解剖学的構造、生理機能、および行動の違いに寄与するゲノム領域を発見するためのWebベースの遺伝子マッピングを実用的に実行できるようになります。
GeneNetworkの開発は1994年にテネシー大学健康科学センターでPortable Dictionary of the Mouse Genome (1994)のウェブ版として始まりました。[ 3 ] GeneNetworkはバイオメディカル研究における最初で最長の継続運用ウェブサービスです[ https://en.wikipedia.org/wiki/List_of_websites_founded_before_1995を参照]。1999年にPortable Gene DictionaryはKenneth F. ManlyのMap Manager QTマッピングプログラムと統合され、リアルタイム遺伝子解析のオンラインシステムを開発しました。[ 4 ] 2003年初めに、最初の大規模なAffymetrix遺伝子発現データセット(マウス脳全体のmRNAと造血幹細胞)が組み込まれ、システムはWebQTLと改名されました。[ 5 ] [ 6 ] GeneNetworkは現在、国際的な開発者グループによって開発されており、ヨーロッパ、アジア、オーストラリアにミラーサイトと開発サイトがあります。実稼働サービスは、テネシー大学ヘルスサイエンスセンターのシステムでホストされており、バックアップインスタンスはヨーロッパにあります。
GeneNetworkの現在の製品版(GN2とも呼ばれる)は2016年にリリースされました。[ 7 ] GeneNetworkの現在のバージョンは、前身のGN1と同じデータベースを使用していますが、よりモジュール化され、メンテナンスが容易なオープンソースコード(GitHubで入手可能)を備えています。GeneNetworkには現在、以下のサポートを含む重要な新機能も追加されています。
GeneNetwork は、次の 2 つの主要コンポーネントで構成されています。
通常、各家族または集団ごとに 4 つのレベルのデータが得られます。
統合されたデータタイプは、リレーショナルデータベースとIPSFファイルサーバーにまとめて格納され、種、コホート、科ごとに概念的に整理・グループ化されています。このシステムはLAMP(ソフトウェアバンドル)スタックとして実装されています。コードとMariaDBデータベースの簡易版はGitHubで入手できます。
GeneNetworkは主に研究者によって使用されていますが、遺伝学やバイオインフォマティクス( YouTubeの例を参照)、バイオインフォマティクス、生理学、心理学などの学部および大学院の授業にも導入され、成功を収めています。 [ 11 ]研究者や学生は通常、1つまたは複数のファミリーから遺伝子型と表現型のセットを取得し、組み込みの統計関数とマッピング関数を用いて変数間の関係性を探り、関連ネットワークを構築します。主な手順には、以下の要因の分析が含まれます。
形質および分子発現データセットは、研究者から直接提出されるか、または国立生物工学情報センターの遺伝子発現オムニバスなどのリポジトリから抽出されます。データは、免疫系の単一細胞集団、特定の組織(網膜、前頭前皮質)からシステム全体(脳全体、肺、筋肉、心臓、脂肪、腎臓、花、植物胚全体)まで、さまざまな細胞と組織をカバーしています。典型的なデータセットは、完全に遺伝子型決定された数百の個体をカバーし、技術的および生物学的な複製も含まれる場合があります。遺伝子型と表現型は通常、査読済み論文から取得されます。GeneNetworkには、いくつかのRNAプロファイリングプラットフォーム(Affymetrix、Illumina、およびAgilent)のアノテーションファイルが含まれています。RNA-seqおよび定量的プロテオーム、メタボローム、エピジェネティクス、およびメタゲノムデータも、マウスやヒトを含むいくつかの種について利用できます。
このサイトには、遺伝子発現やその他の表現型の変異のシンプルなグラフ表示、形質ペアの散布図(ピアソン法または順位順)、単純および複雑なネットワークグラフの構築、主成分分析と合成形質の分析、マーカー回帰を用いたQTLマッピング、区間マッピング、エピスタシス相互作用のペアスキャンなど、幅広い機能のためのツールが用意されています。ほとんどの機能は最大100個の形質に対応し、いくつかの機能はトランスクリプトーム全体に対応しています。
データベースはメインの検索ページで閲覧および検索できます。オンラインチュートリアルもご利用いただけます。また、主要データセットはテキストファイル、Excel、またはネットワークグラフの場合はSBML形式でダウンロードできます。2017年現在、GN2はベータ版として利用可能です。
GeneNetworkは、Affero General Public License (AGPLv3)に基づいてリリースされたオープンソースプロジェクトです。コードの大部分はPythonで書かれていますが、C、R、JavaScriptで書かれたモジュールやその他のコードも含まれます。コードは主にPython 2.4です。GN2は主にPython 2.7で書かれており、FlaskフレームワークとJinja 2 HTMLテンプレートを使用していますが、今後数年間でPython 3.Xへの移行が計画されています。GN2は、Rプログラミング言語で書かれた多くの統計手順を呼び出します。2010年の元のソースコードとコンパクトなデータベースは、SourceForgeで入手できます。GN1は2019年までGitHubで積極的にメンテナンスされていましたが、2020年現在、すべての作業はGN2に集中しています。
{{cite book}}:|journal=無視されました (ヘルプ)その他のシステム遺伝学およびネットワークデータベース