遺伝子疾患データベース

RGD
コンテンツ
説明	ラットゲノムデータベース
生物	ドブネズミ（ネズミ）
接触
研究センター	ウィスコンシン医科大学
研究室	ヒト分子遺伝学センター
著者	メアリー・E・シモヤマ博士、ハワード・J・ジェイコブ博士
主な引用	PMID 25355511
アクセス
Webサイト	rgd .mcw .edu
ダウンロードURL	RGDデータリリース

ユニプロット
コンテンツ
説明	UniProt は、Swiss-Prot、TrEMBL、および PIR-PSDデータベースを組み合わせて作成されたタンパク質データの中央リポジトリであるユニバーサルタンパク質リソースです。
キャプチャされたデータの種類	タンパク質アノテーション
生物	全て
接触
研究センター	EMBL-EBI、英国; SIB、スイス; PIR、米国。
主な引用	ユニバーサルプロテインリソースにおける進行中および将来の開発
アクセス
データ形式	カスタムフラットファイル、FASTA、GFF、RDF、XML。
Webサイト	www .uniprot .org www .uniprot .org /ニュース/
ダウンロードURL	www .uniprot .org /downloads & 完全なデータセットのダウンロードについてはftp .uniprot .orgをご覧ください。
ウェブサービスURL	はい – JAVA API についてはここを参照、REST についてはここを参照
ツール
ウェブ	高度な検索、BLAST、Clustal O、一括検索/ダウンロード、IDマッピング
その他
ライセンス	クリエイティブ・コモンズ表示 - 改変禁止
バージョン管理	はい
データ公開頻度	4週間
キュレーションポリシー	はい。手動と自動の両方に対応しています。自動アノテーションのルールは、データベース管理者と計算アルゴリズムによって生成されます。
ブックマーク可能なエンティティ	はい – 個々のタンパク質のエントリと検索の両方

遺伝子疾患データベース
分類	バイオインフォマティクス
サブ分類	データベース
データベースの種類	生物学的
データベースのサブタイプ	遺伝子疾患

バイオインフォマティクスにおいて、遺伝子疾患データベースとは、表現型と遺伝子型の関係と遺伝子疾患のメカニズムとの間の複合的な相互作用を理解することにより、複雑な疾患の根底にあるメカニズムを解明するために、現実の側面をモデル化するように典型的に構造化された体系的なデータの集合である。 ^{[ 1 ]}遺伝子疾患データベースは、メンデル遺伝性疾患、複合疾患、環境性疾患など、専門家がキュレーションした様々なデータベースやテキストマイニングから得られた関連性からヒト遺伝子と疾患の関連性を統合する。^{[ 2 ]}^{[ 3 ]}

導入

生物学およびバイオインフォマティクスの様々な分野の専門家は、長年にわたり、疾患の分子メカニズムを理解し、予防・治療戦略を策定しようと努めてきました。一部の疾患においては、疾患関連遺伝子のインデックスを取得するだけでは不十分であり、細胞内の分子グリッドの破壊がどのように疾患表現型を引き起こすのかを解明することが、適切なレベルの研究であることが明らかになっています。^{[ 4 ]}さらに、かつてないほど豊富な情報が存在するにもかかわらず、そのようなカタログを入手することは極めて困難です。

遺伝一般的に、遺伝性疾患は遺伝子または染色体の異常によって引き起こされます。多くの遺伝性疾患は出生前から発症します。遺伝性疾患は、私たちの社会におけるヘルスケアの問題のかなりの部分を占めています。これらの疾患に対する理解の進歩により、遺伝性疾患に罹患している多くの人々の寿命と生活の質はともに向上しました。バイオインフォマティクスと実験室遺伝学の最近の発展により、特定の奇形および精神遅滞症候群をより詳細に描写できるようになり、その遺伝様式を理解できるようになりました。この情報により、遺伝カウンセラーは多数の遺伝性疾患の発生リスクを予測できます。^{[ 2 ]}ただし、ほとんどの遺伝カウンセリングは、少なくとも1人の罹患した個人の出生により、家族が遺伝性疾患のある子供を持つ傾向があることに気付いた後にのみ行われます。単一の遺伝子と疾患の関連はまれであり、遺伝性疾患は伝染性疾患である場合もそうでない場合もあります。^{[ 5 ]}遺伝性疾患の中には、親の遺伝子から受け継がれるものもありますが、DNAの新たな突然変異や変化によって引き起こされるものもあります。また、例えばある種の癌や悪性黒色腫といった同じ疾患でも、ある人では近親交配によって、またある人では新たな変化によって、さらにある人では非遺伝的原因によって発生することがあります。^[⁶^]

単一遺伝子疾患（モノジェニック）は6,000種類以上知られており、出生数200人中約1人の割合で発症します。^{[ 1 ]}名称が示すように、これらの疾患は1つの遺伝子の変異によって引き起こされます。一方、多遺伝子疾患は複数の遺伝子によって引き起こされ、通常は環境要因と組み合わさって発症します。^{[ 7 ]}遺伝子表現型の例としては、アルツハイマー病、乳がん、白血病、ダウン症候群、心臓欠陥、難聴などが挙げられます。そのため、遺伝子に関連するすべての疾患を分類するためのカタログ化が必要です。

創造における課題

遺伝子の優先順位付け — **ヒト疾患における遺伝子優先順位付けワークフロー**：典型的なリストは、連鎖領域、染色体異常、関連研究遺伝子座、発現差のある遺伝子リスト、またはシーケンシングバリアントによって同定された遺伝子から得られます。あるいは、ゲノム全体を優先順位付けすることも可能ですが、その場合、偽陽性が大幅に増加すると予想されます。

遺伝子疾患プロジェクトの様々な段階において、分子生物学者は、綿密な統計データ分析を行った後でも、どの遺伝子またはタンパク質をさらに実験的に調査し、どの遺伝子またはタンパク質を除外するかを選択する必要があります。発現データ、配列情報、機能アノテーション、生物医学文献など、複雑で異質なデータセットを統合する計算手法を用いることで、より多くの情報に基づいて将来の研究対象となる遺伝子の優先順位付けが可能になります。このような手法は、下流研究の成果を大幅に向上させる可能性があり、研究者にとって非常に貴重なものになりつつあります。そのため、生物学および生物医学研究における主要な関心事の一つは、この複雑な遺伝子表現型の背後にある根本的なメカニズムを理解することです。疾患に関連する遺伝子の発見には、多大な努力が費やされてきました^{[ 8 ]。}

しかし、ヒト疾患のほとんどは単一の遺伝子に起因するものではなく、複数の遺伝子変異と環境リスク要因の複雑な相互作用によって発生することを示唆する証拠が増えています。遺伝子と疾患の関連性を保存するデータベースとして、比較毒性ゲノミクスデータベース（CTD）、ヒトにおけるオンラインメンデル遺伝学（OMIM）、遺伝学的関連データベース（GAD）、疾患遺伝学的関連データベース（DisGeNET）などが開発されています。これらのデータベースはそれぞれ、表現型と遺伝子型の関係の異なる側面に焦点を当てており、データベースキュレーションプロセスの性質上、完全なものではありませんが、ある意味では互いに完全に補完し合っています。^{[ 9 ]}

データベースの種類

基本的に、データベースには、キュレーションデータベース、予測データベース、文献データベース、統合データベースの4つの種類があります^{[ 1 ]}

キュレーションされたデータベース

キュレーションデータとは、構造化データ、科学的最新情報、キュレーションされた知識といった最も洗練された計算形式を含む可能性のある情報を指し、そのような活動に従事する資格を有するとみなされる1人以上の専門家の規制の下で構成・準備されたものです^{[ 10 ]。}これは、結果として得られるデータベースが高品質であることを意味します。これとは対照的に、何らかの自動化されたプロセスによって収集されたデータや、特に品質が低い、あるいは専門家の手が及ばない、裏付けのないデータを使用して収集されたデータは、信頼できない可能性があります^{[ 10 ]} 。最も一般的な例としては、CTDやUNIPROTなどが挙げられます。

比較毒性ゲノミクスデータベース（CTD）

比較毒性ゲノミクスデータベース（CTD）は、遺伝子やタンパク質との生化学的相互作用、疾患と化学物質、疾患と遺伝子やタンパク質との関連性を記述するために、厳選された科学文献のデータを統合することで、環境化合物が人間の健康に及ぼす影響を理解するのに役立ちます。^{[ 11 ]} CTDには、種を超えた化学物質と遺伝子/タンパク質の相互作用、化学物質と遺伝子、および疾患と環境の影響を受ける疾患の根底にある分子メカニズムを明らかにするための、化学物質と遺伝子/タンパク質の相互作用と化学物質と遺伝子の関連性を定義する厳選されたデータが含まれています。これらのデータは、複雑な化学物質と遺伝子、タンパク質の相互作用ネットワークに関する洞察を提供します。このデータベースの主な情報源の一つは、OMIMからの厳選された情報です。^{[ 11 ]}

CTD は、バイオインフォマティクスの専門家が科学文献を読み、次の 4 種類のコアデータを手動でキュレートする独自のリソースです。

化学物質と遺伝子の相互作用
化学物質と病気の関連性
遺伝子と疾患の関連
化学物質と表現型の関連

ユニバーサルタンパク質リソース（UNIPROT）

ユニバーサル・プロテイン・リソース（UniProt）は、タンパク質配列とアノテーションデータの包括的なリソースです。タンパク質配列と機能に関する情報を包括的かつ最高レベルで自由にアクセスできるデータベースであり、ゲノム配列解読プロジェクトから得られた多くのエントリを収録しています。研究文献から得られたタンパク質の生物学的機能に関する膨大な情報が含まれており、遺伝子とタンパク質と疾患の直接的な関連性を示唆する可能性があります。^{[ 12 ]}

**データベースの編集とキュレーションのプロセス**キュレーションされたデータは、実践的な経験と文献レビューからデータベースのウェブ公開までのプロセスで構成される場合がある^{[ 14 ]}

予測データベース

予測データベースは統計的推論に基づくデータベースです。このような推論の特定のアプローチは予測推論として知られていますが、予測は統計的推論のいくつかのアプローチのいずれかで行うことができます。実際、生物統計学の1つの説明は、遺伝子集団のサンプルに関する知識を集団全体（ゲノミクス）や他の関連遺伝子またはゲノムに転送する手段を提供するというものです。これは必ずしも時間の経過に伴う予測と同じではありません。^{[ 15 ]}情報が時間を超えて、多くの場合特定の時点に転送される場合、そのプロセスは予測として知られています。このカテゴリで考えられるデータベースの主な例としては、マウスゲノムデータベース（MGD）、ラットゲノムデータベース（RGD）、OMIM、EnsemblのSIFTツールの3つが挙げられます。^{[ 1 ]}

マウスゲノムデータベース（MGD）

マウスゲノムデータベース（MGD）は、実験用マウスに関する遺伝学的、ゲノム学的、生物学的データを統合した国際的なコミュニティリソースです。MGDは、哺乳類表現型オントロジーの用語とOMIMの疾患名を用いて、マウスモデル（遺伝子型）の表現型とヒト疾患との関連性に関する完全な注釈を提供します。^{[ 16 ]}

ラットゲノムデータベース（RGD）

ラットゲノムデータベース（RGD）は、ラットの遺伝学およびゲノム研究に携わる主要な研究機関の共同研究として始まりました。ラットは、疾患の生物学および病態生理学を研究するためのモデル生物として、研究者によって広く利用され続けています。過去数年間、ラットの遺伝学およびゲノムデータは急速に増加しています。^{[ 17 ]}この情報の爆発的な増加により、ラットを中心とした視点でこれらのデータを効率的かつ効果的に収集、管理し、世界中の研究者に配信するための集中型データベースの必要性が浮き彫りになりました。ラットゲノムデータベースは、ラットの遺伝学およびゲノムデータ、ならびにマッピング、系統、および生理学的情報のリポジトリとして機能するために作成されました。また、このデータを検索、マイニング、および予測するためのツールを提供することで、研究者の研究活動を促進します。^{[ 17 ]}

RGDには、疾患遺伝子を研究する研究者にとって有用なデータとして、ラット、マウス、ヒトの遺伝子に関する疾患アノテーションが含まれています。アノテーションは文献から手動でキュレーションされるか、他の疾患関連データベースから自動パイプラインを介してダウンロードされます。ダウンロードされたアノテーションは、データセット全体の一貫性を保つため、手動アノテーションに使用されたのと同じ疾患語彙にマッピングされます。RGDはまた、ラットの疾患関連の定量的表現型データ（PhenoMiner）も管理しています。^{[ 18 ]}

オンラインメンデル遺伝学（OMIM）

ヒトにおけるオンラインメンデル遺伝
コンテンツ
説明	OMIM は、ヒトの遺伝子と遺伝子表現型の概要です。
生物	ヒト（ホモ・サピエンス）
接触
研究センター	NCBI
主な引用	PMID 25398906
アクセス
Webサイト	www .ncbi .nlm .nih .gov /omim

NCBIの支援を受けているOMIM（Online Mendelian Inheritance in Man）は、遺伝的要素を持つ既知の疾患をすべてカタログ化し、ヒトゲノム中の関連遺伝子との関係を予測するデータベースです。また、さらなる研究のための参考資料や、カタログ化された遺伝子のゲノム解析のためのツールも提供しています。^{[ 19 ]} OMIMは、ヒト遺伝子と遺伝子表現型に関する包括的かつ権威ある概要であり、無料で利用可能で、毎日更新されています。このデータベースは、遺伝性疾患に関する関連情報を予測するためのリソースとして利用されてきました。^{[ 19 ]}

経路の均一性 — **パスウェイの均一性 vs. 関連遺伝子**疾患は多様な遺伝子と大きな関連性を持つという概念を示すため、疾患ごとの関連遺伝子産物の数で分類した4つのネットワークについて、単一疾患とランダム対照群のパスウェイの均一性の平均値をプロットしました。このグラフは、多数の疾患と4つの異なるデータベースの一致率を相関させることがいかに難しいかを示しています。そのため、遺伝子疾患データベースはこれらの関係性を検証しています。

Ensembl SIFTツール

Ensembl ゲノムデータベースプロジェクト。
コンテンツ

説明	アンサンブル
接触
研究センター	ウェルカムトラスト・サンガー研究所欧州バイオインフォマティクス研究所
主な引用	ハバードら（2002）^{[ 20 ]}
アクセス
Webサイト	www.ensembl.org

これはすべてのゲノムおよび遺伝子研究に利用できる最大級のリソースの 1 つであり、遺伝学者、分子生物学者、および人間自身の種や他の脊椎動物、モデル疾患生物のゲノムを研究している他の研究者に対して集中的なリソースを提供します。Ensemblは、ゲノム疾患情報の検索のためのよく知られたゲノムブラウザーの 1 つです。Ensembl はさまざまな異なるソースから変異データをインポートし、バリアントの影響を予測します。^{[ 21 ]}参照ゲノムにマップされた各変異について、その変異と重複する各 Ensembl トランスクリプトが識別されます。次に、ルールベースのアプローチを使用して、変異の各対立遺伝子がトランスクリプトに与える影響を予測します。シーケンスオントロジー (SO) によって定義された結果用語のセットは、現在、対立遺伝子とトランスクリプトの各組み合わせに割り当てることができます。各変異の各対立遺伝子は、異なるトランスクリプトで異なる影響を与える可能性があります。 Ensemblデータベースでは、ヒト変異の予測に様々なツールが用いられていますが、最も広く用いられているツールの一つがSIFTです。SIFTは、アミノ酸置換がタンパク質機能に影響を与えるかどうかを、置換アミノ酸間の配列相同性と物理化学的類似性に基づいて予測します。各アミノ酸置換について提供されるデータは、スコアと定性予測（「許容される」または「有害」）です。スコアは、アミノ酸の変化が許容される正規化された確率であり、スコアが0に近いほど有害である可能性が高いです。定性予測はこのスコアから導き出され、スコアが0.05未満の置換は「有害」、それ以外の置換は「許容される」とされます。SIFTは、自然発生的な非同義多型や実験室で誘発されたミスセンス変異に適用でき、表現型特性、プロテオミクス、ゲノミクスにおける関係構築につながります。^{[ 21 ]}

文献データベース

この種のデータベースは、遺伝子疾患データベースに関する書籍、記事、書評、論文、注釈を要約したものです。GAD、LGDHN、BeFree Dataなどがこのタイプのデータベースの例です。

遺伝子関連データベース（GAD）

遺伝子関連データベース（GAD）は、複雑な疾患に関するヒトの遺伝学的関連研究のアーカイブです。GADは、OMIMに見られるような稀なメンデル遺伝性疾患ではなく、一般的な複雑なヒト疾患に関する情報のアーカイブ化に主に焦点を当てています。GADには、候補遺伝子およびゲノムワイド関連研究（GWAS）に関する査読付きジャーナルに掲載された論文から抽出された、精選された要約データが含まれています。^{[ 22 ]} GADは2014年9月1日をもって凍結されましたが、現在もダウンロード可能です。^{[ 23 ]}

文献由来ヒト遺伝子疾患ネットワーク（LHGDN）

文献由来ヒト遺伝子疾患ネットワーク（LHGDN）は、テキストマイニングから得られたデータベースであり、複数の生体分子状態における遺伝子と疾患の関連性を抽出・分類することに重点を置いています。機械学習ベースのアルゴリズムを用いて、対象となるテキストソースから意味的な遺伝子と疾患の関係を抽出します。これは、ドイツ・ミュンヘンのLMU（Lucent University of the University of Munchen）のLinked Life Dataの一部です。^{[ 1 ]}

BeFreeデータ

BeFreeシステムを用いてMEDLINE抄録から遺伝子と疾患の関連性を抽出します。BeFreeは、疾患と遺伝子を検出するための生物医学的固有表現認識（BioNER）モジュールと、形態統語論的情報に基づく関係抽出モジュールで構成されています。^{[ 24 ]}

統合データベース

この種のデータベースは、メンデル遺伝病、複合疾患、環境疾患を統合された遺伝子-疾患関連アーカイブに収録しており、モジュール性の概念がこれらすべてに当てはまることを示しています。これらのデータベースは、遺伝子-疾患関連を個別に検討しただけでは発見できない可能性のある、重要な新たな生物学的知見が得られた場合に、疾患の機能解析を提供します。したがって、これらのデータベースは、遺伝的要因と環境要因（薬物など）が疾患にどのように寄与するかを研究するための適切な枠組みを提供します。この種のデータベースの最良の例は、DisGeNETです。^{[ 8 ]}^{[ 25 ]}

遺伝子疾患関連データベース DisGeNET

ディスジェネット
コンテンツ
説明	ヒト遺伝子と疾患の関連性を統合
キャプチャされたデータの種類	協会データベース
生物	ヒト（ホモ・サピエンス）
接触
研究センター	バイオメディカルインフォマティクス研究プログラム（GRIB）IMIM-UPF
研究室	統合バイオメディカル情報学グループ
著者	フェラン・サンツとローラ・I・ファーロング (ピネロ他、2015)
主な引用	PMID 25877637
アクセス
Webサイト	www.disgenet.org
その他
データ公開頻度	年間
バージョン	3

DisGeNETは、疾患の様々な生物医学的側面を網羅する複数の情報源からの関連性を統合した包括的な遺伝子-疾患関連データベースである。^{[ 25 ]}特に、メンデル性疾患、複合性疾患、環境性疾患を含むヒトの遺伝性疾患に関する現在の知識に焦点を当てている。ヒト疾患のモジュール性の概念を評価するために、このデータベースは、ネットワークトポロジーと機能アノテーション解析を用いて、ヒトの遺伝子-疾患ネットワークの出現特性の体系的な研究を行っている。^{[ 1 ]}結果は、ヒト疾患の遺伝的起源が高度に共通していることを示しており、メンデル性疾患、複合性疾患、環境性疾患を含むほとんどの疾患に機能モジュールが存在することを示している。さらに、生物学的経路のコアセットがほとんどのヒト疾患と関連していることが判明している。疾患クラスターの研究で同様の結果が得られたことから、このデータベースの知見は、関連疾患が細胞内の共通の生物学的プロセスの機能不全により発生する可能性があることを示唆している。この統合データベースのネットワーク解析は、ヒト疾患の遺伝的ランドスケープの包括的なビューを取得するにはデータ統合が必要であり、複合性疾患の遺伝的起源は予想よりもはるかに一般的であることを指摘している。^{[ 1 ]}

**DisGeNET 遺伝子-疾患関連オントロジー**このオントロジーの各関連タイプの説明は次のとおりです: #治療関連: 遺伝子/タンパク質は、疾患の改善に治療的役割を果たします。 #バイオマーカー関連: 遺伝子/タンパク質は、疾患の病因に役割を果たしている (たとえば、疾患につながる分子メカニズムに関与している) か、疾患のバイオマーカーです。 #遺伝子変異関連: 配列変異 (突然変異、SNP) が疾患表現型に関連付けられているが、その変異が疾患を引き起こすという証拠がまだない場合に使用されます。場合によっては、変異体の存在により疾患に対する感受性が高まります。一般的に、NCBI SNP 識別子が提供されます。 #発現変化関連: 遺伝子の発現変化によるタンパク質機能の変化が、疾患表現型に関連付けられます。 #翻訳後修飾の関連性：翻訳後修飾（タンパク質のメチル化またはリン酸化）によるタンパク質機能の変化は、疾患の表現型と関連している。^{[ 1 ]}

いくつかの使用例

遺伝子疾患データベースを使用した最も興味深い事例のいくつかは、以下の論文で見ることができます。^{[ 1 ]}^{[ 8 ]}

サンティアゴ, ホセ A.;ポタシュキン, ジュディス A. (2014). 「神経変性疾患における臨床介入へのネットワークアプローチ」. Trends in Molecular Medicine . 20 (12): 694– 703. doi : 10.1016/j.molmed.2014.10.002 . PMID 25455073 .
カイコネン、ミンナ U.ニスカネン、アンリ。ロマノスキー、ケイシー E.カンサネン、エミリア。キベラ、アヌッカ M.ライタライネン、ヤルッコ。ハインツ、スヴェン。ベナー、クリストファー。グラス、クリストファー K.イラ・ヘルトゥアラ、セッポ (2014)。「一時停止とゲノム区画化による VEGF-A 転写プログラムの制御」。核酸研究。42 (20): 12570–12584。土井: 10.1093/nar/gku1036。PMC 4227755。PMID 25352550。
グロディディエ、ソレーヌ。フェレール、アントニ。ファナー、ローザ。ピニェロ、ジャネット。ロカ、ジョセップ。コシオ、ボルハ。アグスティ、アルヴァル。ギア、ホアキン。サンツ、フェラン。ファーロング、ローラ I. (2014)。「COPD 複合疾患のネットワーク医学分析」。呼吸器研究。15 (1): 111.土井: 10.1186/s12931-014-0111-4。PMC 4177421。PMID 25248857。
クリスティアーノ、フランチェスカ、ヴェルトリ、ピエランジェロ (2014). 「miRNAデータ解析と臨床オントロジーとの相関のためのRベースツール」第5回ACMバイオインフォマティクス、計算生物学、健康情報科学会議（BCB '14）の議事録。pp. 768– 773. doi : 10.1145/2649387.2660847 . ISBN 978-1-4503-2894-4. S2CID 17123912 .
ギャラガー、スザンヌ・レニック、ドンブロワー、デブラ・S・ゴールドバーグ (2014). 「2ノードハイパーグラフクラスタリング係数を用いた疾患遺伝子ネットワークの解析」第5回ACMバイオインフォマティクス、計算生物学、健康情報科学会議（BCB '14）の議事録。pp. 647– 648. doi : 10.1145/2649387.2660817 . ISBN 978-1-4503-2894-4. S2CID 30593231 .
Mannil, Deepthi; Vogt, Ingo; Prinz, Jeanette; Campillos, Monica (2015). 「器官系異質性DB：器官系レベルでの表現型可視化のためのデータベース」 . Nucleic Acids Research . 43 (データベース号): D900– D906. doi : 10.1093/nar/ gku948 . PMC 4384019. PMID 25313158 .
Vogt, Ingo; Prinz, Jeanette; Campillos, Mónica (2014). 「分子的および臨床的に関連する薬剤と疾患は、表現型的に類似した薬剤-疾患ペアに富んでいる」 . Genome Medicine . 6 (7): 52. doi : 10.1186/s13073-014-0052-z . PMC 4165361. PMID 25276232 .
サンティアゴ, ホセ A.; ポタシュキン, ジュディス A. (2014). 「パーキンソン病と糖尿病における分子レベルの関連性を解明するためのシステムベースアプローチ」. Neurobiology of Disease . 72 : 84–91 . doi : 10.1016 / j.nbd.2014.03.019 . PMID 24718034. S2CID 41944859 .
Lee, In-Hee; Lee, Kyungjoon; Hsing, Michael; Choe, Yongjoon; Park, Jin-Ho; Kim, Shu Hee; Bohn, Justin M.; Neu, Matthew B.; Hwang, Kyu-Baek; Green, Robert C.; Kohane, Isaac S.; Kong, Sek Won (2014). 「インタラクティブな全ゲノム解析パイプラインを用いた疾患関連バリアント、遺伝子、およびパスウェイの優先順位付け」 . Human Mutation . 35 (5): 537– 547. doi : 10.1002/humu.22520 . PMC 4130156. PMID 24478219 .
Liu, Ming-Xi; Chen, Xing; Chen, Geng; Cui, Qing-Hua; Yan, Gui-Ying (2014). 「ヒト疾患関連長鎖非コードRNAを推定するための計算フレームワーク」 . PLOS ONE . 9 (1) e84408. Bibcode : 2014PLoSO...984408L . doi : 10.1371/journal.pone.0084408 . PMC 3879311. PMID 24392133 .
Zhao, Yilei; Wang, Chen; Wu, Jianwei; Wang, Yan; Zhu, Wenliang; Zhang, Yong; Du, Zhimin (2013). 「コリンは後負荷増加による心肥大を抑制する」 . International Journal of Biological Sciences . 9 (3): 295– 302. doi : 10.7150/ijbs.5976 . PMC 3596715. PMID 23493786 .
Koczor, Christopher A.; Lee, Eva K.; Torres, Rebecca A.; Boyd, Amy; Vega, J. David; Uppal, Karan; Yuan, Fan; Fields, Earl J.; Samarel, Allen M.; Lewis, William (2013). 「計算解析を用いた心不全および非心不全ヒト左室心筋におけるメチル化遺伝子プロモーターの検出」 .生理学的ゲノミクス. 45 (14): 597– 605. doi : 10.1152/physiolgenomics.00013.2013 . PMC 3727018. PMID 23695888 .
グー、イン。劉光輝。プロントンクム、ノンルク。ベナー、クリストファー。イー、フェイ。クー、ジン。鈴木圭一郎；ヤン、ジピン。チャン・ウェイチー。リー、モー。モントセラト、ヌリア;クレスポ、アイザック。デル・ソル、アントニオ。エステバン、コンセプシオン・ロドリゲス。張君。イズピスア・ベルモンテ、フアン・カルロス（2014）。「ヒトESC由来心筋細胞のグローバルDNAメチル化および転写分析」。タンパク質と細胞。5 (1): 59–68 .土井: 10.1007/s13238-013-0016-x。PMC 3938846。PMID 24474197。
Galhardo, Mafalda; Sinkkonen, Lasse; Berninger, Philipp; Lin, Jake; Sauter, Thomas; Heinäniemi, Merja (2014). 「転写産物レベルの代謝制御の統合解析により、ヒト代謝ネットワークにおける疾患関連ノードが明らかになる」 . Nucleic Acids Research . 42 (3): 1474– 1496. doi : 10.1093/nar/gkt989 . PMC 3919568. PMID 24198249 .
ティエリ、パオロ。テルマニニ、アルベルト。ベラヴィスタ、エレナ。サルヴィオーリ、ステファノ。カプリ島、ミリアム。フランチェスキ、クラウディオ (2012)。「NF-κB 経路インターアクトームマップの作成」。プロスワン。7 (3) e32678。Bibcode : 2012PLoSO...732678T。土井：10.1371/journal.pone.0032678。PMC 3293857。PMID 22403694。

遺伝子疾患データベースの将来に関する考察

ヒトゲノムの完成は、疾患遺伝子の探索方法を変えました。以前は、一度に1つまたは少数の遺伝子に焦点を当てるアプローチでした。現在では、DisGeNETのようなプロジェクトは、単一または複数の疾患に関与するすべての遺伝子変異を体系的に解析する取り組みの好例です。^{[ 26 ]}次のステップは、疾患のメカニズムの側面を完全に理解し、それらに対する薬を設計することです。そのためには、体系的な探索と各遺伝子の詳細な研究という2つのアプローチを組み合わせる必要があります。この分野の将来は、さまざまなソースからの大規模なデータを統合し、バイオインフォマティクス研究によって生成される大規模データの解析に機能情報を組み込むための新しい技術によって定義されるでしょう。^{[ 1 ]}

バイオインフォマティクスとは、コンピュータプログラミングを方法論の一部として用いる生物学的遺伝子疾患研究の総体を指す用語であると同時に、特に遺伝学やゲノミクスの分野で繰り返し用いられる特定の解析パイプラインを指す用語でもある。^{[ 1 ]}バイオインフォマティクスの一般的な用途には、候補遺伝子やヌクレオチド、 SNPの同定が含まれる。多くの場合、このような同定は、疾患の遺伝的基盤、固有の適応、望ましい特性、あるいは集団間の違いをより深く理解することを目的として行われる。より形式的でない方法では、バイオインフォマティクスは核酸やタンパク質配列内の組織原理の理解も試みる。^{[ 1 ]}

バイオインフォマティクスが新たな実験技術に対応することは、遺伝子疾患データベースやその他の技術からの情報解析の進歩によって実証されているように、実験データの解析に新たな視点をもたらします。この傾向は、次世代シーケンシング技術などの新技術に対応するための斬新なアプローチによって継続すると予想されます。例えば、多数のヒトゲノムが利用可能になることで、希少変異体の計算解析の発展が促進され、ライフスタイル、薬物相互作用、その他の要因との関係を統計的にマイニングすることが可能になります。^{[ 1 ]} バイオメディカル研究は、既存の大量のバイオメディカルデータおよび継続的に生成されるバイオメディカルデータを効率的にマイニングする能力によっても推進されます。特にテキストマイニング技術は、他の分子データと組み合わせることで、遺伝子変異や相互作用に関する情報を提供することができ、バイオメディカル研究で生成されるデータの指数関数的な増加に先んじるために不可欠となるでしょう。分子、臨床、薬物分析のマイニングと統合の進歩から恩恵を受けているもう一つの分野は、薬理ゲノミクスです。人間の変異と疾患への影響との関係をコンピューターで研究することは、個別化医療の発展の鍵となるでしょう。 ^{[ 8 ]} 要約すると、遺伝子疾患データベースはすでに疾患遺伝子の探索に革命をもたらしており、他の医学研究分野でも重要な要素となる可能性があります。^{[ 1 ]}

参照

参考文献

^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l ^m ⁿ A. Bauer-Mehren、「遺伝子-疾患ネットワーク解析によりメンデル遺伝性疾患、複雑性疾患、環境性疾患の機能モジュールが明らかに」、PLOS One、pp. 1-3、2011年。
^ ^a ^b Botstein, D (2003). 「ヒト表現型の根底にある遺伝子型の発見：メンデル遺伝病における過去の成功と複雑な疾患への将来のアプローチ」Nature Genetics . 33 (1): 228– 237. doi : 10.1038/ng1090 . PMID 12610532 . S2CID 10599219 .
^ Wren JD, Bateman A (2008). 「データベース、データの墓、そして風に舞う塵」 .バイオインフォマティクス. 24 (19): 2127–8 . doi : 10.1093/bioinformatics/btn464 . PMID 18819940 .
^ 「米国医療情報学会戦略計画」米国医療情報学会。 2009年10月26日時点のオリジナルよりアーカイブ。
^ Oti, M (2007). 「遺伝性疾患のモジュール性」 .臨床遺伝学. 71 (1): 1– 11. doi : 10.1111/j.1399-0004.2006.00708.x . PMID 17204041. S2CID 24615025 .
^ Davis, A.; King, B. (2011). 「比較毒性ゲノミクスデータベース：2011年版更新」 . Nucleic Acids Res . 39 (1): 1067–1072 . doi : 10.1093 / nar/gkq813 . PMC 3013756. PMID 20864448 .
^ Davis, A.; Wiegers, T. (2013). 「比較毒性ゲノミクスデータベースにおける化学物質・遺伝子・疾患のキュレーション改善のための文献のテキストマイニングによる効果的なスコアリングとランク付け」 . PLOS ONE . 8 ( 4): 1– 29. Bibcode : 2013PLoSO...858201D . doi : 10.1371/journal.pone.0058201 . PMC 3629079. PMID 23613709 .
^ ^a ^b ^c ^d Bauer-Mehren, A.; Rautscha, M. (2010). 「DisGeNET: 遺伝子–疾患ネットワークを視覚化、統合、検索、解析するためのCytoscapeプラグイン」 .バイオインフォマティクス. 26 (22): 2924– 2926. doi : 10.1093/bioinformatics/btq538 . PMID 20861032 .
^ Vogt, I. (2014). 「哺乳類の摂動における臓器系表現型に影響を与える遺伝子特性の体系的解析」 .バイオインフォマティクス. 30 (21): 3093– 3100. doi : 10.1093/bioinformatics/btu487 . PMC 4609011. PMID 25061072 .
^ ^a ^b Buneman, P. (2008). 「キュレーションデータベース」.ビブリオメトリクス. 978 (1): 152– 162.
^ ^a ^b Murphy, C.; Davis, A. (2009). 「比較毒性ゲノミクスデータベース：化学物質・遺伝子・疾患ネットワークのための知識ベースおよび発見ツール」 .バイオインフォマティクス. 37 (1): 786– 792. doi : 10.1093/nar/gkn580 . PMC 2686584. PMID 18782832 .
^ Uniprot, Consortium (2008). 「ユニバーサルタンパク質リソース（UniProt）」 . Nucleic Acids Research . 36 (1): 190– 195. doi : 10.1093 / nar/gkm895 . PMC 1669721. PMID 18045787 .
^ Uniprot, C. (2010). 「Universal Protein Resourceにおける進行中および将来の開発」 . Nucleic Acids Research . 39 (データベース号): D214– D219. doi : 10.1093/nar/ gkq1020 . PMC 3013648. PMID 21051339 .
^ K. Brown、「オンライン予測人間相互作用データベース」、バイオインフォマティクス、第21巻、第9号、pp.2076-2082、2005年。
^ S. HunterとP. Jones、「2011年のInterPro：ファミリーとドメイン予測データベースの新たな展開」、 Nucleic Acids Research、第10巻、第1号、12-22ページ、2011年
^ C. BultとJ. Eppig、「マウスゲノムデータベース（MGD）：マウス生物学とモデルシステム」、 Nucleic Acids Research、第36巻、第1号、724-728頁、2007年
^ ^a ^b M. Dwinell、E. Worthey、S. M、「ラットゲノムデータベース2009：変異、オントロジー、経路」、Nucleic Acids Research、第37巻、第1号、744-749ページ、2009年
^ Shimoyama M, De Pons J, Hayman GT, et al. (2015). 「ラットゲノムデータベース2015：ゲノム変異、表現型変異、環境変異と疾患」 . Nucleic Acids Research . 43 (データベース号): D743–50. doi : 10.1093/nar/gku1026 . PMC 4383884. PMID 25355511 .
^ ^a ^b A. Homosh、「Online Mendelian Inheritance in Man (OMIM)、ヒト遺伝子と遺伝性疾患の知識ベース」、Nucleic Acids Research、第33巻、第1号、pp. 514-517、2005年
^ Hubbard T , et al. (2002年1月). 「Ensemblゲノムデータベースプロジェクト」 . Nucleic Acids Research . 30 (1): 38– 41. doi : 10.1093/nar/30.1.38 . PMC 99161. PMID 11752248 .
^ ^a ^b P. FlicekとM. Ridwan、「Ensembl 2012」、Nucleic Acids Research、第40巻、第1号、pp. 84-90、2012年
^ Becker, K.; Barnes, K. (2004). 「遺伝学的関連データベース」 . Nature Genetics . 36 (5): 431– 432. doi : 10.1038/ng0504-431 . PMID 15118671 .
^ “アーカイブコピー” . 2021年2月24日時点のオリジナルよりアーカイブ。2016年11月18日閲覧。{{cite web}}: CS1 maint: アーカイブされたコピーをタイトルとして (リンク)
^ Bravo, A; et al. (2014). 「テキストおよび大規模データ分析からの遺伝子と疾患の関係性の抽出：トランスレーショナルリサーチへの示唆」 . BMC Bioinformatics . 16 (1) 55. doi : 10.1186/s12859-015-0472-9 . PMC 4466840. PMID 25886734 .
^ ^a ^b Piñero; et al. (2015). 「DisGeNET：ヒト疾患とその遺伝子の動的探索のための発見プラットフォーム」 .データベース. 2015 bav028. doi : 10.1093/database/bav028 . PMC 4397996. PMID 25877637 .
^ Oti, M (2006). 「タンパク質間相互作用を用いた疾患遺伝子の予測」 . J. Med. Genet . 43 (8): 691– 698. doi : 10.1136/jmg.2006.041376 . PMC 2564594. PMID 16611749 .

[A._Bauer1-1] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l ^m ⁿ A. Bauer-Mehren、「遺伝子-疾患ネットワーク解析によりメンデル遺伝性疾患、複雑性疾患、環境性疾患の機能モジュールが明らかに」、PLOS One、pp. 1-3、2011年。

[Botstein2-2] Botstein, D (2003). 「ヒト表現型の根底にある遺伝子型の発見：メンデル遺伝病における過去の成功と複雑な疾患への将来のアプローチ」Nature Genetics . 33 (1): 228– 237. doi : 10.1038/ng1090 . PMID 12610532 . S2CID 10599219 .

[pmid18819940-3] Wren JD, Bateman A (2008). 「データベース、データの墓、そして風に舞う塵」 .バイオインフォマティクス. 24 (19): 2127–8 . doi : 10.1093/bioinformatics/btn464 . PMID 18819940 .

[3_American-4] 「米国医療情報学会戦略計画」米国医療情報学会。 2009年10月26日時点のオリジナルよりアーカイブ。

[5] Oti, M (2007). 「遺伝性疾患のモジュール性」 .臨床遺伝学. 71 (1): 1– 11. doi : 10.1111/j.1399-0004.2006.00708.x . PMID 17204041. S2CID 24615025 .

[6] Davis, A.; King, B. (2011). 「比較毒性ゲノミクスデータベース：2011年版更新」 . Nucleic Acids Res . 39 (1): 1067–1072 . doi : 10.1093 / nar/gkq813 . PMC 3013756. PMID 20864448 .

[7] Davis, A.; Wiegers, T. (2013). 「比較毒性ゲノミクスデータベースにおける化学物質・遺伝子・疾患のキュレーション改善のための文献のテキストマイニングによる効果的なスコアリングとランク付け」 . PLOS ONE . 8 ( 4): 1– 29. Bibcode : 2013PLoSO...858201D . doi : 10.1371/journal.pone.0058201 . PMC 3629079. PMID 23613709 .

[A._Bauer2-8] Bauer-Mehren, A.; Rautscha, M. (2010). 「DisGeNET: 遺伝子–疾患ネットワークを視覚化、統合、検索、解析するためのCytoscapeプラグイン」 .バイオインフォマティクス. 26 (22): 2924– 2926. doi : 10.1093/bioinformatics/btq538 . PMID 20861032 .

[9] Vogt, I. (2014). 「哺乳類の摂動における臓器系表現型に影響を与える遺伝子特性の体系的解析」 .バイオインフォマティクス. 30 (21): 3093– 3100. doi : 10.1093/bioinformatics/btu487 . PMC 4609011. PMID 25061072 .

[Buneman-10] Buneman, P. (2008). 「キュレーションデータベース」.ビブリオメトリクス. 978 (1): 152– 162.

[Murphy-11] Murphy, C.; Davis, A. (2009). 「比較毒性ゲノミクスデータベース：化学物質・遺伝子・疾患ネットワークのための知識ベースおよび発見ツール」 .バイオインフォマティクス. 37 (1): 786– 792. doi : 10.1093/nar/gkn580 . PMC 2686584. PMID 18782832 .

[12] Uniprot, Consortium (2008). 「ユニバーサルタンパク質リソース（UniProt）」 . Nucleic Acids Research . 36 (1): 190– 195. doi : 10.1093 / nar/gkm895 . PMC 1669721. PMID 18045787 .

[pmid21051339-13] Uniprot, C. (2010). 「Universal Protein Resourceにおける進行中および将来の開発」 . Nucleic Acids Research . 39 (データベース号): D214– D219. doi : 10.1093/nar/ gkq1020 . PMC 3013648. PMID 21051339 .

[14] K. Brown、「オンライン予測人間相互作用データベース」、バイオインフォマティクス、第21巻、第9号、pp.2076-2082、2005年。

[15] S. HunterとP. Jones、「2011年のInterPro：ファミリーとドメイン予測データベースの新たな展開」、 Nucleic Acids Research、第10巻、第1号、12-22ページ、2011年

[16] C. BultとJ. Eppig、「マウスゲノムデータベース（MGD）：マウス生物学とモデルシステム」、 Nucleic Acids Research、第36巻、第1号、724-728頁、2007年

[Dwinell-17] M. Dwinell、E. Worthey、S. M、「ラットゲノムデータベース2009：変異、オントロジー、経路」、Nucleic Acids Research、第37巻、第1号、744-749ページ、2009年

[pmid25355511-18] Shimoyama M, De Pons J, Hayman GT, et al. (2015). 「ラットゲノムデータベース2015：ゲノム変異、表現型変異、環境変異と疾患」 . Nucleic Acids Research . 43 (データベース号): D743–50. doi : 10.1093/nar/gku1026 . PMC 4383884. PMID 25355511 .

[Homosh-19] A. Homosh、「Online Mendelian Inheritance in Man (OMIM)、ヒト遺伝子と遺伝性疾患の知識ベース」、Nucleic Acids Research、第33巻、第1号、pp. 514-517、2005年

[Hubbard2002-20] Hubbard T , et al. (2002年1月). 「Ensemblゲノムデータベースプロジェクト」 . Nucleic Acids Research . 30 (1): 38– 41. doi : 10.1093/nar/30.1.38 . PMC 99161. PMID 11752248 .

[Flicek-21] P. FlicekとM. Ridwan、「Ensembl 2012」、Nucleic Acids Research、第40巻、第1号、pp. 84-90、2012年

[22] Becker, K.; Barnes, K. (2004). 「遺伝学的関連データベース」 . Nature Genetics . 36 (5): 431– 432. doi : 10.1038/ng0504-431 . PMID 15118671 .

[23] “アーカイブコピー” . 2021年2月24日時点のオリジナルよりアーカイブ。2016年11月18日閲覧。{{cite web}}: CS1 maint: アーカイブされたコピーをタイトルとして (リンク)

[24] Bravo, A; et al. (2014). 「テキストおよび大規模データ分析からの遺伝子と疾患の関係性の抽出：トランスレーショナルリサーチへの示唆」 . BMC Bioinformatics . 16 (1) 55. doi : 10.1186/s12859-015-0472-9 . PMC 4466840. PMID 25886734 .

[Pinero-25] Piñero; et al. (2015). 「DisGeNET：ヒト疾患とその遺伝子の動的探索のための発見プラットフォーム」 .データベース. 2015 bav028. doi : 10.1093/database/bav028 . PMC 4397996. PMID 25877637 .

[26] Oti, M (2006). 「タンパク質間相互作用を用いた疾患遺伝子の予測」 . J. Med. Genet . 43 (8): 691– 698. doi : 10.1136/jmg.2006.041376 . PMC 2564594. PMID 16611749 .

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[

[ 7 ]

[ 8 ]。

[ 9 ]

[ 10 ]。

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[ 16 ]

[ 17 ]

[ 18 ]

[ 19 ]

[ 20 ]

[ 21 ]

[ 22 ]

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

コンテンツ
説明	UniProt は、Swiss-Prot、TrEMBL、および PIR-PSDデータベースを組み合わせて作成されたタンパク質データの中央リポジトリであるユニバーサルタンパク質リソースです。
キャプチャされたデータの種類	タンパク質アノテーション
生物	全て
接触
研究センター	EMBL-EBI、英国; SIB、スイス; PIR、米国。
主な引用	ユニバーサルプロテインリソースにおける進行中および将来の開発^{[ 13 ]}
アクセス
データ形式	カスタムフラットファイル、FASTA、GFF、RDF、XML。
Webサイト	www .uniprot .org www .uniprot .org /ニュース/
ダウンロードURL	www .uniprot .org /downloads & 完全なデータセットのダウンロードについてはftp .uniprot .orgをご覧ください。
ウェブサービスURL	はい – JAVA API についてはここを参照、REST についてはここを参照
ツール
ウェブ	高度な検索、BLAST、Clustal O、一括検索/ダウンロード、IDマッピング
その他
ライセンス	クリエイティブ・コモンズ表示 - 改変禁止
バージョン管理	はい
データ公開頻度	4週間
キュレーションポリシー	はい。手動と自動の両方に対応しています。自動アノテーションのルールは、データベース管理者と計算アルゴリズムによって生成されます。
ブックマーク可能なエンティティ	はい – 個々のタンパク質のエントリと検索の両方

コンテンツ
説明	ラットゲノムデータベース
生物	ドブネズミ（ネズミ）
接触
研究センター	ウィスコンシン医科大学
研究室	ヒト分子遺伝学センター
著者	メアリー・E・シモヤマ博士、ハワード・J・ジェイコブ博士
主な引用	PMID 25355511
アクセス
Webサイト	rgd .mcw .edu
ダウンロードURL	RGDデータリリース