生物学データベースの一覧

生物学データベースは、生物学的情報の保存場所です。[ 1 ] Nucleic Acids Research誌は、生物学データベースに関する特集号を定期的に発行しており、そのようなデータベースのリストも掲載しています。2018年版には、約180のそのようなデータベースと、以前に紹介されたデータベースの更新情報が掲載されています。[ 2 ] Omics Discovery Indexは、複数の生物学データベースの閲覧と検索に使用できます。さらに、国立アレルギー・感染症研究所(NIAID)が開発したNIAID Data Ecosystem Discovery Portalでは、複数のデータベースを横断的に検索できます。

メタデータベース

メタデータベースとは、データに関するデータを収集して新しいデータを生成する、データベースのデータベースです。異なる情報源からの情報を統合し、より使いやすく新しい形式で、あるいは特定の疾患や生物に重点を置いた形で提供することができます。元々、メタデータはタグ、キーワード、マークアップヘッダーなど、 データに関するデータを指す一般的な用語でした。

モデル生物データベース

モデル生物データベースは、集中的に研究されている生物に関する詳細な生物学的データを提供します。

核酸データベース

国際ヌクレオチド配列データベース(INSD) は、主要なデータベースで構成されています。主なデータベースには以下のものがあります。

DDBJ(日本)、GenBank(米国)、European Nucleotide Archive(欧州)は、あらゆる生物のヌクレオチド配列データのリポジトリです。3つのデータベースはいずれもヌクレオチド配列の登録を受け付け、新規データと更新データを毎日交換することで、相互の最適な同期を実現しています。これら3つのデータベースは、オリジナルの配列データを保管しているため、プライマリデータベースと呼ばれています。これらのデータベースは、ハイスループットシーケンシング装置から得られた生のリードをアーカイブする Sequence Read Archive (SRA)と連携しています。

セカンダリ データベースは次のとおりです。

  • ハップマップ
  • OMIM(オンラインメンデル遺伝学):遺伝性疾患
  • 参照シーケンス
  • 1000ゲノム プロジェクト: 2008 年 1 月に開始されました。さまざまな民族グループに属する 1,000 人を超える匿名の参加者のゲノムが分析され、公開されました。
  • EggNOGデータベース: 5090種の生物と2502種のウイルスに基づく、階層的、機能的、系統学的に注釈が付けられたオーソロジーリソース。多重配列アライメント、最大尤度樹、および広範な機能注釈を提供している。[ 6 ] [ 7 ]

その他のデータベース

遺伝子発現データベース

一般的な遺伝子発現データベース

マイクロアレイ遺伝子発現データベース

ゲノムデータベース

これらのデータベースは、ゲノム配列を収集し、アノテーションと解析を行い、一般公開しています。一部のデータベースでは、計算によるアノテーション精度を向上させるために、実験文献のキュレーションも行われています。これらのデータベースには、多数の種のゲノム、あるいは単一のモデル生物のゲノムが保存されている場合があります。

表現型データベース

RNAデータベース

アミノ酸とタンパク質のデータベース

(参照:人体に含まれるタンパク質の一覧

タンパク質関連情報、生物学的知識の発見、データ駆動型仮説生成を支援・管理するために、公開されているデータリポジトリやリソースがいくつか開発されている。 [ 15 ]下表のデータベースは、核酸研究(NAR)データベースの発行物およびデータベースコレクションに掲載されているデータベース、およびUniProt KBで相互参照されているデータベースから選択されている。これらのデータベースのほとんどはUniProt / UniProt KBと相互参照されており、識別子を相互にマッピングすることができる。[ 15 ]

ヒトのタンパク質:

標準的なヒトゲノムには、約2万個のタンパク質コード遺伝子が存在する。(そのうち約1200個については、 WikipediaGene Wiki )に既に記事が掲載されている。)スプライスバリアントを含めると、ヒトタンパク質は50万個にも及ぶ可能性がある[ 16 ] 。

さまざまな種類のタンパク質データベース

シグナル伝達経路データベース

代謝経路とタンパク質機能データベース

分類データベース

数多くのデータベースが、種やその他の分類カテゴリーに関する情報を集めています。中でも「カタログ・オブ・ライフ」は、約150の専門化された「グローバル種データベース」(GSD)からなるメタデータベースであり、(ほぼ)すべての記載済み、つまり「既知」の種の名前やその他の情報を収集している点で特別な例です。

  • BacDive : 分類情報を含む、細菌および古細菌の生物多様性に関する株に関連した情報を提供する細菌メタデータベース
  • 生命カタログ:地球上のすべての種のメタデータベース
  • EzTaxon-e:16SリボソームRNA遺伝子配列に基づく原核生物の同定のためのデータベース
  • NCBI タクソノミー: NCBIが運営する分類データベースで、DNA 配列が利用可能なすべての分類群に焦点を当てています (これらの配列は、NCBI が運営する別のデータベースであるGenBankに保存されています)。

画像データベース

画像は、人類学的標本から動物学に至るまで、生物医学において重要な役割を果たしています。しかし、 iNaturalistなどのプロジェクトでは、写真を中心にデータを収集しているものの、画像収集に特化したデータベースは比較的少ないのが現状です。「画像」の特殊な例としては、タンパク質構造や解剖学的構造の3D再構成画像などの3次元画像が挙げられます。画像データベースには、例えば以下のようなものがあります[ 22 ] 。

放射線データベース

追加のデータベース

エクソソームデータベース

  • エクソカルタ
  • 細胞外RNAアトラス:ヒトおよびマウスの体液からの小さなRNA-seqおよびqPCR由来のexRNAプロファイルのリポジトリ

数学モデルデータベース

抗菌薬耐性率と抗生物質消費量に関するデータベース

抗菌薬耐性メカニズムに関するデータベース

Wikiスタイルのデータベース

専門データベース

参考文献

  1. ^ Wren JD, Bateman A (2008年10月). 「データベース、データの墓、そして風に舞う塵」 .バイオインフォマティクス. 24 (19): 2127–8 . doi : 10.1093/bioinformatics/btn464 . PMID  18819940 .
  2. ^ 「Volume 46 Issue D1 | Nucleic Acids Research | Oxford Academic」 academic.oup.com . 2018年9月4日閲覧
  3. ^ラザフォード KM、レラ=ラミレス M、ウッド V (2024 年 5 月)。「PomBase: グローバル コア バイオデータ リソース - 成長、コラボレーション、持続可能性」遺伝学227 (1) iyae007.土井10.1093/genetics/iyae007PMC 11075564PMID 38376816  
  4. ^ Zhu B, Stülke J (2018年1月). 「2018年のSubtiWiki:遺伝子とタンパク質からモデル生物Bacillus subtilisの機能ネットワークアノテーションまで」 . Nucleic Acids Research . 46 (D1): D743– D748. doi : 10.1093 / nar/gkx908 . PMC 5753275. PMID 29788229 .  
  5. ^マルガリータ・ガルシア=ヘルナンデス;ターニャ・ベラルディーニ;チェン・グァンホン;デビー・クリスト。エイズリング・ドイル。エヴァ・フアラ。エマ・ニー。マーク・ランブレヒトニール・ミラー。ルーカス・A・ミュラー。スパルナ・ムンドディ。レオノーレ・ライザー。スン・Y・リ;ランディ・ショールジュリー・タックリンド。ダン・C・ウィームズ。ウー・イーヘ。アイリス・スー。ダニエル・ユー。ユン・ジョンウォン;張培芬(2002 年 11 月)。 「TAIR: 統合されたシロイヌナズナデータのリソース」。機能的および統合的ゲノミクス2 (6): 239–253 .土井: 10.1007/s10142-002-0077-zPMID 12444417S2CID 7827488  
  6. ^ Powell S, Forslund K, Szklarczyk D, Trachana K, Roth A, Huerta-Cepas J, et al. (2014年1月). 「eggNOG v4.0: 3686種の生物におけるネストされたオルソロジー推論」 . Nucleic Acids Research . 42 (データベース号): D231-9. doi : 10.1093/nar/gkt1253 . PMC 3964997. PMID 24297252 .  
  7. ^ Huerta-Cepas J, Szklarczyk D, Heller D, Hernández-Plaza A, Forslund SK, Cook H, et al. (2019年1月). 「eggNOG 5.0:5090種の生物と2502種のウイルスに基づく、階層的、機能的、系統学的に注釈付けされたオルソロジーリソース」 . Nucleic Acids Research . 47 (D1): D309– D314. doi : 10.1093 / nar/gky1085 . PMC 6324079. PMID 30418610 .  
  8. ^アレイエクスプレス
  9. ^ジオ
  10. ^ 「ヒトタンパク質アトラス」www.proteinatlas.org . 2019年5月27日閲覧
  11. ^ Dash S, Campbell JD, Cannon EK, Cleary AM, Huang W, Kalberer SR, 他 (2016年1月). 「マメ科植物情報システム (LegumeInfo.org): マメ科植物のための連合データリソース群の主要構成要素」 . Nucleic Acids Research . 44 (D1): D1181-8. doi : 10.1093/nar/ gkv1159 . PMC 4702835. PMID 26546515 .  
  12. ^ 「サッカロミセスゲノムデータベース | SGD」www.yeastgenome.org . 2018年9月4日閲覧
  13. ^ Grant D, Nelson RT, Cannon SB, Shoemaker RC (2010年1月). 「SoyBase, the USDA-ARS soybean genetics and genomics database」 . Nucleic Acids Research . 38 (データベース号): D843-6. doi : 10.1093/nar / gkp798 . PMC 2808871. PMID 20008513 .  
  14. ^ 「IRESbase」
  15. ^ a b Chen C, Huang H, Wu CH (2017). 「タンパク質バイオインフォマティクスデータベースとリソース」. Wu CH, Arighi CN, Ross KE (編).タンパク質バイオインフォマティクス. Methods in Molecular Biology. Vol. 1558. ニューヨーク: Springer New York. pp.  3– 39. doi : 10.1007/978-1-4939-6783-4_1 . ISBN 978-1-4939-6781-0. PMC  5506686 . PMID  28150231 .
  16. ^アンナ・カーンコウスカ;トレイトリ、セバスティアン C.ブルゾン、オンドジェ。ノヴァーク、ルカス。ヴァチェク、ヴォイチェフ。スーカル、ペトル。バーロウ、ラエル D.ハーマン、エミリー K.ピパリヤ、シュエタ V。パネク、トマーシュ。ジハラ、デイビッド。ペトルゼルコヴァ、ローマ。ブテンコ、アンジェリカ。エメ、ローラ。ステアーズ、コートニー・W.ロジャー、アンドリュー・J.エリアシュ、マレク。ダックス、ジョエル B.ハンプル、ウラジミール(2019)。「オキシモナドのゲノムは、ミトコンドリアの欠如において標準的な真核生物の複雑性を示す」分子生物学と進化36 (10): 2292– 2312. doi : 10.1093/molbev/ msz147 . PMC 6759080. PMID 31387118 .  
  17. ^ケシャバ・プラサド、TS;ゴエル、R.カンダサミー、K.ケルティクマール、S.クマール、S.マティバナン、S.テリキチェラ、D.ラジュ、R.シャフレン、B.ヴェヌゴパル、A.バラクリシュナン、L.マリムトゥ、A.バナジー、S.ソマナサン、DS;セバスチャン、A.ラニ、S.レイ、S.ハリーズ・キショア、CJ。カント、S.アーメド、M。ミネソタ州カシャップ;モフムード、R.ラマチャンドラ、イリノイ州。クリシュナ、V。ラヒマン、バージニア州。モハン、S.ランガナサン、P.ラマバドラン、S.チャーカディ、R.パンディ、A. (2008)。「ヒトタンパク質リファレンスデータベース ― 2009年更新版」 . Nucleic Acids Research . 37 (データベース号): D767– D772. doi : 10.1093/nar/gkn892 . PMC 2686490. PMID 18988627 .  
  18. ^ Mir S, Alhroub Y, Anyango S, Armstrong DR, Berrisford JM, Clark AR, 他 (2018年1月). 「PDBe: 欧州タンパク質データバンクにおける再利用可能なデータ配信インフラの構築」 . Nucleic Acids Research . 46 (D1): D486– D492. doi : 10.1093/nar/ gkx1070 . PMC 5753225. PMID 29126160 .  
  19. ^ Kinjo AR, Bekker GJ, Suzuki H, Tsuchiya Y, Kawabata T, Ikegawa Y, Nakamura H (2017年1月). 「Protein Data Bank Japan (PDBj): 更新されたユーザーインターフェース、リソース記述フレームワーク、大規模構造解析ツール」 . Nucleic Acids Research . 45 (D1): D282– D288. doi : 10.1093/nar/ gkw962 . PMC 5210648. PMID 27789697 .  
  20. ^ Rose PW, Prlić A, Altunkaya A, Bi C, Bradley AR, Christie CH, et al. (2017年1月). 「RCSBタンパク質データバンク:タンパク質、遺伝子、3D構造情報の統合的視点」 . Nucleic Acids Research . 45 (D1): D271– D281. doi : 10.1093/nar/ gkw1000 . PMC 5210513. PMID 27794042 .  
  21. ^ヘルムヤコブ H、モンテッキ=パラッツィ L、ルーイントン C、ムダリ S、ケリアン S、オーチャード S、他。 (2004 年 1 月)。「IntAct: オープンソースの分子相互作用データベース」核酸研究32 (データベースの問題): D452-5。土井10.1093/nar/gkh052PMC 308786PMID 14681455  
  22. ^ a b Ellenberg J, Swedlow JR, Barlow M, Cook CE, Sarkans U, Patwardhan A, et al. (2018年11月). 「生物学的画像データの公開アーカイブへの呼びかけ」 . Nature Methods . 15 (11): 849– 854. doi : 10.1038/ s41592-018-0195-8 . PMC 6884425. PMID 30377375 .  
  23. ^ Tendler BC, Hanayik T, Ansorge O, Bangerter-Christensen S, Berns GS, Bertelsen MF, et al. (2022年3月). 「デジタル・ブレイン・バンク:死後画像データセットのためのオープンアクセス・プラットフォーム」. eLife . 11 e73153 . doi : 10.7554/eLife.73153 . PMC 9042233. PMID 35297760 .  
  24. ^ Iudin A, Korir PK, Salavert-Torres J, Kleywegt GJ, Patwardhan A (2016年5月). 「EMPIAR:電子顕微鏡生画像データの公開アーカイブ」. Nature Methods . 13 (5): 387– 388. doi : 10.1038/nmeth.3806 . PMID 27067018. S2CID 38996040 .  
  25. ^ Starruß J, de Back W, Brusch L, Deutsch A (2014年1月). 「Morpheus:マルチスケール・多細胞システム生物学のためのユーザーフレンドリーなモデリング環境」 .バイオインフォマティクス. 30 (9): 1331– 1332. doi : 10.1093/bioinformatics/btt772 . PMC 3998129. PMID 24443380 .  
  26. ^ Crickmore, N.; Berry, C.; Panneerselvam, S.; Mishra, R.; Connor, TR; Bonning, BC (2021年11月). 「Bacillus thuringiensisおよび他の細菌由来の殺虫性タンパク質の構造に基づく命名法」 . Journal of Invertebrate Pathology . 186 (D1) 107438. Bibcode : 2021JInvP.18607438C . doi : 10.1016/j.jip.2020.107438 . PMID 32652083 . 
  27. ^ Panneerselvam S; Mishra R; Berry C; Crickmore N; Bonning BC (2022). 「BPPRCデータベース:細菌性殺虫タンパク質へのアクセスと分析のためのウェブベースツール」 .データベース (オックスフォード) . 186 (D1): 107438. doi : 10.1093/database/baac022 . PMC 9216523 . PMID 35396594 .  
  28. ^ Hounkpe BW, Chenou F, de Lima F, De Paula EV (2021年1月). 「HRT Atlas v1.0データベース:大規模なRNA-seqデータセットのマイニングによるヒトおよびマウスのハウスキーピング遺伝子と候補参照転写産物の再定義」 . Nucleic Acids Research . 49 (D1): D947– D955. doi : 10.1093/nar/gkaa609 . PMC 7778946. PMID 32663312 .  
  29. ^ (IHEC) データポータル
  30. ^欧州経済倫理委員会
  31. ^設計図
  32. ^ EGA
  33. ^ディープ
  34. ^クレスト
  35. ^ 「エピゲノムを世界規模で共有する」 . Nature Methods . 15 (3): 151. 2018. doi : 10.1038/nmeth.4630 . ISSN 1548-7105 . 
  36. ^ Valverde H, Cantón FR, Aledo JC (2019年11月). 「MetOSite:メチオニン残基のスルホキシド化研究のため統合リソース」 .バイオインフォマティクス. 35 (22): 4849– 4850. doi : 10.1093/bioinformatics/btz462 . PMC 6853639. PMID 31197322 .