ディスプロト

ディスプロト
コンテンツ
説明本質的に無秩序なタンパク質(IDP)と領域(IDR)の手動でキュレーションされたデータベース
キャプチャされたデータの種類本質的に無秩序なタンパク質
生物全て
接触
研究室バイオコンピューティングUP研究所(パドヴァ大学生物医学科学部)
主な引用PMID  34850135
アクセス
Webサイトhttps://disprot.org/
ダウンロードURLhttps://disprot.org/download
その他
ライセンスクリエイティブ・コモンズ 表示 4.0 国際 (CC BY 4.0) ライセンス
キュレーションポリシー専門家とコミュニティのバイオキュレーターによる手動キュレーション

DisProtは、天然変性タンパク質(IDP)および領域(IDR)を手動でキュレーションした生物学的データベースです。 [ 1 ] [ 2 ] [ 3 ] DisProtのアノテーションは、タンパク質の状態情報だけでなく、利用可能な場合は、特定の実験手法によって検出された状態遷移、相互作用、および不変性の機能的側面もカバーしています。DisProtは、BioComputing UP研究所(パドヴァ大学生物医学科学部)でホストおよび管理されています。

Webサイト

最新のDisProtバージョンであるDisProt 9 [ 3 ]には、 2,300以上のタンパク質エントリと、4,500以上の構造状態、状態遷移、相互作用、機能の証拠、および2,500以上の注釈付き科学出版物が含まれています。

DisProtにおけるバイオキュレーション

DisProtエントリは、科学文献に掲載された実験データに基づき、専門家およびコミュニティのバイオキュレーターによってアノテーションされています。DisProtホームページには、p53カテニンβ1といったDisProtエントリの例に加え、 SARS-CoV-2ウイルスに属するタンパク質(核タンパク質など)のエントリが掲載されています。

ディスプロト9

テーマ別データセット

2020年から、DisProtは国内避難民が関与し、重要な役割を果たしている生物学的領域を説明する「テーマ別データセット」を公開しています。 [ 3 ] これらのデータセットに属するすべてのエントリには、テーマの名前がタグ付けされています。

  • 単細胞毒素と抗毒素(DisProtリリース2020_12)
  • 細胞外マトリックスタンパク質(DisProtリリース2021_06)
  • ウイルスタンパク質(DisProtリリース2021_12)

モデル生物のエントリー

DisProtホームページでは、モデル生物はアイコン、種名、および各生物に属するDisProtエントリ数で表されます。以下の生物のエントリは、DisProtホームページの「生物」セクションからアクセスでき、個別のファイルとしてダウンロードできます:Homo sapiens、Mus musculus、Rattus norvegicus、Saccharomices cerevisiae、Escherichia coli、Arabidopsis thaliana、Drosophila melanogaster、Caenorhabditis elegans

DisProtのバージョンとリリース

DisProt のバージョンとリリースには、Web サイトと、データベースの手動でキュレーションされたコンテンツに対する変更が含まれます。

  • DisProt 7 [ 4 ] (2016): 800以上のタンパク質エントリと1000以上の論文がアノテーションされています。DisProtの各タンパク質エントリは、接頭辞DPに5桁のタンパク質識別子が続くDisProt識別子によって特徴付けられます。例えば、DP00016はサイクリン依存性キナーゼ阻害因子1タンパク質に対応します。Angular.JSベースにした新しいウェブインターフェースが特徴的です。
  • DisProt 8 [ 5 ] (2019): 1400以上のタンパク質エントリと3000以上のディスオーダータンパク質領域。DisProt 8では、安定したDisProt領域識別子の概念も導入されました。DisProtは、タンパク質中のディスオーダー領域を予測する機械学習(ML)手法のトレーニングに広く利用されています。さらに、DisProtは本質的に非構造化タンパク質の特性を理解するためにも利用されています。[ 6 ] DisProt 8には、新しいWebインターフェース、拡張API、そしてテキストマイニング技術を統合した新しいアノテーションインターフェースが搭載されました。
  • DisProt 9 [ 3 ] (2021): 2,300以上のタンパク質エントリと4,500以上のエビデンスが、2,500以上の科学論文からアノテーションされています。DisProt 9は、Webインターフェースのデザインを刷新し、本質的疾患タンパク質オントロジー(IDPO)をリファクタリングしました。遺伝子オントロジー IDPとIDRの相互作用と機能のアノテーション)とエビデンスと結論オントロジー(実験方法のアノテーション)の採用により、相互運用性が向上しています。

DisProtオントロジー

DisProtは、無秩序領域に注釈を付けるために、本質的に無秩序なタンパク質オントロジー(IDPO)、証拠と結論オントロジー(ECO)、そして遺伝子オントロジー(GO)という3つの異なるオントロジーを使用しています。DisProtは各IDPO用語ごとに専用のページを用意しており、用語の識別子、名称、定義、そして遺伝子オントロジーなどの外部オントロジーへの相互参照が含まれています。各IDPO用語ページには、その用語で注釈付けされたすべてのDisProtエントリがリストされています。

  • 本質的に無秩序なタンパク質オントロジー: 次の種類の証拠に注釈を付けるために使用されます。1. 構造状態 (無秩序、プレモルテングロビュール、モルテングロビュール、秩序)、2. 構造遷移 (構造状態間の遷移)、および 3. 自己機能 (例:自己阻害) およびタンパク質の非構造化状態に関連する機能 (例:柔軟なリンカー/スペーサー)
  • 証拠と結論オントロジー: 内因性障害の存在またはその側面の 1 つ (例:円二色性の証拠)を評価するために使用される実験方法に注釈を付けるために使用されます。
  • 遺伝子オントロジー: 結合パートナー (例:タンパク質結合)やその他の機能 (例: RNA フォールディング シャペロン)に注釈を付けるために使用されます。

参考文献

  1. ^ Vucetic, Slobodan; Obradovic, Zoran; Vacic, Vladimir; Radivojac, Predrag; Peng, Kang; Iakoucheva, Lilia M.; Cortese, Marc S.; Lawson, J. David; Brown, Celeste J. (2005-01-01). 「DisProt:タンパク質異常データベース」バイオインフォマティクス21 ( 1): 137– 140. doi : 10.1093/bioinformatics/bth476 . ISSN 1367-4803 . PMID 15310560 .  
  2. ^ Sickmeier, Megan; Hamilton, Justin A.; LeGall, Tanguy; Vacic, Vladimir; Cortese, Marc S.; Tantos, Agnes; Szabo, Beata; Tompa, Peter; Chen, Jake (2007-01-01). 「DisProt: 不規則タンパク質データベース」 . Nucleic Acids Research . 35 (データベース号): D786–793. doi : 10.1093/nar/ gkl893 . ISSN 1362-4962 . PMC 1751543. PMID 17145717 .   
  3. ^ a b c dクアリア、フェデリカ;メサロス、バリント。サラディーニ、エドアルド。ハトス、アンドラス。パンサ、リタ。ケメス、ルシア B.パジコス、マーティアシュ。ラザール、タマス。ペーニャ・ディアス、サミュエル。サントス、ハイメ。アクス、ベロニカ (2021-11-25)。「2022 年の DisProt: タンパク質内因性疾患アノテーションの品質とアクセシビリティの向上」核酸研究50 (D1): D480 ~ D487。土井10.1093/nar/gkab1082ISSN 1362-4962PMC 8728214PMID 34850135   
  4. ^ Piovesan, Damiano; Tabaro, Francesco; Mičetić, Ivan; Necci, Marco; Quaglia, Federica; Oldfield, Christopher J.; Aspromonte, Maria Cristina; Davey, Norman E.; Davidović, Radoslav (2016-11-28). 「DisProt 7.0:無秩序タンパク質データベースのメジャーアップデート」 . Nucleic Acids Research . 45 (D1): D219– D227. doi : 10.1093/nar/gkw1056 . ISSN 1362-4962 . PMC 5210544. PMID 27899601 .   
  5. ^ハトス、アンドラス;ハイドゥ・ソルテス、ボルバラ;モンゾン、アレクサンダー M.パロポリ、ニコラス。アルバレス、ルシア。アイカクファス、ブルク;バソット、クラウディオ。ベニテス、ギレルモ I.ベヴィラックア、マルティナ。チャサピ、アナスタシア。ケメス、ルシア(2019)。「DisProt: 2020 年の内因性タンパク質障害の注釈」核酸研究48 (D1): D269 – D276。土井10.1093/nar/gkz975PMC 7145575PMID 31713636  
  6. ^ Kovačević JJ (2012年6月). 「DisProtデータベースにおける位置依存性ディスオーダーコンテンツの計算解析」 . Genomics Proteomics Bioinformatics . 10 (3): 158–65 . doi : 10.1016/j.gpb.2012.01.002 . PMC 5056116. PMID 22917189 .