![]() | |
| コンテンツ | |
|---|---|
| 説明 | FASTQシーケンスBAMデータ |
| 生物 | 全て |
| 接触 | |
| 研究センター | 国立生物工学情報センター欧州バイオインフォマティクス研究所日本DNAデータバンク |
| アクセス | |
| Webサイト | www |
シーケンスリードアーカイブ(SRA、以前はショートリードアーカイブと呼ばれていました)は、 DNA配列 データ、特にハイスループットシーケンシングによって生成された「ショートリード」(通常1,000塩基対未満の長さ)の公開リポジトリを提供するバイオインフォマティクスデータベースです。 [ 1 ]アーカイブは国際ヌクレオチド配列データベースコラボレーション(INSDC)の一部であり、NCBI、欧州バイオインフォマティクス研究所(EBI)、および日本DNAデータバンク(DDBJ)の共同で運営されています。
このアーカイブは、RNA-SeqやChIP-Seq研究、およびヒトマイクロバイオームプロジェクトや1000ゲノムプロジェクトなどの大規模研究によって生成されたデータのリポジトリを提供するために、2007年に国立生物工学情報センター(NCBI)によって設立されました。[ 1 ] [ 2 ]当初はショートリードアーカイブと呼ばれていましたが、将来のシーケンシング技術によってより長いシーケンスリードが生成できるようになることを見込んで名前が変更されました。[ 3 ]

シーケンスリードアーカイブ(SRA)に寄託されたデータ量は急速に増加しています。2010年9月現在、SRAの65%はヒトゲノム配列であり、さらに16%はヒトメタゲノム配列リードに関連しています。[ 6 ]このデータの多くは1000ゲノムプロジェクトを通じて寄託されました。2011年6月には、SRAに含まれるデータは100テラベースDNAを超えました。[ 2 ]
SRAに提出されるファイルの推奨データ形式はBAM形式であり、アラインメントされたリードとアラインメントされていないリードの両方を保存できます。[ 6 ] SRAは内部的に、3つのINSDC加盟データベースすべてで使用されているNCBI SRAツールキットに依存して、柔軟なデータ圧縮、APIアクセス、 FASTQなどの他の形式への変換を提供しています。[ 5 ]
NCBIは2011年2月に資金削減のためNCBI SRAを閉鎖する計画を発表した。[ 2 ] [ 7 ]しかし、EBIとDDBJはSRAへの支援を継続すると発表した。[ 8 ] 2011年10月、NCBIはSRAへの資金提供の継続を発表した。[ 2 ]
SRAへのデータの登録は、ほとんどの資金提供機関とオープンアクセスジャーナルによって義務付けられています。ネイチャー・パブリッシング・グループのジャーナルでは、DNAおよびRNAシーケンシングデータをSRAを通じて提供することが義務付けられています。[ 9 ]
参照
参考文献
- ^ a b Wheeler, DL; Barrett, T; Benson, DA; Bryant, SH; Canese, K; Chetvernin, V; Church, DM; Dicuccio, M; Edgar, R; Federhen, S; Feolo, M; Geer, LY; Helmberg, W; Kapustin, Y; Khovayko, O; Landsman, D; Lipman, DJ; Madden, TL; Maglott, DR ; Miller, V; Ostell, J; Pruitt, KD; Schuler, GD; Shumway, M; Sequeira, E; Sherry, ST; Sirotkin, K; Souvorov, A; Starchenko, G; Tatusov, RL; Tatusova, TA; Wagner, L; Yaschenko, E (2008年1月). 「国立バイオテクノロジー情報センターのデータベースリソース」 .核酸研究. 36 (データベース号): D13-21. doi : 10.1093/nar/ gkm1000 . PMC 2238880. PMID 18045790 .
- ^ a b c d Galperin, MY; Fernandez-Suarez, XM (2011年12月5日). 「2012年版 Nucleic Acids Research データベース号とオンライン分子生物学データベースコレクション」 . Nucleic Acids Research . 40 (D1): D1– D8. doi : 10.1093/nar/ gkr1196 . PMC 3245068. PMID 22144685 .
- ^ Ostell, Jim (2009). 「NCBIのシーケンスリードアーカイブ:中核的な基盤」 . Bio IT World . 2013年1月8日閲覧。
- ^ 「NCBI SRA概要」 NCBI、2013年1月1日。2012年3月20日時点のオリジナルよりアーカイブ。 2013年1月8日閲覧。
- ^ a b Kodama, Y.; Shumway, M.; Leinonen, R. (2011). 「シーケンスリードアーカイブ:シーケンスデータの爆発的な増加」 . Nucleic Acids Research . 40 (D1): D54– D56. doi : 10.1093/nar / gkr854 . ISSN 0305-1048 . PMC 3245110. PMID 22009675 .
- ^ a b Leinonen R; Sugawara H; Shumway M (2011年1月). 「シーケンスリードアーカイブ」 . Nucleic Acids Res . 39 (データベース号): D19–21. doi : 10.1093/nar/ gkq1019 . PMC 3013647. PMID 21062823 .
- ^ GB編集チーム(2011年3月22日). 「NCBI SRAの閉鎖とゲノムデータストレージの長期的な将来への影響」 . Genome Biology . 12 (3): 402. doi : 10.1186/gb-2011-12-3-402 . PMC 3129670. PMID 21418618 .
- ^ 「DDBJは配列生データのアーカイブを継続します」 www.ddbj.nig.ac.jp . 2014年9月2日閲覧。
- ^ 「データと資料の入手可能性:著者と査読者@npg」 www.nature.com . 2014年9月2日閲覧。
外部リンク
- 欧州ヌクレオチドアーカイブ、SRAの検索ページ
- NCBI のSRA ホームページ。
- EBI でのERA 提出。
- DDBJのDRAホームページ。
