| DESeq2 | |
|---|---|
| 原作者 | マイケル・ ラブ コンスタンティン・アールマン=エルツェ クワメ・フォーブス サイモン・アンダース ヴォルフガング・フーバー |
| 初回リリース | 2013年3月22日 (2013年3月22日) |
| 安定版リリース | 1.48.2 / 2025年8月18日 ( 2025-08-18 ) |
| リポジトリ | GitHubの DESeq2 |
| オペレーティング·システム | Linux、macOS、Windows |
| プラットフォーム | Rプログラミング言語 |
| タイプ | バイオインフォマティクス |
| ライセンス | GNU劣等一般公衆利用許諾書 |
| Webサイト | バイオコンダクター上のDESeq2 |
DESeq2は、統計プログラミング言語R用のバイオインフォマティクスおよび計算生物学分野のソフトウェアパッケージです。主に、ハイスループットRNAシーケンシング(RNA-seq)データの解析に用いられ、異なる実験条件間で発現が異なる遺伝子を特定します。DESeq2は、統計的手法を用いてRNA-seqデータを正規化および解析するため、遺伝子発現パターンと制御を研究する研究者にとって貴重なツールとなっています。Bioconductorリポジトリから入手できます。
2014年に初めて発表されました。[1] 2023年9月現在、その使用は3万回以上引用されています。[2]
特徴
RNA-seqデータ解析における重要なステップの一つは、データの正規化です。[3] DESeq2は、サンプル間のシーケンス深度の違いを調整する「サイズファクター」正規化手法を採用しています。[1]この正規化により、サンプル間で遺伝子の発現値が比較可能になり、発現差のある遺伝子を正確に特定できるようになります。DESeq2は、サイズファクター正規化に加えて、分散安定化変換も採用しており、異なる発現レベル間の分散を安定化することで、データの品質をさらに向上させます。[4]この正規化手法の組み合わせにより、バイアスが最小限に抑えられ、発現差解析の精度が向上します。
DESeq2は、RNA-seqデータで一般的に観察される過剰分散を考慮するために、負の二項分布モデルを提供しています。 [5]このモデリングアプローチは、単純なポアソン分布では十分に説明できない変動性を考慮に入れています。負の二項分布を組み込むことで、DESeq2は遺伝子発現数の分散を正確にモデル化し、より信頼性の高い差次的発現の推定値を提供します。
DESeq2は、「apeglm法」として知られる適応型縮小法も提供しており、これは特に小規模なサンプルサイズを扱う際に有用です。[6]この手法は、遺伝子発現推定値の対数変化を効果的に縮小し、極端な値の影響を軽減し、結果の安定性を向上させます。これは、統計的検出力の低下の問題を軽減するのに役立つため、限られた生物学的反復実験を行う研究者にとって特に有用です。
さらに、DESeq2では、関連する共変量を解析に組み込むことができます。 [1]この機能により、研究者はバッチ効果や実験条件など、遺伝子発現に影響を与える可能性のある交絡因子を考慮することができます。DESeq2は、解析に共変量を含めることで、データにおける真の差次的発現パターンをより正確に評価できます。
使用
DESeq2は、バイオコンダクターリポジトリを介してRとインターフェースされています。[7]このリポジトリは包括的なドキュメントとチュートリアルを提供しており、幅広い研究者がアクセス可能です。
参考文献
- ^ abc Love, Michael I; Huber, Wolfgang; Anders, Simon (2014年12月). 「DESeq2を用いたRNA-seqデータのフォールド変化と分散のモデレート推定」. Genome Biology . 15 (12): 550. doi : 10.1186/s13059-014-0550-8 . PMC 4302049. PMID 25516281 .
- ^ Love, MI; Huber, W.; Anders, S. (2014). 「引用指標」.ゲノム生物学. 15 (12). オタゴ大学: 550. doi : 10.1186/s13059-014-0550-8 . PMC 4302049. PMID 25516281 .
- ^ Evans, Ciaran; Hardin, Johanna; Stoebel, Daniel M (2018年9月28日). 「サンプル間RNA-Seq正規化手法の前提条件の観点からの選択」. Briefings in Bioinformatics . 19 (5): 776– 792. doi :10.1093/bib/bbx008. PMC 6171491. PMID 28334202 .
- ^ 「varianceStabilizingTransformation: 分散安定化変換(VST)を…に適用する」rdrr.io . 2023年9月28日時点のオリジナルよりアーカイブ。 2023年9月28日閲覧。
- ^ “遺伝子レベルの差次的発現解析”. HBCトレーニング. Github.io. 2020年5月15日. 2023年9月28日時点のオリジナルよりアーカイブ。 2023年9月28日閲覧。
- ^ チップマン, ヒュー・A.; コラチク, エリック・D.; マカロック, ロバート・E. (1997年12月). 「適応型ベイズウェーブレット収縮」.アメリカ統計学会誌. 92 (440): 1413. doi :10.2307/2965411. JSTOR 2965411.
- ^ “DESeq2: 人気のRNA-Seq解析パッケージの概要”. pluto.bio . 2021年10月18日. 2023年9月27日時点のオリジナルよりアーカイブ。2023年9月27日閲覧。