
PetaBox(ペタボックス)は、 Capricorn Technologiesとインターネットアーカイブが提供するストレージユニットです。[1] [2]インターネットアーカイブのスタッフとCR Saikleyによって、1ペタバイト(100万ギガバイト)の情報を保存・処理するために設計されました。[3]
仕様
- 密度: 1.4ペタバイト/ラック
- 消費電力: 3kW/ペタバイト
- エアコンは使用せず、代わりに余剰熱を利用して建物を暖める
デザイン
Petaboxの設計目標は以下の通りであった: [3]
- 低消費電力: ラックあたり 6 kW、ストレージ クラスター全体で 60 kW
- 高密度: 100 TB/ラック以上
- データを処理するためのローカルコンピューティング(ローエンドPC 800台)
- マルチOS対応可能、Linux標準
- コロケーション対応
- 輸送コンテナに最適:20フィート×8フィート×8フィートの輸送コンテナ内で稼働可能
- メンテナンスが容易:ペタバイトごとに1 人のシステム管理者
- 完全なミラーリングを自動化するソフトウェア
- 簡単に拡張可能
- 安価な設計と保管
歴史
最初の100テラバイトラックは、2004年6月にアムステルダムにあるインターネットアーカイブのヨーロッパ支部であるStichting Internet Archive (SIA)で稼働を開始しました。2台目の80テラバイトラックは、同年、サンフランシスコの本社で稼働を開始しました。その後、インターネットアーカイブはPetaboxの製造を、新たに設立されたCapricorn Technologiesにスピンオフさせました。[3]
2004年から2007年にかけて、Capricornはインターネット・アーカイブのPetabox導入を模倣し、主要な学術機関、デジタル保存機関、政府機関、高性能コンピューティング(HPC)および主要研究機関、医用画像プロバイダー、デジタル画像リポジトリ、ストレージ・アウトソーシング・サイト、その他の企業向けにPetaboxを導入しました。同社の最大製品は750ギガバイトのディスクを使用しています。2007年には、インターネット・アーカイブのデータセンターに約3ペタバイトのPetaboxストレージ技術が収容されていました。
2010年には、Petaboxの第4バージョンが運用を開始しました。各Petaboxは、Linux上で動作する480TBの物理ストレージ(2TBのディスク240台、4Uラックユニットあたり24台のディスク、ラックあたり10台のディスク構成)を搭載可能でした。[4] [5]
2021年12月現在、インターネットアーカイブのPetaboxストレージシステムは、4つのデータセンター、745のノード、28,000枚の回転ディスクで構成されています。Wayback Machineには57ペタバイトの情報が含まれており、書籍、音楽、ビデオコレクションにはさらに42ペタバイトの情報が含まれており、合計99ペタバイトの「ユニークデータ」が使用されています。[3]コンテンツは複数の場所にバックアップされているため、合計212ペタバイトが使用されています。[6] [検証失敗]
参考文献
- ^ 「大容量ストレージを安価に」CNET . 2014年1月6日時点のオリジナルよりアーカイブ。2014年1月6日閲覧。
- ^ 「PetaBox 製品ファミリー」Capricorn Technologies . 2023年7月10日時点のオリジナルよりアーカイブ。 2023年7月10日閲覧。
- ^ abcd "Internet Archive: Petabox". Internet Archive . 2024年10月7日時点のオリジナルよりアーカイブ。 2024年7月12日閲覧。
- ^ ジェフ・カプラン (2010年7月27日). 「第4世代Petabox」.インターネットアーカイブ.
- ^ 「eWEEK Labs Walk-Through: the Internet Archive」. PCMag UK . 2022年4月27日時点のオリジナルよりアーカイブ。 2021年11月9日閲覧。
- ^ 「Archive.org 情報」インターネットアーカイブヘルプセンター。
ファイルのバックアップは行っていますか?はい。すべてのファイルを複数の場所に複製/バックアップしています。
外部リンク
- インターネットアーカイブにおけるPetaboxの概要