シングルインスタンスストレージ(SIS)は、コンテンツの複数のコピーを単一の共有コピーに置き換えるシステムの機能です。これは、データの重複を排除し、効率を高める手段です。SISは、ファイルシステム、電子メールサーバーソフトウェア、データバックアップ、その他のストレージ関連のコンピュータソフトウェアに頻繁に実装されています。シングルインスタンスストレージは、データ重複排除の簡易版です。データ重複排除はセグメントレベルまたはサブブロックレベルで機能しますが、シングルインスタンスストレージはファイル全体レベルで機能し、ファイル全体または電子メールメッセージの重複コピーを排除します。[ 1 ]
コンセプト
電子メールサーバーの場合、シングルインスタンスストレージとは、メッセージの単一のコピーがデータベース内に保持され、個々のメールボックスは参照ポインタを介してコンテンツにアクセスすることを意味します。しかし、メールサーバーにおけるシングルインスタンスストレージの主な利点はディスク容量の削減にあるという誤解がよくあります。真実は、大規模な配布リストに送信されるメッセージの配信効率を大幅に向上させることです。メールサーバーのシナリオでは、シングルインスタンスストレージによるディスク容量の節約は一時的なものであり、時間の経過とともに急速に減少します。
バックアップソフトウェアと併用することで、シングルインスタンスストレージは同一ファイルの重複コピーの保存を回避するため、必要なアーカイブメディアの量を削減できます。オペレーティングシステムファイルなど、同一のファイルが複数のコンピュータにインストールされていることがよくあります。シングルインスタンスストレージでは、ファイルのコピーが1つだけバックアップメディアに書き込まれるため、容量を削減できます。これは、ストレージがオフサイトであり、Amazon S3などのクラウドストレージ上にある場合に特に重要になります。このような場合、重複排除によってストレージコスト、帯域幅コスト、バックアップウィンドウを最大10分の1に削減できることが報告されています。[ 2 ]
Novell GroupWise は単一インスタンスのストレージ上に構築されており、大容量を実現しています。
ISO CD/DVD イメージ ファイルは、SIS を使用して CD/DVD コンパイルのサイズを縮小し (重複ファイルが十分にある場合)、より小さなメディアに収まるように最適化できます。
SIS は、P2P アプリケーションBearShare (バージョン 5.n 以下) などのシステム全体のファイル重複検索および複数ファイル インスタンス検出ツールに関連していますが、SIS がストレージ使用率を自動的に削減し、シンボリック リンクを作成して保持するのに対し、Bearshare では重複および関連するユーザー レベルのファイル システム、Windows エクスプローラータイプのアイコン リンクを手動で削除できるという点で異なります。
マイクロソフト
SIS は、 Windows 2000 Serverのリモート インストール サービス機能とともに導入されました。一般的なサーバーには 10 個以上の固有のインストール構成 (デバイス ドライバーやソフトウェア スイートが異なる場合もある) が格納されていますが、構成間で一意となるデータは全体の 20% 程度にとどまる可能性があります。[ 3 ] Microsoft は、「SIS はハード ディスク ボリュームを検索して重複ファイルを識別します。SIS が同一ファイルを見つけると、ファイルのコピーを 1 つ、SIS 共通ストアと呼ばれる中央リポジトリに保存し、その他のコピーを保存されているバージョンへのポインタに置き換えます」と述べています。 [ 4 ]ファイルはハッシュ関数 によってのみ比較されます。データ自体が同一であれば、名前や日付が異なるファイルでも統合できます。[ 3 ] Windows Server 2003 Standard Edition には SIS 機能がありますが、OEM OS システムのインストールに限定されています。
Windows Vistaで導入されたファイルベースのWindows Imaging Formatも、シングルインスタンスストレージをサポートしていました。シングルインスタンスストレージは、Microsoft Exchange Serverバージョン4.0以降の機能であり、MicrosoftのWindows Home Serverにも搭載されています。Exchange 2007では添付ファイルの重複排除のみが行われていましたが、Microsoft Exchange Server 2010では完全に廃止されました。[ 5 ] Microsoftは2009年6月1日にシングルインスタンスストレージを搭載したWindows Storage Server 2008 (WSS2008) [ 6 ]を発表しましたが、この機能はWindows Server 2008では利用できないと述べています。[ 6 ]
この機能は、Windows Server 2012で新たに導入された、より強力なチャンクベースのデータ重複排除メカニズム以降、正式に廃止されました。このメカニズムでは、類似したコンテンツを持つファイルであっても、同一データの連続部分が存在する限り、重複排除が可能です。このメカニズムはSISよりも強力です。[ 7 ] Windows Server 2019以降、この機能はReFSで完全にサポートされています。[ 8 ]
参照
参考文献
- ^重複排除率とシングルインスタンスストレージについてクライアントに説明する。ジョージ・クランプ、ストレージ・スイス
- ^重複排除 + Amazon S3 で時間とコストを節約。ホワイトペーパー:2008年6月発行
- ^ a b Douceur, John (JD); Goebel, David; Corbin, Scott; Bolosky, Bill (2000年8月). 「Windows 2000 のシングルインスタンスストレージ」(PDF) . Microsoft Research . Microsoft Researchおよび Balder Technology Group.
- ^ Microsoft Windows Storage Server 2003 R2 のシングルインスタンスストレージArchived 2007-01-04 at the Wayback Machine : テクニカルホワイトペーパー: 2006年5月発行
- ^ [1] Exchangeチームのブログ、Microsoft社
- ^ a b MicrosoftのWindows Storage Server 2008
- ^ FileCAB-Team (2019年4月10日). 「Windows Server 2012 におけるデータ重複除去の概要」 . Microsoft Tech Community .
- ^ 「データ重複除去の相互運用性」 . docs.microsoft.com . 2022年3月29日.