サンドCDBMS

SAND Nucleus CDBMSは、SAND Technology Inc. が開発した、 ビジネス インテリジェンスアプリケーション向けに最適化された列指向の DBMSソフトウェア システムで、データ ウェアハウスコンポーネントを提供します。

会社沿革

SAND Technologyは1983年に設立されました。

SAND CDBMSの起源は、Nucleus International Corporationの研究と、エドワード・L・グレイザー氏らに付与された「ブール演算処理機能を備えたビット文字列圧縮装置」[ 1 ]の開発にあります。 [ 2 ]

元々はファームウェアでエンコードされていましたが、アプリケーションは現在完全にソフトウェアベースになっています。

SAND Technology は現在、N. Harris Computer Corporation の一部門です。

説明

完全にトークン化され、ビット配列エンコードおよび圧縮されたデータベースであり、データストレージはテーブル内のデータ行ではなく、スキーマ/テーブル間のドメインを使用する列指向です。これにより、トランザクション処理には適していませんが、データ分析とデータマイニングに最適化されたプラットフォームが実現します。

このアーキテクチャには次の特性があります。

  • すべての列はインデックスが付けられているかのように動作します
  • 実際のデータ値は一度だけ保存され、トークンによって参照されます。
  • 列は保存時にロスレスデータ圧縮を使用する
  • クエリで要求された列のみがデータベースからアクセスされます
  • クエリは圧縮された列に対して直接実行され、結果セットのみが解凍されます。

プラットフォームに依存しないSAND CDBMS は、64 ビット Windows または HP-UX、IBM-AIX、Red Hat Linux、SuSE Linux、Sun Solaris などの 64 ビット Linux/Unix 環境で実行されます。

データベース管理

SAND/DNA 分析は、ANSI 標準の SQL および DML コマンドを介して管理されます。

データベース領域の割り当てとコア管理はデータベースエンジンによって行われます。つまり、典型的なデータベース管理は、データモデリング、データコンテンツ、データライフサイクルの管理、ユーザープロファイルとアクセス権限の管理に重点が置かれます。

データのロードは簡単で、ロードスクリプトでソースとロード先を指定するだけです。複数のデータ操作関数とコマンドが用意されていますが、内部構造の最適化はすべてデータベースエンジンによって自動的に管理されます。

データロードのパフォーマンスは行ベースのデータベースよりも遅くなる可能性がありますが、インデックスを構築したり、ロード完了後に管理ルーチンを実行したりする必要がないため、その影響は軽減されます。また、並列ロード処理やセグメント化されたプリロード処理を使用することで、ロードパフォーマンスを向上させることもできます。

SAND CDBMSのコア機能は、データベースの「仮想」マウントをサポートしていることです。[ 3 ] これにより、データベースの変更を開発およびテストするための隔離された環境が提供され、マウント解除すると環境全体が削除されます。

参考文献