多次元階層ツールキット

Linuxベースのオープンソースのポータブルソフトウェアツールキット

多次元階層化ツールキット、または多次元階層化(MDH)データベースツールキットは、Linuxベースのオープンソースのポータブルソフトウェアツールキットです。最大256テラバイトのデータベースにおける、非常に高速で柔軟な多次元階層型の情報の保存、検索、操作をサポートします。このパッケージはCおよびC++で記述されており、 GNU GPL / LGPL / Free Documentationライセンスの下でソースコード形式で利用可能です。この配布キットには、ネットワーク対応のインタラクティブなテキストおよびシーケンス検索ツールのデモ実装が含まれており、非常に大規模なゲノムデータベースで機能し、ツールキットが膨大なゲノム情報データセットを操作できる能力を示しています。

分布

このツールキットはMumpsコンパイラの一部として配布されます。Linux、CygwinWindows XP用のバージョンが存在します。

起源

このツールキットは、非常に大きな文字列インデックスを持つ多次元疎行列を操作するという問題に対するソリューションです。このツールキットは、 1960年代半ばにマサチューセッツ総合病院で開発された汎用プログラミング言語であるMUMPS(Mとも呼ばれます)に基づいています

主な特徴

このプロジェクトにおける主要なデータベース機能は、実質的に無制限のサイズを持つ多次元配列を直接かつ効率的に操作できるグローバル配列です。グローバル配列は、永続的、スパース、宣言なし、多次元、文字列インデックス付きデータディスクベースの構造です。グローバル配列は、通常の配列参照が許される場所であればどこにでも出現でき、データはデータベース配列内のリーフノードだけでなく中間ノードにも格納できます。配列参照内の添字の数は、すべての添字が文字列値に展開された後の配列参照全体の長さによってのみ制限されます。ツールキットには、データベースを走査し、配列を操作するための関数がいくつか含まれています。

このツールキットは、データベースと関数セットをC++クラスとして利用可能にし、従来のMumpsスクリプトのインタープリタ実行も可能にします。このツールキットを使用するには、MDHおよびMumpsディストリビューションキットと関連コードをインストールする必要があります。

実装された機能

ツールキットには、従来の Mumps 関数 ($ascii()、$extract()、$find()、$horolog、$length()、$name()、$justify()、$order()、$piece()、$test) のほか、ベクトルおよび行列演算、Boyer–Moore–Gosper 文字列検索アルゴリズム関数、Smith–Waterman アルゴリズム関数、リレーショナル代数演算、Perl 互換正規表現ライブラリ ( PCRE ) へのアクセスが実装されています。


「https://en.wikipedia.org/w/index.php?title=Multidimensional_hierarchical_toolkit&oldid=1136480404」より取得