TREX検索エンジン

TREXは、 SAP SEが列指向ストレージを使用して開発したSAP NetWeaver統合技術プラットフォームの検索エンジンです。[ 1 ] TREXエンジンは、さまざまなシステム環境で使用できるスタンドアロンコンポーネントですが、主にエンタープライズポータル、ナレッジウェアハウス、ビジネスインテリジェンス(BI、旧SAP Business Information Warehouse)などのSAP製品の不可欠な部分として使用されます。SAP NetWeaver BIでは、TREXエンジンは、オンライン分析処理のパフォーマンスを向上させるプラグインアプライアンスであるBIアクセラレータを強化します。「TREX」という名前はText Retrieval and information EXtractionの略ですが、SAPの登録商標ではなく、マーケティング資料でも使用されていません。

検索機能

TREXは、完全一致検索、ブール検索、ワイルドカード検索、言語検索(文法上の差異はインデックス検索用に正規化されます)、あいまい検索(インデックス用語と数文字異なる入力文字列はインデックス検索用に正規化されます)など、さまざまな種類のテキスト検索をサポートしています。結果セットは、用語頻度逆文書頻度(tf-idf)の重み付けに基づいてランク付けされ、検索用語が強調表示されたスニペットを含むことができます。

TREXは、ベクトル空間モデルを用いたテキストマイニングと分類をサポートします。ドキュメントグループは、クエリベースの分類、例ベースの分類、またはこれらとキーワード管理の組み合わせを使用して分類できます。

TREXは、ドキュメントメタデータだけでなく、大量のビジネスデータやSAP BusinessObjects内のデータも対象とした構造化データ検索をサポートします。構造化データのインデックスはデータ圧縮によってコンパクトに実装され、データは線形時間で集約できるため、大量のデータを完全にメモリ内で処理できます。

最近の開発は次のとおりです。

  • ビジネスオブジェクト内の異なるフィールドから構造化されたデータを結合する結合エンジン
  • メインインデックスの横にデルタインデックスを書き込み、2番目のデルタインデックスが更新している間にオフラインでマージする高速更新機能
  • 高度な数学的分析のためのデータマイニング機能パック

歴史

エンジンの最初のコードは 1998 年に作成され、TREX は 2000 年に SAP コンポーネントになりました。SAP NetWeaver BI Accelerator は 2005 年に初めてロールアウトされました。2013 年第 1 四半期現在、TREX の最新リリースは SAP NW 7.1 です。

安全

TREXのセキュリティ脆弱性は2015年に初めて特定され、修正されました。[ 2 ] [ 3 ]この脆弱性は、内部通信プロトコルであるTREXnetの認証不足が原因で発生しました。前述のパッチは、いくつかの重要な機能を削除することで問題を修正しました。

その後、ERPScanの脅威情報責任者であるマシュー・ゲリ氏が脆弱性の調査を続け、依然として悪用可能であることを発見しました。[ 4 ]さらに、攻撃が成功した場合、この脆弱性により、リモートの攻撃者が許可なくサーバーを完全に制御できるようになります。[ 5 ]この脆弱性は最終的にSAPセキュリティノート2419592を通じて修正されました。

参考文献

  1. ^ Daniel Abadi、Peter Boncz、Stavros Harizopoulos、Stratos Idreos、Samuel Madden (2012). 「現代の列指向データベースシステムの設計と実装」(PDF) . Foundations and Trends in Databases . 5 (3): 197– 280. doi : 10.1561/1900000024 . 2021年4月12日時点のオリジナル(PDF)からアーカイブ。 2016年3月29日閲覧
  2. ^ 「不明」
  3. ^不明
  4. ^ 「重大な脆弱性がSAP HANAおよびその他多数のSAPアプリケーションに影響」 2017年7月9日時点のオリジナルよりアーカイブ2017年5月3日閲覧。
  5. ^ 「SAPのTREXがHANAとNetWeaverを危険にさらす」 The Register