この記事は更新が必要です。理由:2013年時点の分野の状況を説明していますが、最新の開発が欠けています (2024年8月) |

データスペースとは、データ統合システムで発生する問題の一部を克服することを目的とした、データ管理における抽象概念です。データスペースは、「参加者」またはデータソースの集合と、それらの関係(例えば、データセットAはデータセットBの複製であるなど)として定義されます。[1]データスペースには、組織内のすべてのデータソースを、その形式、物理的な場所、データモデルに関係なく含めることができます。[1]データスペースは、形式に関係なく、時には「ベストエフォート」方式でデータをクエリするための統一されたインターフェースと、必要に応じてデータをさらに統合する方法を提供します。[1]これは、すべてのデータが同一形式であることを要求する従来のリレーショナルデータベースとは大きく異なります。 [1]この概念の目的は、既存のマッチングおよびマッピング生成技術を利用することで、データ統合システムの構築に必要な労力を削減し、[説明が必要]、使用状況に応じてシステムを「従量課金制」で改善することです。[2] [3]データ統合における労働集約的な側面は、本当に必要になるまで延期されます。[4]
従来、データ統合およびデータ交換システムは、データスペースシステムのサービスの多くを提供することを目的としてきました。データスペースは、データ統合アーキテクチャの進化における次のステップと見なすことができますが、サービスを提供する前にセマンティックな統合が必要となるため、現在のデータ統合システムとは異なります。したがって、すべてのデータが準拠する単一のスキーマは存在せず、データは多数のホストシステムに存在するにもかかわらず、データ統合システムは各スキーマで使用される用語間の正確な関係を認識しています。その結果、データ統合システムを構築するには、かなりの事前の労力が必要になります。[5]
データスペースは、データソースの統合度に関わらず、すべてのデータソースに基本機能を提供するデータ共存アプローチに重点を移しています。例えば、データスペースサポートプラットフォーム(DSSP)は、既存のデスクトップ検索システムと同様に、すべてのデータソースに対してキーワード検索を提供できます。リレーショナルスタイルのクエリ、データマイニング、特定のソースの監視など、より高度な操作が必要な場合は、段階的にそれらのソースをより緊密に統合するための追加的な取り組みを行うことができます。同様に、従来のデータベース保証に関して言えば、データスペースシステムは当初、一貫性と耐久性の保証が弱いものしか提供できません。より強力な保証が求められるにつれて、データソースのさまざまな所有者間の合意形成や、特定のインターフェース(例えば、コミットプロトコル用)の公開に、より多くの取り組みを注ぐことができます。[6] [7]
歴史
技術開発の循環モデルによると、新しい技術はまず設計競争の段階を経て進歩します。そこでは技術が探求され、実験が行われ、業界が支配的な設計に落ち着き、反復がそれほど行われなくなります。[1] 2019年現在[更新]、エドワードは、データスペースはすでに探索的および概念実証プロジェクトで構成される「第一波」の採用を経ており、より一般的であまり適切ではないユースケースに適応されている「第二波」が始まっていると述べています。[1]
欧州委員会は2020年2月から、「欧州共通データスペース」と呼ばれる様々な産業向けの共有データスペースの開発に取り組んでいる。[8]データスペースは、農業、エネルギー、金融、健康、メディア、製造、モビリティ、観光産業のほか、欧州グリーンディール、言語、行政、研究・イノベーション、スキル向けにも計画されている。[8] [9] [説明が必要]最初の具体的な措置は、ビッグデータ価値に関する欧州官民パートナーシップ(ビッグデータ価値PPP)の一環として資金提供された数々の研究・イノベーションイニシアチブであった。[10]
参照
参考文献
- ^ abcdef Curry, Edward (2020), Curry, Edward (ed.), "Dataspaces: Fundamentals, Principles, and Techniques", Real-time Linked Dataspaces: Enabling Data Ecosystems for Intelligent Systems , Springer International Publishing, pp. 45– 62, doi : 10.1007/978-3-030-29665-0_3 , ISBN 978-3-030-29665-0
- ^ Belhajjame, K.; Paton, NW ; Embury, SM; Fernandes, AAA; Hedeler, C. (2013). 「ユーザーフィードバックに基づくデータスペースの漸進的改善」.情報システム. 38 (5): 656. CiteSeerX 10.1.1.303.1957 . doi :10.1016/j.is.2013.01.006.
- ^ Belhajjame, K.; Paton, NW ; Embury, SM; Fernandes, AAA; Hedeler, C. (2010). 「データスペースにおけるスキーママッピングのフィードバックベースのアノテーション、選択、および改良」. Proceedings of the 13th International Conference on Extending Database Technology - EDBT '10 . p. 573. CiteSeerX 10.1.1.298.3519 . doi :10.1145/1739041.1739110. ISBN 9781605589459。
- ^ Dong, X.; Halevy, A. (2007). 「データ空間のインデックス作成」. 2007 ACM SIGMOD 国際データ管理会議議事録 - SIGMOD '07 . p. 43. doi :10.1145/1247480.1247487. ISBN 9781595936868 . S2CID 1184444.
- ^ Howe, B.; Maier, D.; Rayner, N.; Rucker, J. (2008). 「データ空間の採掘:未知の情報源のスキーマレスプロファイリング」. 2008 IEEE 第24回国際データエンジニアリング会議ワークショップ. p. 270. doi :10.1109/ICDEW.2008.4498331. ISBN 978-1-4244-2161-9. S2CID 14039616.
- ^ Sarma, AD; Dong, X. (L.; Halevy, AY (2009). 「データスペースサポートプラットフォームにおけるデータモデリング」.概念モデリング:基礎と応用. コンピュータサイエンス講義ノート. 第5600巻. pp. 122– 138. doi :10.1007/978-3-642-02463-4_8. ISBN 978-3-642-02462-7。
- ^ Franklin, M.; Halevy, A.; Maier, D. (2005). 「データベースからデータスペースへ」. ACM SIGMOD Record . 34 (4): 27. doi :10.1145/1107499.1107502. S2CID 14092111
- ^ ab 「ヨーロッパのデジタル未来を形作る:欧州共通データスペース」欧州委員会. 2024年8月24日閲覧。
- ^ 「ブリュッセルからの視点:欧州のデータ戦略が具体化する」国際プライバシー専門家協会。2024年1月11日。 2024年8月24日閲覧。
- ^ Scerri, Simon; Tuikka, Tuomo; de Vallejo, Irene Lopez; Curry, Edward (2022), Curry, Edward; Scerri, Simon; Tuikka, Tuomo (eds.)「Common European Data Spaces: Challenges and Opportunities」, Data Spaces : Design, Deployment and Future Directions , Cham: Springer International Publishing, pp. 337– 357, doi : 10.1007/978-3-030-98636-0_16 , ISBN 978-3-030-98636-0
さらに詳しく
- Partha Pratim Talukdar, Marie Jacob, Muhammad Salman Mehmood, Koby Crammer, Zachary G. Ives, Fernando Pereira, Sudipto Guha: データ統合クエリの作成方法を学ぶ. PVLDB 1(1): 785-796 (2008)
- マイケル・J・フランクリン、アロン・Y・ハレヴィ、デイヴィッド・マイヤー:データ空間入門。PVLDB 1(2): 1516-1517 (2008)
- Jens-Peter Dittrich、Marcos Antonio Vaz Salles:「iDM:パーソナルデータスペース管理のための統合型多用途データモデル」VLDB 2006:367-378。