スキーマクロスウォーク

スキーマクロスウォークとは、複数のデータベーススキーマにおける同等の要素(または「フィールド」)を示す表です。あるスキーマの要素を別のスキーマの同等の要素にマッピングします。

クロスウォークテーブルは、エンタープライズシステム内またはエンタープライズシステムと並行して使用されることが多く、特に複数のシステムがインターフェースされている場合や、システムにレガシーシステムのデータが含まれている場合に顕著です。インターフェースのコンテキストでは、クロスウォークテーブルは内部的な抽出、変換、ロード(ETL)メカニズムとして機能します。

たとえば、これはMARC 標準からDublin Coreへのメタデータクロスウォークです。

MARCフィールド ダブリンコア要素
260セント(発行日、配布日など) 作成日
522(地理的範囲に関する注記) カバレッジ.空間
300ドル(物理的説明) フォーマット.範囲

クロスウォークは、あるスキームから別のスキームへのデータの配置場所を示します。図書館、アーカイブ、博物館、その他の文化機関では、MARC標準、ダブリン・コア、テキスト・エンコーディング・イニシアティブ(TEI)、その他のメタデータ・スキーム間でのデータの変換に、クロスウォークがよく使用されています。例えば、あるアーカイブのカタログには、写本を記述したMARCレコードがあります。アーカイブがその写本のデジタルコピーを作成し、カタログの情報と共にウェブ上に表示したいとします。この場合、MARCカタログレコードのデータを、ウェブページで表示可能なメタデータ・オブジェクト記述スキーマ(Metadata Object Description Schema)などの別の形式に変換する必要があります。MARCにはMODSよりも多くのフィールドがあるため、MODSではデータの配置場所を決定する必要があります。このような、ある形式から別の形式への「変換」は、「メタデータ・マッピング」または「フィールド・マッピング」と呼ばれることが多く、「データ・マッピング」や「セマンティック・マッピング」と関連しています。

クロスウォークには、いくつかの技術的な機能もあります。異なるメタデータスキームを使用するデータベース間で情報を共有したり、メタデータハーベスターが統合カタログを作成したりするのに役立ちます。また、検索エンジンが単一のクエリで複数のデータベースを同時に検索できるようにします。

横断歩道の課題

クロスウォークにおける最大の課題の一つは、2つのメタデータスキームが100%同等ではないことです。あるスキームには、別のスキームには存在しないフィールドがあったり、別のスキームでは2つの異なるフィールドに分割されているフィールドがあったりすることがあります。そのため、複雑なスキームからより単純なスキームにマッピングすると、データが失われることがよくあります。例えば、MARCからSimple Dublin Coreへのマッピングでは、タイトルの種類の区別が失われます。

MARCフィールド ダブリンコア要素
210 略称 タイトル
222 キータイトル タイトル
240 ユニフォームタイトル タイトル
242 翻訳されたタイトル タイトル
245 タイトルステートメント タイトル
246 バリアントタイトル タイトル

シンプル・ダブリン・コアには「タイトル」要素が1つしかないため、MARCタイトルの様々な種類が、それ以上の区別なく一括りに扱われてしまいます。将来、メタデータをMARC形式に戻そうとすると、MARC 245のタイトルステートメントの基本フィールドに情報が入力され、元の区別は失われてしまいます。[ 1 ]

ダブリンコア要素 MARCフィールド
タイトル 245 タイトルステートメント
タイトル 245 タイトルステートメント
タイトル 245 タイトルステートメント
タイトル 245 タイトルステートメント
タイトル 245 タイトルステートメント
タイトル 245 タイトルステートメント

このため、横断歩道は、ある方式から別の方式への「横方向」(一方通行)のマッピングであると言われています。方式Aから方式Bへ、そして方式Bから方式Aへマッピングするには、それぞれ別の横断歩道が必要になります。[ 2 ]

マッピングの難しさ

その他のマッピングの問題は、次のような場合に発生します。

  • 1 つのスキームには 1 つの要素があり、その異なる部分を 2 番目のスキーム内の複数の他の要素に配置する必要があります (「1 対多」マッピング)
  • あるスキームでは、要素を複数回繰り返すことができますが、別のスキームでは、その要素が複数の用語で1回だけ出現することしかできません。
  • スキームにはさまざまなデータ形式があります (例: John DoeまたはDoe, John )
  • 一方のスキームの要素はインデックス付けされているが、もう一方のスキームの同等の要素はインデックス付けされていない
  • スキームによって異なる制御語彙が使用される場合がある
  • 制度は時間の経過とともに基準を変える

これらの問題の中には解決できないものもあります。カレン・コイル氏が「Crosswalking Citation Metadata: The University of California's Experience」 で述べているように、

メタデータの経験が増えるほど、メタデータの完璧さは達成不可能であり、それを試みる者は皆、ひどく失望することになるだろうということがますます明らかになります。2つ以上の無関係なソース間でメタデータをクロスウォークする場合、理想的な方法では調整できないデータ要素が存在します。メタデータクロスウォークを成功させる鍵は、インテリジェントな柔軟性です。重要な目標に焦点を当て、プロジェクトを現実的な結論に導くために妥協を厭わないことが不可欠です。[ 3 ]

参照

参考文献

  1. ^「Dublin CoreからMARC Crosswalkへ」、ネットワーク開発およびMARC標準化局、米国議会図書館
  2. ^ Caplan, Priscilla (2003). 『すべての図書館員のためのメタデータの基礎』シカゴ: アメリカ図書館協会. pp  . 39. ISBN 0838908470
  3. ^ Metadata in Practice」Diane I. Hillmann、Elaine L. Westbrooks編、アメリカ図書館協会、シカゴ、2004年、91ページ。