
ドキュメンテーション科学は、情報の記録と検索に関する研究です。[ 1 ]物理的文書およびデジタル文書に記録された情報の保存、検索、共有の方法を含みます。この分野は図書館学や情報科学の分野と密接に関連していますが、独自の理論と実践を有しています。
「ドキュメンテーション科学」という用語は、ベルギーの弁護士であり平和活動家でもあるポール・オトレによって造られました。彼は情報科学の祖とみなされています。彼はアンリ・ラ・フォンテーヌと共に、ドキュメンテーション科学という学問分野の基礎を築きました。この分野の専門家はドキュメンタリストと呼ばれます。
長年にわたり、ドキュメンテーション科学は大規模かつ重要な研究分野へと成長してきました。アーカイブ化や検索といった伝統的な実践から、文書の性質に関する現代的な理論、デジタル情報の整理のための新しい手法、そして図書館、研究、医療、ビジネス、テクノロジーなどへの応用へと進化を遂げてきました。この分野はデジタル時代においても進化を続けています。

ドキュメンテーション科学には、文書とは何か、人々がどのように文書を利用し、どのように整理されるかを説明する深遠な理論があります。これらの概念は、図書館だけでなく、哲学、言語、社会科学を研究してきた学者によって提唱されました。
スザンヌ・ブリエットは、文書とは「証拠として、あるいは情報共有のために用いられるあらゆる物質的証拠」[ 4 ]であると定義しました。例えば、動物園のレイヨウは研究、分類、記述の対象となるため、文書となり得ます。
文書は単なる物や資料ではなく、社会によって形作られます。マイケル・バックランドは、文書は人々が情報として有用または有効であると同意した場合にのみ意味を持つと指摘しました。彼は、誰かがそれを証拠として使用することを決定した時に、文書は文書になる、と説明しました。[ 14 ]
ロナルド・デイは、文書化は中立的なものではなく、権力、イデオロギー、政治の影響を受ける可能性があると記しています。彼は、図書館が書籍を整理する方法のような分類システムは、単なる技術的なツールではないと主張しました。分類システムは、どのような種類の知識が他の知識よりも重要視されているかを示すものでもあるのです。
近年、マウリツィオ・フェラーリスによる「ドキュメンタリティ」 [ 10 ]のような新しい理論が提唱されています。彼は、文書は紙やファイルである必要はなく、ツイート、データベースへのエントリ、ログファイルといったデジタルなものであっても、後から参照できる痕跡を残す限り、文書であると提唱しました。この理論は、現代のデジタル文書を説明するのに役立ちます。
ドキュメンテーション科学には、情報の収集、整理、保存、検索を支援する多くの手法が含まれます。これらの手法は、図書館、アーカイブ、研究室、企業、そして現在ではオンラインシステムでも活用されています。
かつての文書化作業には、書籍、記事、報告書、その他の印刷資料の収集が含まれていました。人々はこれらの資料の記録を、カタログカード、索引、書誌を用いて手作業で作成していました。ポール・オトレによるユニバーサル・ビブリオグラフィック・レパートリー(Universal Bibliographic Repertory)の取り組みはその一例です。彼は世界中の知識を整理するために、数百万ものカードエントリを作成しました。[ 15 ]
今日、文書は人間によって作成されるだけではありません。コンピューターや機械も、ログファイル、メタデータ、センサーデータなどの文書を生成します。これらを収集・管理するための新しいツールと方法が必要です。
文書の整理は、常にドキュメンテーション科学の基本的な要素です。分類(グループ分け)や索引作成(トピックやキーワードのリスト作成)といった手法は、必要な情報を見つけるのに役立ちます。
広く使用されているシステムとしては、オトレとラ・フォンテーヌによって開発された国際十進分類法[ 2 ] (UDC)があります。もう一つのシステムは、米国の図書館の大半で使用されている米国議会図書館分類法[ 16 ](LCC)です。索引付けは、人間が行うことも、テキストを読み取って文書にタグを付与するソフトウェアプログラムによって行うこともできます。
メタデータは文書を記述するためにも使用されます。メタデータとは、文書のタイトル、著者、日付、件名など、「データに関するデータ」のことです。デジタルライブラリでは、メタデータの一貫性を保つために、ダブリンコアなどの標準規格が使用されています。 [ 17 ]
ドキュメンテーションの主な目的の一つは、ユーザーが適切な文書を見つけられるように支援することです。これは情報検索と呼ばれます。かつては、カタログの引き出しや印刷された索引を用いていました。今日では、検索エンジン、データベース、デジタルライブラリなどが利用されています。
現代の検索ツールは、ブール論理、ランキングアルゴリズム、そして時には機械学習を用いて、最も有用な結果を最初に表示します。これは、ドキュメンテーション科学と情報検索の両方で研究されている分野の一部です。[ 18 ]
文書は長期保管が必要です。これを文書保存と呼びます。印刷された文書は光、害虫、あるいは時間の経過によって損傷を受ける可能性があります。一方、デジタル文書はフォーマットが古くなったり、保管施設が故障したりすると価値がなくなる可能性があります。
アーキビストは、ファイルを新しい形式に移動する移行や、古いシステムを複製するエミュレーションなどの方法を使用して資料を保存します。
これらの方法とツールは、新しいテクノロジーの発展に伴い常に変化しています。しかし、ドキュメント化の主な目的は、情報を安全に保ち、整理し、簡単に見つけられるようにすることです。
インターネット、コンピュータ、クラウドストレージの普及により、文書はもはや書籍、論文、レポートだけではありません。メール、ツイート、動画、ウェブサイト、データベース、さらには機械が作成したログファイルなども文書化されるようになりました。
今日、多くの文書は直接デジタル形式で作成されています。これらはボーンデジタル文書と呼ばれます。例としては、デジタル写真、ソーシャルメディアの投稿、電子メール、オンライン記事などが挙げられます。これらは通常、クラウドやサーバー上に保存されます。[ 19 ]
マウリツィオ・フェラーリスやロナルド・デイといった学者たちは、これらのデジタル痕跡は保存、検索、そして後から利用できるため、依然として文書であると述べています。彼らはこの概念を「ドキュメンタリティ(記録性)」と呼び、[ 10 ]痕跡を残すものはすべて文書になり得るという意味です。
デジタル文書は適切に保管されなければ簡単に消失してしまう可能性があります。だからこそ、デジタル保存は今や文書科学において重要な位置を占めています。
文書を利用可能な状態に保つために、アーキビストは、時代遅れのシステムを再現するエミュレーションや、ファイルを新しいフォーマットに移行するマイグレーションなどの技術を活用します。デジタルファイルの真正性と損傷のなさを確保するためです。[ 20 ]
デジタル文書には、タイトル、著者、日付、件名など、文書を説明する優れたメタデータも必要です。ダブリンコア[ 17 ]やMODSなどの標準規格は、システム間でメタデータの一貫性を保つのに役立ち、文書を人間や機械が検索して利用できるようにします。
相互運用性により、別々のシステムを連携させることができます。例えば、ある国のデジタルライブラリは、別の国の別のライブラリとレコードを共有できます。ドキュメンテーションサイエンスは、メタデータとドキュメントフォーマットをプラットフォーム間でより容易に共有できるようにすることに取り組んでいます。
デジタル時代において、情報はかつて想像をはるかに超える指数関数的な速度で生成されています。これは時に情報過多と呼ばれます。そのため、デジタル文書におけるプライバシー、真正性、倫理といった問題が生じます。例えば、デジタル文書の所有者は誰なのか?信頼できるのか?どれくらいの期間保管すべきなのか?これらは、今日この分野が直面している継続的な課題です。[ 21 ]
今日、ドキュメンテーション・サイエンスはほぼあらゆる分野で活用されています。その用途は、アーカイブや図書館から、科学、ビジネス、医療、教育、テクノロジーまで多岐にわたります。その包括的な目標は今も変わりません。それは、人々が情報を見つけやすく、活用しやすいように、文書を作成、整理、共有することです。
図書館とアーカイブ
目録作成、分類、メタデータタグ付けといった文書化手法は、図書館で今でも用いられています。また、多くの図書館では、利用者が歴史的文書、報告書、論文、電子書籍にアクセスできるオンラインデジタルリポジトリも構築しています。
アーカイブは、記録を長期にわたって保存するためにドキュメンテーション科学を活用します。これには、紙の記録だけでなく、電子メール、ウェブサイト、データベースなどのデジタルネイティブの資料も含まれます。
大学や研究機関では、ドキュメンテーションサイエンスが研究データ管理(RDM)を支援し、実験データが適切に整理、ラベル付けされ、他者が再利用できるよう保管されるようにします。これはオープンサイエンスを支援し、研究者が資金提供や出版の要件を満たすのに役立ちます。
講師は、情報源の引用、情報の評価、デジタルツールを使用した学術論文の執筆、整理、共有などの文書化スキルも教えます。
医療分野では、電子医療記録(EHR)に記録が活用されています。これらの記録には、患者の処方箋、検査結果、治療計画、病歴などが含まれます。これらの記録を正確に記録することで、医師や看護師は適切なタイミングで適切な判断を下し、患者の安全と健康を向上させることができます。[ 22 ]
企業は、プロジェクトファイル、MoM、コンプライアンス文書、標準作業手順書(SOP)を保存するために文書管理システムを使用しています。これらの文書は、従業員のコラボレーション、知識の共有、そして組織のプロトコルに従った行動に役立ちます。
コンテンツ管理システム(CMS)、ドキュメント バージョン管理システム、コラボレーション プラットフォーム などの最新のソフトウェア ツールは、ドキュメンテーション サイエンスの原則に基づいています。
プログラミングとIT分野において、開発者はAPI、システム、コードに関する技術文書を作成します。これは、他の人々が技術とその使用方法を理解するのに役立ちます。[ 23 ]
今日、ドキュメンテーション科学はますます重要になっています。ドキュメンテーション科学は、日々生成される膨大な量のデジタル情報を管理し、仕事と生活のほぼあらゆる側面における知識共有をサポートします。
{{citation}}: CS1 maint: ISBNによる作業パラメータ(リンク)