
| 情報科学 |
|---|
| 一般的な側面 |
| 関連分野とサブフィールド |
| シリーズの一部 |
| 研究 |
|---|
| 哲学ポータル |
計量書誌学(ビブリオメトリクス)は、特に科学分野、図書館情報学分野 において、統計的手法を書誌データの研究に応用する学問です。計量書誌学は科学計量学(科学的指標や指標の分析)と密接に関連しており、両分野は大きく重複しています。
計量書誌学研究は19世紀後半に初めて登場しました。第二次世界大戦後、「定期刊行物危機」とコンピュータツールのもたらす新たな技術的機会を背景に、計量書誌学は大きな発展を遂げました。1960年代初頭には、ユージン・ガーフィールドのScience Citation Indexとデレク・ジョン・デ・ソラ・プライスの引用ネットワーク分析が、計量書誌学に関する体系的な研究プログラムの基礎を築きました。
引用分析は、文書間で共有される引用のネットワークまたはグラフ表現である引用グラフ[ 1 ]の構築に基づく、一般的に用いられる計量書誌学的手法である。多くの研究分野では、その分野の影響度、研究者集団の影響度、特定の論文の影響度を調査したり、特定の研究分野内で特に影響力のある論文を特定したりするために、計量書誌学的手法が用いられている。計量書誌学的ツールは、記述言語学、シソーラスの開発、読者の利用状況の評価に広く取り入れられている。専門的な科学的用途を超えて、Googleが実装したページランクアルゴリズムなどの一般的なウェブ検索エンジンは、計量書誌学的手法と概念によって大きく形作られてきた。
ウェブとオープンサイエンス運動の出現により、「ビブリオメトリクス」の定義と目的は徐々に変化してきました。2010年代には、Web of ScienceやScopusといった引用データのための伝統的な独占的インフラストラクチャが、オープンな引用データを支持する新たな取り組みによって挑戦を受けました。研究指標に関するライデン宣言(2015年)は、指標の利用と透明性に関する幅広い議論のきっかけとなりました。

ビブリオメトリー(bibliométrie )という用語は、1934年にポール・オトレによって初めて使用され、[ 2 ] [ 3 ]、「書籍や文書の出版と閲覧に関連するあらゆる側面の測定」と定義されました。[ 4 ]英語版のビブリオメトリクス(bibliometrics)は、1969年にアラン・プリチャードによって発表された論文「統計書誌かビブリオメトリクスか?」の中で初めて使用されました。 [ 5 ]彼はこの用語を「書籍やその他のコミュニケーション媒体への数学および統計的手法の適用」と定義しました。ビブリオメトリクスは、それまでこの分野の出版物で主に使用されていた統計書誌(statistical bibliography )に代わる用語として考案されました。プリチャードにとって、統計書誌はあまりにも「扱いにくい」ものであり、研究の主目的が何であるかを明確に示していなかったからです。[ 6 ]
計量書誌学の概念は、「書籍、論文、出版物、引用数を数えるといった、研究活動の物質的側面を重視する」[ 7 ] 。理論的には、計量書誌学は、科学活動の非書誌的指標の分析に基づく科学計量書誌学(ロシア語のnaukometriyaに由来)[ 8 ]とは異なる分野である。実際には、20世紀半ばには引用データが定量的な科学評価の主要な基準となったため、計量書誌学と科学計量書誌学の研究は、類似したデータソースと手法を用いる傾向がある。「計量書誌学の手法が科学技術文献に適用される限りにおいて、計量書誌学と科学計量書誌学の2つの分野はかなりの程度重複している」。[ 7 ]ウェブの発展と非科学的生産への計量書誌学的アプローチの拡大により、1990年代と2000年代にはインフォメトリクス、ウェブメトリクス、サイバーメトリクスといったより広範な用語が導入されました。[ 9 ]これらの用語は、情報検索などの既存の研究手法と部分的に重複するため、広く採用されていません。
定義にもよりますが、計量書誌学的性格を持つ科学的著作、研究、調査は、すでに12世紀にユダヤ索引の形で特定されています。[ 10 ]
計量書誌分析は、19世紀から20世紀の変わり目に登場しました。[ 11 ] [ 12 ] [ 13 ] [ 14 ]これらの発展は、計量書誌分析の概念が初めて登場する数十年前に遡ります。代替ラベルが一般的に使用されていました。書誌統計は、1920年以降に特に普及し、1960年代末まで使用され続けました。[ 14 ]科学的メタデータの初期の統計研究は、科学的成果の大幅な増加と、この情報へのアクセスを容易にしたデータベースの索引サービスが並行して発展したことがきっかけでした。[ 15 ]引用索引は1860年代に判例法に初めて適用され、その最も有名な例であるシェパードの引用(1873年に初版が出版)は、 1世紀後の科学引用索引の直接的なインスピレーションとなりました。 [ 16 ]
社会科学の出現は、科学の科学と、科学そのものを科学的対象として研究する可能性についての新たな思索的な研究を促した。「科学を含む社会活動は、砲弾の軌道や天体の公転と同じように定量的な法則に還元できるという信念は、オーギュスト・コント、ウィリアム・オグバーン、ハーバート・スペンサーの実証主義社会学に遡る。」[ 17 ]計量書誌分析は独立した研究分野として考えられたのではなく、科学史(1885年のアルフォンス・ド・カンドルの『2世紀後の科学と学者の歴史』、1917年のフランシス・ジョセフ・コールとネリー・B・イールズの『比較解剖学の歴史、文献の統計的分析』 )、書誌学( 1896年のフランシス・バーバリー・キャンベルの『国内および国際書誌の理論』)、科学社会学( 1903年のジェームズ・マッキーン・キャッテルの『アメリカ心理学者の統計』 )など、さまざまな研究分野における科学的活動を定量的に分析するための利用可能な方法の1つでした。
初期の計量書誌学と計量科学は、単なる記述的なものではなく、科学のあるべき姿、そして科学がどのように進歩できるかについての規範的な見解を表明した。個々の研究者、科学機関、あるいは国家全体の業績を測定することが主要な目的であった。[ 15 ]ジェームズ・マッキーン・キャッテルの統計分析は、優生学的な含みを持つアメリカの研究者の大規模な評価、すなわち『アメリカの科学者』(1906年)の準備作業として機能した。この評価は、「星印をつけた学者の推定知名度に応じて個々の項目にアスタリスクを付けるという、驚くほど単純な評価システム」を備えていた。[ 11 ]

1910年以降、科学的業績の研究において、計量書誌学的アプローチは、他の定量的手法の一つではなく、ますます主要な焦点となっていった。[ 18 ] 1917年、フランシス・ジョセフ・コールとネリー・B・イールズは、出版物は「孤立した明確な作品であり、永続的でアクセス可能であり、評価可能であり、ほとんどの場合、いつ、どこで、誰が行ったかを確認し、その結果を方眼紙にプロットすることは難しくない」として、出版物の主要な統計的価値を支持した。[ 19 ] 5年後、エドワード・ウィンダム・ヒュームは この議論を拡張し、出版物は文明全体の標準的な尺度とみなせると論じた。「文明が、変化する環境のプラットフォーム上で機能する人間の精神の産物に過ぎないならば、書誌学は建造物の構造における柱であるだけでなく、この構造が絶えず受ける変化する力の尺度としても機能することができると言えるだろう。」[ 20 ]この出版への移行は限定的な影響しか及ぼさなかった。1970年代まで、科学活動の国内および国際的な評価では、あまりにも単純すぎるとみなされた「計量書誌指標は軽視され」、代わりに社会学的および経済的尺度が重視された。[ 21 ]
科学出版物が知識の尺度として高められた価値と、増加する学術雑誌の管理に図書館が直面する困難が、最初の引用索引の開発を促しました。[ 22 ] 1927年、P.グロスとEMグロスは、 1926年にアメリカ化学会誌(Journal of the American Chemical Society)が引用した3,633件の文献をまとめ、引用レベルに応じてジャーナルをランク付けしました。二人は、学術検索エンジンで現在も広く使用されている一連のツールと手法を開発しました。その中には、「ジャーナルの過去の業績よりも現在の傾向を第一に考慮すべき」という理由から、最近の引用にボーナスを付与する手法も含まれていました。 [ 23 ]しかし、測定対象となった学術環境は大きく異なっていました。化学の主要言語は、英語ではなくドイツ語で、全文献の50%以上を占めていました。[ 24 ]
同じ時期に、計量書誌学の基本的なアルゴリズム、測定基準、手法が、いくつかの無関係なプロジェクトで初めて特定されましたが、[ 25 ]それらのほとんどは、科学的生産の構造的不平等に関連していました。1960年にアルフレッド・ロトカは、Chemical AbstractsとGeschichtstafeln der Physikに掲載された著者による出版物の分析から生産性の法則を導入しました。つまり、n 件の論文を発表する著者の数は、1 件の出版物しか発表していない著者の数の 1/n^2 に等しいということです。[ 26 ] 1960年に、ロンドン科学博物館の主任司書であるサミュエル・ブラッドフォードは、書誌索引の作成経験から、散乱の法則を導き出しました。つまり、関連する研究を見つけるために参照する必要のある研究が増えるにつれて、科学雑誌で参考文献を検索することによる収穫逓減は指数関数的に起こるということです。ロトカの法則とブラッドフォードの法則はどちらも普遍性からは程遠く、むしろ欺瞞的なほど正確な方程式によって表された大まかなべき乗法則の関係を明らかにするものであるとして批判されてきた。[ 27 ]
第二次世界大戦後、科学出版物の管理とアクセスにおける課題の増大は、本格的な「定期刊行物危機」へと発展した。既存の雑誌は、大規模な科学プロジェクトによって急増する科学論文発表に対応できなかったのである。[ 28 ] [ 8 ]この問題は、1957年のスプートニクの打ち上げ成功後に政治的な意味を持つようになった。「スプートニク危機は、図書館員の書誌管理の問題を国家的な情報危機へと変えた。」[ 29 ]急速かつ劇的な変化を背景として、新たに出現した計量書誌学の分野は、学術出版の大規模な改革や、科学の未来に関するほぼユートピア的なビジョンと結びついた。1934年、ポール・オトレは、ビブリオメトリー(bibliométrie)またはビブリオロジー( bibliology)の概念のもと、テキストが社会に与える影響を測定する野心的なプロジェクトを提示した。1960年代以降に普及することになる計量書誌学の限定的な定義とは対照的に、オトレの構想は科学出版に限定されず、事実上、出版を基本単位とすることもなかった。オトレは、「テキストを原子要素、あるいは概念へと分解し、それらを書籍を構成する個々の段落(alinea、verset、articulet)の中に位置づけること」を目指した。[ 30 ] 1939年、ジョン・デズモンド・バーナルは科学アーカイブのネットワークを構想し、これは1948年に王立協会によって短期間検討された。「中央出版局に送られた科学論文は、査読者による編集委員会の承認を得てマイクロフィルム化され、その後、一種のオンデマンド印刷システムが稼働する」[ 31 ]計量書誌学の概念は用いなかったものの、バーナルはデレク・ジョン・デ・ソラ・プライスといったこの分野の先駆者たちに形成的な影響を与えた。
出現したコンピューティング技術は、大量の科学的成果物を読み取り、検索可能にする潜在的な解決策としてすぐに考えられました。1950年代から1960年代にかけて、索引付け技術に関する無秩序な実験の波が、コンピューティングによる研究検索の主要概念の急速な発展をもたらしました。[ 32 ] 1957年、IBMのエンジニアであるハンス・ペーター・ルーンは、「言葉によるアイデアの伝達は、統計的確率に基づいて行われる」として、統計に基づく単語頻度分析という影響力のあるパラダイムを導入しました。[ 33 ]英語以外の科学論文の自動翻訳も、書誌情報の自然言語処理に関する基礎研究に大きく貢献しました。というのも、この時期には、特にソビエト圏からの科学出版物をはじめ、かなりの量の科学出版物が英語で入手できなかったからです。ジョシュア・レーデバーグをはじめとする国立科学財団の有力メンバーは、ジョン・デズモンド・バーナルの思想に一部影響を受けた「集中型情報システム」 SCITELの構築を提唱した。このシステムは当初、印刷されたジャーナルと共存し、その効率性から徐々に完全に取って代わることになるだろう。 [ 34 ]レーデバーグが1961年11月にオイゲン・ガーフィールドに提示した計画では、集中型のデポジットによって年間最大100万件の科学論文が索引付けされる予定だった。このインフラストラクチャは、全文検索に加え、引用文献やその他のメタデータの索引付け、そして外国語論文の自動翻訳も確実に行う予定だった。[ 35 ]
1963年にスタンフォード研究所のダグ・エンゲルバートとチャールズ・ボーンによって開発されたオンライン検索システムの最初の実用的なプロトタイプは、これらの理論的仮定の実現可能性を証明しましたが、メモリの問題によって大きな制約を受けました。少数の文書の1万語以上しかインデックスを作成できませんでした。 [ 36 ]初期の科学計算インフラストラクチャは、医学のMEDLINE、宇宙工学のNASA/RECON、図書館検索のOCLC Worldcatなど、より具体的な研究分野に焦点を当てていました。「初期のオンライン検索システムのほとんどは書誌データベースへのアクセスを提供し、残りは百科事典記事、在庫データ、化合物など、別の種類の情報を含むファイルを使用していました。」[ 37 ]デジタル化されたコレクションが拡大するにつれて、テキスト分析のみに焦点を当てることは限界があることが判明しました。クエリで多数の結果が返される可能性があり、結果の関連性と正確性を評価することが困難でした。[ 38 ]
定期刊行物危機と索引検索技術の限界は、ユージン・ガーフィールドのScience Citation Indexのような計量書誌ツールと大規模引用索引の開発を促した。ガーフィールドの研究は当初、主にテキストワークの自動分析に焦点を当てていた。内部意味関係に主に焦点を当てたその後の研究とは対照的に、ガーフィールドは導入文や書誌参照といった「談話分析におけるメタテキストの重要性」を強調した。[ 39 ]文献レビューや書誌注記といった二次的な科学的成果物は、ジョン・デズモンド・バーナルの科学アーカイブ構想において既に中心的な役割を果たしていたように、ガーフィールドの構想においても中心的な位置を占めるようになった。[ 40 ] 1953年までに、ガーフィールドの関心は引用分析へと完全に移りました。シェパード引用索引の出版社の副社長であるウィリアム・C・アデアに宛てた私信の中で、「彼は自動索引の問題に対する、十分に試行された解決策を提案しました。それは、生物医学文献を『シェパード化』し、法廷の引用者が判決文を引用するのと同じように、引用リンクの糸をたどることで、その内容の束を解きほぐすことです。」[ 41 ] 1955年、ガーフィールドは科学引用索引の概要を示す画期的な論文「科学のための引用索引」を発表しました。[ 41 ]ガーフィールドが構想した一般引用索引は、もともとジョシュア・レーダーバーグの科学文献をコンピュータ化するという野心的な計画の構成要素の一つでした。[ 42 ]資金不足のため、この計画は実現しませんでした。[ 43 ] 1963年、ユージン・ガーフィールドは、当初レーダーバーグと構想していたプロジェクトを収益性の高い事業に変える目的で 科学情報研究所を設立しました。
計量書誌学の分野は、科学引用索引(Science Citation Index)の開発と並行して発展し、Science Citation Indexは、その基盤となるインフラとデータリソースとなった。[ 44 ]「20世紀初頭には研究を評価するために必要な手法が開発され、20世紀半ばには研究評価を促し促進する制度が発達した」。[ 45 ]この初期の分野に大きな影響を与えた人物には、ジョン・デスモンド・バーナル、ポール・オトレに加え、ロバート・K・マートンの科学社会学が挙げられる。これは倫理的な観点から再解釈された。マシュー効果、すなわち既に著名な研究者への注目が集まる現象は、もはや派生的なものではなく、通常の科学の特徴として捉えられるようになった。 [ 46 ]
ベルナルの後継者であるイギリスの科学史家デレク・ジョン・デ・ソラ・プライスは、計量書誌学の学問的形成に大きな影響を与えた。「デレク・プライスによる『バビロン以来の科学』(1961年)、『リトル・サイエンス、ビッグ・サイエンス』 (1963年)、『科学論文ネットワーク』(1965年)の出版により、科学計量書誌学はすでに健全な実証的・概念的ツールキットを利用できるようになった。」[ 44 ]プライスは計量書誌還元主義の提唱者であった。[ 47 ]フランシス・ジョセフ・コールとネリー・B・イールズが1917年に提唱したように、彼は出版物が科学の量的研究を展開するための最良の基準であると主張した。出版物は「レンガの山に似ている(…)」と述べ、技能と技巧によって築かれた知的建造物として永久に存在し、原始的な基盤の上に成り立っている。[ 48 ]プライスは、既存の膨大な書誌データを引用データに限定することで、この還元主義的なアプローチをさらに強化した。
プライスの枠組みは、ガーフィールドのものと同様、科学生産の構造的不平等を当然のこととしている。つまり、少数の研究者が論文の大きなシェアを生み出し、さらに少数の研究者がその後の研究に実際に測定可能な影響を与える(当時、4回以上引用されている論文はわずか2%だった)のである。[ 49 ]戦後の科学の空前の成長にもかかわらず、プライスは、ロバート・ボイルの時代のように最も価値のある研究を行っている目に見えないエリート科学者団が依然として存在し続けていると主張した。 [ 50 ]プライスは、そのようなエリートの支配を保証している権力関係を認識していたが、文献計量科学の研究には根本的な曖昧さがあり、学術出版と名声の集中を強調する一方で、既存の不平等を標準化するツール、モデル、および測定基準も生み出した。[ 50 ]科学引用索引の中心的な位置は、このパフォーマティブな効果を増幅させた。 1960年代末、ユージン・ガーフィールドは集中の法則を定式化しました。これは形式的にはサミュエル・ブラッドフォードの散乱の法則を再解釈したものですが、大きな違いがありました。ブラッドフォードが特定の研究プロジェクトの観点から語ったのに対し、ガーフィールドはその法則を科学出版全体に一般化しました。「すべての科学分野の中心となる文献は、最大1,000誌、場合によっては500誌程度の雑誌から構成されます。」この法則は、引用索引を実質的に中心となる雑誌の限られたサブセットに限定することを正当化するものでもあり、二流雑誌への拡大は収益減少をもたらすという根底にある仮定に基づいていました。[ 51 ]計量書誌学は、単に構造的な傾向やパターンを観察するのではなく、それらをさらに増幅し、階層化する傾向がある。「ガーフィールドの引用索引は、(…)世界の情報市場を支配する少数の多国籍企業が所有する、質の高い「必読」の国際ジャーナルによって作成された、階層化された科学文献の物語を論理的に完結させたであろう。」[ 52 ]
ガーフィールドとプライスの推進力により、計量書誌学は研究分野であると同時に、研究の量的政策評価の実験場にもなった。この2つ目の側面は、Science Citation Indexの主要な焦点ではなかったが、進歩的な発展を遂げてきた。有名なインパクトファクターは、もともと1960年代にガーフィールドとアーヴィング・シャーによって、 Current ContentsとScience Citation Indexに掲載される中核的なジャーナルを選択するために考案され、1975年以降にようやく定期的に発行されるようになった。 [ 53 ]この指標自体は、ジャーナルが過去1年間に受け取った引用数の合計と過去2年間の生産性との間の非常に単純な比率であり、一部の出版物の多産性を熟考するためのものである。[ 54 ]例えば、Natureの2017年のインパクトファクターは41.577であった。[ 55 ]
インパクトファクターのシンプルさは、科学機関、学術誌、資金提供者、評価者によって広く採用されている大きな要因であると考えられる。「ISI IFの改訂版や代替案はどれも、提唱者以外には広く受け入れられていない。おそらく、代替案とされるものは、元の指標ほどの解釈可能性を欠いているからだろう。」[ 56 ]
これらの簡略化された測定に加え、ガーフィールドは科学史と科学社会学の基礎研究の支援と資金提供を続けました。1964年に初版が出版された『科学史の記述における引用データの利用』は、DNAの発見の定量的再構築を含む、科学引用索引(Science Citation Index)の引用ネットワークを活用したいくつかの実験的ケーススタディをまとめています。[ 57 ]この分野への関心は、索引がトムソン・ロイターに売却された後も長く続きました。2001年には、ガーフィールドはアレクサンダー・プドフキンとウラジミール・S・イストミンと共同で開発した「アルゴリズム的歴史学」ソフトウェア、 HistCiteを発表しました。[ 58 ]

ワールド ワイド ウェブの発展とデジタル革命は、計量書誌学に複雑な影響を及ぼしました。
ウェブ自体とその主要構成要素(検索エンジンなど)の一部は、書誌計量理論の産物でした。当初は、高エネルギー物理学の特定のニーズのために欧州原子核研究機構( CERN)がティム・バーナーズ=リーに委託した書誌学的な科学基盤であるENQUIREから派生したものです。ENQUIREの構造は、データの内部ウェブに近いものでした。「ノード」は「人やソフトウェアモジュールなどを参照でき、作成、包含、記述などの様々な関係で連結できる」ものでした。[ 59 ] 1991年8月にワールド・ワイド・ウェブ・プロジェクトが初めて発表された当時、データとデータ文書の共有は、ワールド・ワイド・ウェブの初期のコミュニケーションにおいて主要な焦点でした。「WWWプロジェクトは、高エネルギー物理学者がデータ、ニュース、文書を共有できるようにするために開始されました。私たちは、ウェブを他の分野に広め、他のデータのためのゲートウェイサーバーを持つことに非常に関心を持っています。」[ 60 ]ウェブは、より高度なコンピューティング機能を備えていた既存のオンラインインフラストラクチャを急速に置き換えました。[ 61 ]ウェブの設計においてハイパーリンクに付けられた中核的な価値は、書誌計量学の資金提供者の直感を裏付けているようです。「1990年代半ばのワールドワイドウェブの出現により、ガーフィールドの引用主義者の夢が実現する可能性が高まりました。ハイパーテキストの世界的ネットワークでは、書誌的参照は科学論文の電子版内のハイパーリンクがとる可能性のある形式の一つであるだけでなく、ウェブ自体も引用構造を示しており、ウェブページ間のリンクは書誌的引用と形式的に似ています。」[ 62 ]その結果、計量書誌学の概念は主要なコミュニケーション技術、例えばGoogleの検索アルゴリズムに組み込まれました。「ウェブページ間のハイパーリンクのネットワークに適用される引用に基づく関連性の概念は、ウェブ検索エンジンがデジタル情報の無秩序な世界からユーザーが有用な資料を素早く見つけられるようにする方法に革命をもたらすだろう。」[ 63 ]
ウェブは計量書誌学の知的影響力を専門科学研究の域をはるかに超えて拡大した一方で、この分野の中核となる原則を打ち砕きました。ベルナルとオトレの壮大なユートピア的構想が部分的にインスピレーションを与えたのとは対照的に、Science Citation Indexは、ユーザーの観点だけでなく、コレクション索引の観点からも、常に閉鎖的なインフラとして構想されていました。プライスの「見えない大学」理論とガーフィールドの集中の法則の論理的帰結は、限られた数の中核科学雑誌にのみ焦点を当てることでした。ウェブの急速な拡大に伴い、様々な形態の出版物(特にプレプリント)、科学活動、そして科学コミュニティが突如として可視化され、それによって応用計量書誌学の限界が浮き彫りになりました。[ 64 ]書誌学的還元主義のもう一つの基本的な側面である引用のみに焦点を当てるという点も、代替データソースの増加と、1950年代初頭にガーフィールドが初めて構想した大規模な意味解析を復活させた前例のない全文コーパスへのアクセスによって、ますます脆弱になってきている。「リンクだけでは、書誌引用だけでは、Web上の重要なコミュニケーションパターンを特定するのに十分ではないように思われ、その統計分析は、今後数年間で、引用分析と同じ道を辿り、Web環境における他の新たな質的・量的視点との実りある連携を確立するだろう。」[ 65 ]
1990年代以降、ビブリオメトリクスと引用データおよび指標の商用ベンダーとの緊密な関係はより緊張したものになっている。大手科学出版社は出版事業以外にも活動を多様化し、「コンテンツ提供からデータ分析事業へ」と移行した。[ 66 ] 2019年までに、エルゼビアは科学研究のあらゆる側面と段階をカバーする大規模なプラットフォーム、ツール、データベース、指標のポートフォリオを買収または構築した。「学術ジャーナルの最大手サプライヤーは、研究の質と影響力の評価と検証(例:Pure、Plum Analytics、Sci Val)、潜在的な雇用主のための学術専門家の発掘(例:Expert Lookup5)、共同研究のための研究ネットワーキングプラットフォームの管理(例:SSRN、Hivebench、Mendeley)、資金調達のためのツールの管理(例:Plum X、Mendeley、Sci Val)、研究者のデータを分析・保存するためのプラットフォームの管理(例:Hivebench、Mendeley)も担当している。」[ 67 ]メトリクスと指標はこの垂直統合の重要な要素です。「エルゼビアがメトリクスベースの意思決定を提供するというさらなる動きは、知識生産プロセス全体へのさらなる影響力を獲得すると同時に、コンテンツの不均衡な所有権をさらに収益化するための動きでもあります。」[ 68 ]科学出版と科学データの新しい市場は、ソーシャルネットワーク、検索エンジン、その他のプラットフォーム資本主義のビジネスモデルと比較されてきました。 [ 69 ] [ 70 ] [ 71 ]コンテンツへのアクセスは無料ですが、データ抽出と監視を通じて間接的に支払われます。[ 72 ] 2020年、ラファエル・ボールは、書誌計量学者の研究が、非常に侵略的な形態の「監視資本主義」の出現に貢献するという暗い未来を思い描いた。科学者は「学業成績だけでなく、認識、行動、態度、外見、(主観的な)信頼性など、より包括的な画像を提供する一連のスコアを与えられることになるだろう。(中略)中国では、この種の個人データ分析はすでに実装されており、インセンティブとペナルティのシステムとして同時に使用されている。」[ 73 ]
研究指標に関するライデン宣言(2015年)は、科学的指標の商業提供者と計量書誌学コミュニティの間の亀裂の拡大を浮き彫りにした。署名者たちは、統制されていない指標に基づく評価と監視がもたらす潜在的な社会的損害を強調し、「科学計量学者、社会科学者、そして研究管理者として、私たちは科学的業績評価における指標の広範な誤用をますます懸念しながら見守ってきた」と述べた。[ 74 ]計量書誌学研究と研究評価に関するいくつかの構造改革が提案されており、定性評価への依存強化や「オープンで透明性があり、シンプルな」データ収集への依存などが含まれる。[ 74 ]ライデン宣言は計量書誌学/科学計量学/情報計量学において重要な議論を巻き起こし、一部の批評家は、定量的指標の精緻化は、商業プラットフォームや研究評価におけるそれらの誤用に対して何ら責任を負わないと主張している。[ 75 ]
歴史的に、計量書誌学的手法は学術雑誌の引用関係を追跡するために用いられてきました。文献の参照文書を調査する引用分析は、資料の検索とその価値分析に用いられます。 [ 76 ] Institute for Scientific InformationのWeb of Scienceなどの引用索引は、既知の論文から、その文献を引用しているより最近の出版物まで、時系列的に前方に検索することを可能にします。[ 3 ]
引用索引のデータを分析すれば、特定の記事、著者、出版物の人気や影響力を判断できる。[ 77 ] [ 78 ]例えば、引用分析を使って自分の仕事の重要性を測ることは、20世紀後半の採用活動では一般的だった。[ 79 ] [ 80 ]情報科学者はまた、引用分析を使って、特定分野の主要なジャーナルタイトルや画期的な出版物、異なる機関や学派の著者間の相互関係、学術社会学の関連データを定量的に評価する。この情報のより実用的な応用としては、回顧的書誌の計画(「ある分野で使われている資料の古さと、最近の出版物が古い出版物に取って代わっている程度の両方を示す」)、高引用頻度からアーカイブすべき文書を示すことなどがある。二次資料サービスのカバレッジを比較することで、出版社は自社の業績や競合状況を把握し、図書館員は「蔵書の有効性」を評価するのに役立つ。[ 81 ]引用データの価値には限界もある。引用データは不完全であったり偏っていたりすることが多く、引用索引も利用できるものの、データの大部分は手作業で収集されており(コストが高い)、出典の誤った引用は絶えず発生しているため、引用の根拠を真に理解し、自信を持って適用するためには、さらなる調査が必要である。[ 82 ]
文献計量分析は、例えば住宅価格に関する研究のホットトピックを理解するために使用できます。文献計量分析の結果によると、住宅価格の影響要因、需給分析、住宅価格への政策の影響、地方都市の動向などのキーワードが、住宅価格の研究文献によく見られます。最近の人気のキーワードには、回帰分析や住宅価格予測などがあります。米国は住宅価格研究の先駆者であり、確立された手段と手法がこの分野をリードしています。一方、発展途上国は革新的な研究アプローチを採用し、住宅価格研究において持続可能性にもっと重点を置く必要があります。研究によると、住宅価格と経済には強い相関関係があり、国内総生産、金利、通貨などのキーワードが経済関連のクラスター分析で頻繁に登場しています。[ 83 ]
計量書誌学は現在、学術成果の量的研究評価に使用されており、実践に基づく研究を脅かし始めている。[ 84 ]英国政府は、英国の大学の研究成果の質を評価し、評価結果に基づいて研究資金を割り当てるプロセスである研究優秀性枠組みにおいて、計量書誌学を補助ツールとして使用することを検討している。 [ 85 ]これはかなりの懐疑論に遭遇しており、パイロットスタディの後、現在のピアレビュープロセスに取って代わる可能性は低いと思われる。[ 86 ]さらに、学術研究の価値評価における計量書誌学の過度の使用は、新規性の低い大量の著作物を出版する(最小出版可能単位を参照)、数字を満たすために時期尚早な研究を出版する、科学的価値や著者の関心よりもトピックの人気度に焦点を当てるなど、さまざまな方法でシステムを悪用することを助長し、研究に悪影響を与えることが多い。 [ 87 ]これらの現象のいくつかは、研究評価に関するサンフランシスコ宣言を含む最近の多くのイニシアチブで対処されている。
経営学、 [ 88 ]教育学、[ 89 ]情報科学などの分野で学術研究に計量書誌学を使用するためのガイドラインが作成されています。 [ 90 ]その他の計量書誌学の応用としては、シソーラスの作成、用語頻度の測定、科学計量分析の指標として、テキストの文法的および統語的構造の調査、研究分野の難しさや柔らかさの特定、[ 91 ]読者による使用状況の測定、オンラインコミュニケーションメディアの価値の定量化、技術動向分析の文脈、[ 92 ]ジャカード距離の測定、クラスター分析、バイナリロジスティック回帰に基づくテキストマイニングなどがあります。[ 93 ] [ 94 ]
世界中のいくつかの図書館システムで大規模な契約がキャンセルされている状況において、 [ 95 ] Unpaywall Journalsのようなデータ分析ツールが図書館で大規模な契約のキャンセルを支援するために使用されています。図書館は、 PubMed Centralのようなオープンアーカイブを介してインスタントオープンアクセスですでに提供されている資料の購読を避けることができます。[ 96 ]

オープンサイエンス運動は、1960年代に計量書誌学の分野が出現して以来、計量書誌学が直面した最も重要な変革として認識されてきた。[ 97 ] [ 98 ]ウェブ上で多種多様な科学的成果が自由に共有されるようになったことで、データの定義と収集、インフラストラクチャ、指標など、あらゆるレベルで計量書誌学の実践に影響が及んだ。
科学引用索引(Science Citation Index)とデレク・デ・ソラ・プライスの還元主義理論を軸にこの分野が確立する以前、計量書誌学は、専門分野の枠を超えた知識共有の強化というユートピア的プロジェクトに大きく影響を受けてきた。ポール・オトレやジョン・デスモンド・ベルナルが構想した科学ネットワークは、ウェブの発展によって新たな意義を獲得した。「しかしながら、先駆者たちが上記の探究路線を追求した哲学的インスピレーションは、徐々に背景に消えていった。(…)ベルナルの貢献は最終的にオープンアクセス運動の中で理想的な継承を見出すことになるが、ガーフィールドとスモールによって始動した引用マシンは、根本的に経験的な性質を持つ分野別研究の急増をもたらした。」[ 99 ]
オープンサイエンス運動の初期段階では、文献計量分析と定量評価の標準的なツールを部分的に採用していました。「主要なOA宣言(ブダペスト、ベルリン、ベセスダ)においてメタデータへの言及がなかったことは、逆説的な状況をもたらしました。(…)OA支持者は、Web of Scienceの利用を通じて、有料論文と比較してアクセシビリティが引用の優位性にどれほどつながるかを示すことに熱心でした。」[ 100 ] 2000年以降、重要な文献計量分析の文献が、オープンアクセス出版物の引用の優位性に焦点を当てて出版されました。[ 101 ]
2000年代末までに、インパクトファクターをはじめとする指標は、権威あるアクセス不可能な情報源の体系的なロックインにますます責任を負わせるようになりました。ステヴァン・ハルナドをはじめとするオープンサイエンス運動の主要人物は、「オンライン、フルテキスト、オープンアクセスのデジタルアーカイブの増加によって可能になった豊富な利用指標とインパクト指標を活用する」オープンアクセス科学計量学の創設を訴えました。[ 102 ]オープンサイエンスの一般大衆が学術界を超えて拡大するにつれて、新しい指標は「科学研究のより広範な社会的影響を測定する」ことを目指すべきでしょう。[ 103 ]
オルトメトリクスの概念は、2009年にキャメロン・ネイロンとシャーリー・ウーによって論文レベルのメトリクスとして導入されました。[ 104 ]主要なメトリクスがジャーナル(インパクトファクター)や、より最近では個々の研究者(h指数)に焦点を当てているのとは対照的に、論文レベルのメトリクスは個々の出版物の流通を追跡することを可能にします。「かつては棚に置かれていた論文が、今ではMendeley、CiteULike、Zoteroにあり、そこで確認したり数えたりすることができます。」[ 105 ]そのため、それらはオープンサイエンスを特徴づける出版戦略の多様性とより互換性があります。プレプリント、レポート、さらにはデータセットやソフトウェアなどの非テキスト出力にも、関連するメトリクスがある場合があります。[ 103 ]ネイロンとウーは、当初の研究提案では、ZoteroやMendeleyなどの文献管理ソフトウェアからのデータの使用を支持していました。[ 104 ]オルトメトリクスの概念は進化し、「ブログ、Twitter、ResearchGate、Mendeleyなどのソーシャルメディアアプリケーションから」抽出されたデータも含まれるようになりました。[ 103 ] Mendeleyのような専門的な学術ツールが、主要な科学出版社によって開発された独自のエコシステムに統合されるようになったため、ソーシャルメディアの情報源は特に長期的に信頼性が高いことが証明されました。2010年代に登場した主要なオルトメトリクス指標には、Altmetric.com、PLUMx、ImpactStoryなどがあります。
オルトメトリクスの意味が変化するにつれ、指標のプラスの影響に関する議論は、オープンサイエンス・エコシステムにおける再定義へと発展しました。「指標の誤用とその解釈に関する議論は、指標自体をオープンサイエンスの実践の中心に据えました。」[ 106 ]オルトメトリクスは当初、オープンサイエンス出版物とその学術界を超えた普及のために考案されましたが、オープンメトリクスの新たな要件との適合性は疑問視されています。特にソーシャルネットワークデータは、透明性と容易なアクセス性に欠けています。[ 107 ] [ 108 ] 2016年、ウルリッヒ・ハーブは、主要な出版物の指標をオープンサイエンスの原則に照らして体系的に評価した論文を発表し、「引用に基づくインパクトメトリクスも代替指標も、オープンメトリクスと呼ぶことはできない。いずれも科学的根拠、透明性、検証可能性を欠いている」と結論付けました。[ 109 ]
| メトリック | プロバイダー | 出典 | 無料アクセス | データアクセス | オープンデータ | オープンソフトウェア |
|---|---|---|---|---|---|---|
| ジャーナルインパクトファクター | クラリベイト | 引用文献(Web of Science) | いいえ | いいえ | いいえ | いいえ |
| SCImagoジャーナルランク | エルゼビア | 引用文献(Scopus) | はい | はい | いいえ | いいえ |
| 切り取り線 | エルゼビア | 引用文献(Scopus) | はい | はい | いいえ | いいえ |
| 固有因子 | クラリベイト | 引用文献(Web of Science) | はい | いいえ | いいえ | いいえ |
| Googleジャーナルランキング | Google Scholar | 引用(Google) | はい | いいえ | いいえ | いいえ |
| h指数 | クラリベイト | 引用文献(Web of Science) | いいえ | いいえ | いいえ | いいえ |
| h指数 | エルゼビア | 引用文献(Scopus) | いいえ | いいえ | いいえ | いいえ |
| h指数 | Google Scholar | 引用(Google) | はい | いいえ | いいえ | いいえ |
| アルトメトリクス | PLUMアナリティクス | さまざまな情報源 | いいえ | いいえ | いいえ | いいえ |
| アルトメトリクス | Altmetric(マクミラン) | さまざまな情報源 | 部分的 | いいえ | いいえ | いいえ |
| アルトメトリクス | プロス | さまざまな情報源 | はい | はい | 部分的(独自のデータを含む) | はい |
| アルトメトリクス | インパクトストーリー | さまざまな情報源 | はい | はい | 部分的(独自のデータを含む) | はい |
| オープン引用データ | OpenCitationsコーパス | さまざまな情報源 | はい | はい | はい | はい |
ハーブは、まだ開発されていないオープンメトリクスのための代替プログラムを提示した。[ 111 ] [ 112 ]主な基準は以下の通りである。
この定義は、ROSI(オープン科学計量指標の参照実装)などの研究プログラムに実装されています。 [ 113 ] 2017年、欧州委員会のAltmetrics専門家グループは、ウルリッヒ・ハーブのオープンメトリクス・プログラムを、新しいコンセプトである次世代メトリクスの下で拡張しました。これらのメトリクスは、「オープンで透明性のあるリンクされたデータインフラストラクチャ」によって管理されるべきです。[ 114 ]専門家グループは、すべてを測定する必要があるわけではなく、すべてのメトリクスが関連性があるわけではないことを強調しています。「重要なものを測定する:次世代のメトリクスは、最も簡単に収集および測定できるものではなく、ヨーロッパ社会が最も価値を置き、指標を必要とする品質と影響から始めるべきです。」[ 114 ]
2010年代まで、オープンサイエンス運動の影響は主に科学出版物に限られていました。「新しい形の知識基盤の設計において、社会構造と体系的な制約の重要性が軽視される傾向がありました。」[ 115 ] 1997年、ロバート・D・キャメロンは、科学コミュニケーションの状況を完全に変えるであろう引用のオープンデータベースの開発を呼びかけました。[ 116 ]
出版形態を問わず、これまでに書かれたあらゆる学術論文と、それを引用するすべての論文、そしてそれを引用するすべての論文をリンクする、普遍的な書誌・引用データベースを想像してみてください。そして、そのような引用データベースがインターネット上で無料で利用可能で、その日に出版されたすべての新しい論文(従来のジャーナルや電子ジャーナルの論文、会議論文、学位論文、技術報告書、ワーキングペーパー、プレプリントなど)で毎日更新されると想像してみてください。
CiteSeerのようなオープンアクセス論文に特化したインデックスの開発にもかかわらず、Science Citation Index に代わる大規模なオープンな代替手段は実現に至らなかった。引用データの収集は、Scientific Citation Index の直系の後継であるWeb of Scienceのような大規模な商業組織によって依然として支配されていた。この結果、オープンリソースという新興のエコシステムは学術ネットワークの周縁に留まることとなった。「リソースの共通プールは、現在の学術コモンズ・イニシアチブによって統制・管理されていない。専用のハードインフラはなく、新興コミュニティは存在するかもしれないが、正式なメンバーシップは存在しない。」[ 117 ]
2015年以降、オープンサイエンスのインフラ、プラットフォーム、ジャーナルは、デジタル・アカデミック・コモンズの創出へと収束し、サービスと標準の共有エコシステムを中心に構造化が進み、インフラ間の依存関係のネットワークを通じて標準が確立されてきました。この動きは、主要なプロプライエタリ・データベースに対する批判的な姿勢の高まりから生じています。2012年には、研究評価に関するサンフランシスコ宣言(DORA)において、「資金提供、採用、昇進の決定におけるジャーナルのインパクトファクターの利用を終わらせる」ことが求められました。[ 118 ]研究指標に関するライデン宣言(2015年)では、「オープンで透明性があり、シンプルな」データ収集の発展が推奨されました。[ 74 ]
学術界と非学術界の主体が協力して知識コモンズの創設と維持に取り組んでいることは、オープン引用データのための新しいインフラ構築の決定的な要因となっている。2010年以来、オープン引用データのデータセットであるOpen Citation Corpusが、様々なオープンアクセスソース(PLOSやPubmedを含む)から複数の研究者によって収集されてきた。[ 119 ]このコレクションは、ウィキメディアプロジェクトであるWikidataが直面したデータアクセシビリティの問題に対応して2017年に開始されたInitiative for OpenCitationsの最初の中核となった。ウィキメディア財団の研究責任者であるDario Taraborelli氏が行った会議では、Crossrefの論文のうち、引用メタデータが無料で利用できるのはわずか1%であり、Wikidataに保存されている参考文献には非フリーデータの非常に大きなセグメントを含めることができなかったことが示された。このカバレッジは、エルゼビアが最終的に2021年1月にこのイニシアチブに参加したときに、記録された論文の半分以上に拡大した。[ 120 ]
2021年以降、OpenAlexは科学メタデータの主要なオープンインフラストラクチャとなっています。当初は廃止されたMicrosoft Academic Graphの代替として作成され、2022年には2億1,300万人の著者による2億900万件の学術論文と、それらに関連する機関、会場、概念を、セマンティックウェブ(およびWikidata )に統合されたナレッジグラフに索引付けしました。[ 121 ] Microsoft Academic Graph(MAG)から適切に移行された大規模なデータと広範なカバレッジにより、OpenAlexは「2021年以前の出版年度については、MAGと同等かそれ以上に計量書誌分析に適していると思われる」とされています。[ 122 ] 2023年に行われた科学索引におけるデータジャーナルの網羅性に関する研究では、OpenAlexはDimensionsとともに「WoSとScopusという2つのより伝統的なデータベースに対して大きな優位性を持っている」[ 123 ]ことが判明し、全体として書籍のような非ジャーナル出版物や[ 124 ]非西洋諸国の研究者による[ 125 ]索引作成に特に適していることがわかった。
科学データのオープン化は、計量書誌学および科学計量学コミュニティにおける主要な議論の的となっており、広範囲にわたる社会的・知的影響を及ぼしてきました。2019年、『Journal of Infometrics』の科学委員会全員が辞任し、新たなオープンアクセスジャーナル『Quantitative Science Studies』を創刊しました。このジャーナルは2007年からエルゼビア社によって発行されており、委員会メンバーはオープン引用データのオープン共有の進展の遅れにますます批判的になっていました。「私たちの分野は高品質の科学メタデータに依存しています。科学をより堅牢で再現性の高いものにするためには、これらのデータは可能な限りオープンでなければなりません。そのため、私たちの編集委員会は、エルゼビア社がオープン引用イニシアチブ(I4OC)への参加を拒否したことに深く懸念を抱いていました。」[ 126 ]
このセクションの文体やスタイルは、Wikipedia で使用されている百科事典的な文体を反映していない可能性があります。より良い記事を書くための( 2025年9月) |
幅広い科学成果物(出版物、データ、ソフトウェア、会議、レビューなど)がかつてないほど容易に入手できるようになったことで、計量書誌学プロジェクトは劇的に再定義されました。オープンサイエンスの領域に根ざした新たな代替研究においては、1960年代にガーフィールドとプライスによって定義された計量書誌学の原則を再考する必要があります。重要なジャーナルの限定的なコーパスを事前に選定することは、必ずしも必要でも適切でもありません。2019年、マチルダ・プロジェクトの提唱者は、「既存の閉鎖的な情報を単に「公開」するのではなく、「すべてのテキストは平等に生まれる」という考え方に基づき、これまでツールから除外されてきた学術コンテンツ全体に公平な地位を取り戻したい」と考えています。[ 127 ]彼らは、科学コーパスの探索とマッピングに焦点を当てることで、「計量書誌学ツールを技術として再定義する」ことを目指しています。[ 128 ]
科学における包括性の問題と構造的不平等へのより批判的なアプローチは、特にジェンダー不均衡との関連で、科学計量学と文献計量学においてより一般的になってきた。[ 129 ] [ 130 ] [ 131 ] 2020年以降、この分野で最も白熱した議論の一つ[ 132 ]は、基礎物理学におけるジェンダー不均衡に関する研究の受容をめぐって展開された。[ 133 ]
ビブリオメトリクス、サイエントメトリクス、インフォメトリクスの定義の構造的変化により、代替ラベルの必要性が生じている。定量科学研究(Quantitative Science Studies)という概念は、もともと2000年代後半に、古典的なビブリオメトリクスの知見に対する新たな批判的評価の文脈で導入された。[ 134 ]この概念は2010年代後半にさらに普及した。エルゼビア社を離れた後、 Journal of Infometricsの編集者はこの新しいラベルを選択し、定量科学研究のためのジャーナルを創刊した。最初の社説では、計量に関する言及をすべて削除し、科学の科学に関する定量的研究と定性的研究をより幅広く包含することを目指した。
科学計量学、科学の科学、メタサイエンスといった専門分野に身を置く方々が、QSSに居場所を見出せることを願っています。また、科学を研究対象とする分野は多岐にわたります。科学史家、科学哲学者、科学社会学者の皆様を本誌に歓迎いたします。「定量的」という名称を冠しながらも、幅広い認識論的視点を包含しています。定量科学研究は単独では機能しません。確固とした実証研究には、あらゆるメタサイエンスの理論と洞察の統合が不可欠です。[ 135 ]
{{cite book}}: CS1 maint: 発行者の所在地 (リンク){{cite journal}}:ジャーナルを引用するには|journal=(ヘルプ)が必要です