| 情報マッピング |
|---|
| トピックと分野 |
| ノード・リンクアプローチ |
| 参照 |
ビジュアルアナリティクスは、情報視覚化と科学的視覚化から生まれた学際的な科学技術分野です。インタラクティブなビジュアルインターフェースによって分析的推論をいかに促進できるかに焦点を当てています。[ 1 ]
ビジュアル分析とは、「対話型のビジュアルインターフェースによって促進される分析的推論の科学」です。[ 2 ]問題の大きさや複雑さ、人間と機械の密接な連携による分析の必要性から、他の方法では解決が困難になるような問題にも対処できます。[ 3 ]ビジュアル分析は、分析的推論、人間とコンピュータの相互作用、データ変換、計算と分析のための視覚的表現、分析レポート、新技術の実用化など、複数の領域にわたって科学技術の発展を促進します。[ 4 ]研究課題として、ビジュアル分析は、コンピュータサイエンス、情報視覚化、認知科学と知覚科学、対話型デザイン、グラフィックデザイン、社会科学など、複数の科学技術コミュニティを結集しています。
ビジュアルアナリティクスは、新しい計算および理論に基づくツールを革新的なインタラクティブ技術と視覚表現と統合し、人間と情報の対話を可能にします。これらのツールと技術の設計は、認知、デザイン、そして知覚の原理に基づいています。この分析的推論の科学は、脅威の分析、予防、そして対応のための戦略的かつ戦術的なビジュアルアナリティクス技術を構築するための推論フレームワークを提供します。分析的推論は、人間の判断を適用して証拠と仮定の組み合わせから結論を導き出すというアナリストのタスクの中心です。[ 2 ]
ビジュアルアナリティクスは、情報視覚化や科学的視覚化と目標や手法において一部重複する部分があります。現在、これらの分野の境界については明確なコンセンサスはありませんが、大まかに言えば、これら3つの領域は以下のように区別できます。
ビジュアルアナリティクスは、情報視覚化の技術と、計算によるデータの変換および分析の技術を融合させることを目指しています。情報視覚化は、ユーザーと機械の直接的なインターフェースの一部を形成し、人間の認知能力を6つの基本的な方法で強化します。[ 2 ] [ 5 ]
これらの情報視覚化機能は、計算データ分析と組み合わせることで、分析的推論に適用され、意味付けプロセスをサポートできます。
ビジュアルアナリティクスは学際的なアプローチであり、情報視覚化、認知科学、コンピュータサイエンスにそのルーツを持っています。この分野の用語と範囲は、2000年代初頭にジム・トーマス、クリスティン・A・クック、ジョン・スタスコ、パク・チュン・ウォン、ダニエル・A・ケイム、デイビッド・S・エバートといった研究者によって定義されました。 2001年9月11日の同時多発テロへの対応として、2002年後半には、それまで分散していた数十の政府機関を統合して米国国土安全保障省が設立されました。これは、1990年代後半にダニエル・A・ケイムが開始したビジュアルデータマイニングに関する研究を基に、ビジュアルアナリティクスの研究課題の発展にもつながりました。 [ 6 ] [ 7 ]こうした取り組みの一環として、パシフィック・ノースウエスト国立研究所に国立可視化・分析センター (NVAC)が2004年に設立された。同センターの使命は、2001年9月11日の同時多発テロ事件後に諜報機関に生じた情報過多を緩和するシステムを開発することだった。同センターの研究活動によって中核となる課題が特定され、未解決の研究課題が提示され、特に2005年の研究アジェンダ「道を照らす」を通じて、ビジュアル分析が新たな研究領域として位置付けられた。[ 2 ] 2006年、 Pak Chung WongとDaniel A. Keim が率いるIEEE VISコミュニティは、毎年開催されるIEEE Conference on Visual Analytics Science and Technology(VAST)を立ち上げ、ビジュアル分析の研究専用の場を提供した。このVASTは2020年に統合されてIEEE Visualization conferenceとなった。2008年、 Daniel A. KeimとJim Thomasが、ビジュアルデータマイニングに関する影響力のある著書の中で、ビジュアル分析の範囲と課題を概念的に定義した。[ 8 ]この領域は、2000年代後半に欧州委員会のFP7 VisMasterプログラムの一環としてさらに改良されました。 [ 9 ]
ビジュアルアナリティクスは、以下の重点分野を含む学際的な分野です。[ 2 ]
分析的推論技術は、ユーザーが状況評価、計画、意思決定を直接的に支援する深い洞察を得るための方法です。ビジュアル分析は、アナリストの限られた時間の中で、質の高い人間の判断を促進する必要があります。ビジュアル分析ツールは、以下のような多様な分析タスクを可能にする必要があります。[ 2 ]
これらのタスクは、個人分析と共同分析の組み合わせによって、しばしば極度の時間的プレッシャーの下で実施されます。ビジュアル分析は、仮説ベースおよびシナリオベースの分析手法を可能にし、アナリストが利用可能な証拠に基づいて推論を行うためのサポートを提供する必要があります。[ 2 ]
データ表現は、コンピュータベースの変換に適した構造化された形式です。これらの構造は、元のデータ内に存在するか、データ自体から導出可能でなければなりません。また、元のデータに含まれる情報や知識の内容、関連するコンテキストを可能な限り保持する必要があります。基礎となるデータ表現の構造は、一般的にビジュアル分析ツールのユーザーにとってアクセスしやすくも直感的にも分かりにくいものです。データ表現の構造は、元のデータよりも複雑な場合が多く、必ずしも元のデータよりも小さいとは限りません。データ表現の構造は数百または数千の次元を含み、人間には理解できない場合もありますが、視覚化と分析のために低次元の表現に変換可能でなければなりません。[ 2 ]
視覚化の理論には以下のものがある: [ 3 ]
視覚的表現は、データを目に見える形に変換し、共通点や異常点などの重要な特徴を強調します。これらの視覚的表現により、ユーザーはデータの重要な側面を素早く容易に認識できます。視覚的表現を介した知覚的推論で認知的推論プロセスを補強することで、分析的推論プロセスをより迅速かつ的確に行うことができます。[ 2 ]
ビジュアル分析プロセスで使用されるデータ セットへの入力は、異種データ ソース (インターネット、新聞、書籍、科学実験、エキスパート システムなど) です。これらの豊富なソースからデータ セットS = S 1、...、S mが選択されますが、各S i、 i ∈ (1、...、m)は属性A i1、...、A ikで構成されます。プロセスの目標または出力は洞察Iです。洞察は、作成された視覚化のセットVから直接取得されるか、自動化された分析手法の結果としての仮説Hの確認を通じて得られます。このビジュアル分析プロセスの形式化を次の図に示します。矢印は、1 つのセットから別のセットへの移行を表します。
より正式には、視覚分析プロセスは変換F: S → Iですが、Fは次のように定義される 関数f ∈ {D W、 V X、 H Y、 U Z }の連結です。
D W は、データ セットに分析機能を適用するために必要なデータ変換関数D T 、データ クリーニング関数D C 、データ選択関数D SL、およびデータ統合関数D Iを含む、D W : S → S およびW ∈ {T、C、SL、I}を使用した基本的なデータ前処理機能について説明します。
V W , W ∈ {S, H}は視覚化関数を表します。これは、データV S : S → Vを視覚化する関数、または仮説V H : H → Vを視覚化する関数のいずれかです。
H Y , Y ∈ {S, V}は仮説生成プロセスを表します。データから仮説を生成する関数H S : S → Hと、可視化から仮説を生成する関数H V : V → Hを区別します。
さらに、ユーザーインタラクションU Z , Z ∈ {V, H, CV, CH}は、ビジュアル分析プロセスの不可欠な要素です。ユーザーインタラクションは、視覚化U V : V → Vのみ(つまり、選択またはズーム)に影響を与えることも、既存の仮説から新しい仮説を生成することで仮説U H : H → Hのみに影響を与えることもできます。さらに、視覚化U CV : V → Iまたは仮説U CH : H → Iから洞察を導き出すことができます。
データクリーニング、データ統合、データ変換機能を適用する典型的なデータ前処理は、D P = D T (D I (D C (S 1 , ..., S n )))と定義されます。前処理ステップの後、自動分析手法HS = {f s1 , ... , f sq }(統計、データマイニングなど)または視覚化手法VS : S → V、VS = {f v1 , ..., f vs }がデータに適用され、上図に示すようなパターンが明らかになります。[ 11 ]
一般に、データの処理には次のパラダイムが使用されます。
最初に分析する – 重要な部分を表示する – ズーム、フィルタリングしてさらに分析する – 必要に応じて詳細を表示する[ 8 ]