

レーダーチャートは、多変量データを2次元チャートの形で表示するグラフィカルな手法です。3つ以上の定量変数を同じ点から始まる軸上に表します。軸の相対的な位置や角度は通常、情報としてはあまり役に立ちませんが、データを最大面積としてプロットするアルゴリズムなど、様々なヒューリスティックを適用することで、変数(軸)を相対的な位置に並べ替え、明確な相関関係、トレードオフ、その他多くの比較指標を明らかにすることができます。[1]
レーダーチャートは、ウェブチャート、スパイダーチャート、スパイダーグラフ、スパイダーウェブチャート、スターチャート、[2] スタープロット、クモの巣チャート、不規則多角形、極座標チャート、キヴィエット図とも呼ばれます。[3] [4]これは、軸が放射状に配置された 平行座標プロットに相当します。
概要
レーダーチャートは、等角のスポーク(半径)の列で構成されるチャートまたはプロットであり、各スポークは変数のいずれかを表します。スポークのデータ長は、そのデータポイントにおける変数の大きさ(全データポイントにおける変数の最大大きさに対する相対値)に比例します。各スポークのデータ値を結ぶ線が描かれます。これによりプロットは星のような外観になり、このプロットの一般的な名称の1つはここから来ています。スタープロットは、以下の質問に答えるために使用できます。[5]
- どの観測値が最も類似しているか、すなわち観測値のクラスターがあるか?(レーダーチャートは、単一のデータポイントの相対的な値(例えば、ポイント3は変数2と4では大きく、変数1、3、5、6では小さい)を調べ、類似点や非類似点を見つけるために使用されます。)[5]
- 外れ値はありますか?
レーダーチャートは、任意の数の変数を持つ多変量観測値を表示するのに便利な方法です。 [6] それぞれの星は1つの観測値を表します。通常、レーダーチャートは複数のプロット形式で生成され、各ページには多数の星があり、それぞれの星は1つの観測値を表します。[5]星型プロットは、1877年にゲオルク・フォン・マイヤーによって初めて使用されました。[7] [8]レーダーチャートは、すべての変数がプロットされた星型図を構成するために使用される点で、グリフプロットとは異なります。前景変数と背景変数は分離されていません。代わりに、星型の図は通常、ページ上に長方形の配列で配置されます。観測値が任意の順序で並べられていない場合(変数が意味のある順序で星の線に割り当てられている場合)、データのパターンを確認するのがいくらか容易になります。[9]
アプリケーション

スポーツにおいて、レーダーチャートは選手の長所と短所を図表化するために用いられる[10]。これは、チャートの中心軸に沿って追跡可能な、選手に関する様々な統計値を計算するものである。例としては、バスケットボール選手のシュート数、リバウンド数、アシスト数など、あるいは野球選手のバッティングやピッチングの統計値などが挙げられる。これにより、選手の長所と短所が一元的に視覚化され、他の選手の統計値やリーグ平均と重ね合わせることで、選手の得意分野と改善の余地がある分野を表示することができる。[11]選手の長所と短所に関するこうした洞察は、コーチやトレーナーが選手のトレーニング計画を調整して弱点を改善できるようにすることを可能にするため、選手育成にとって非常に重要であることが証明される。レーダーチャートの結果は、状況に応じたプレーにも役立つ。ある打者が左投手に対して打撃成績が悪いと判明した場合、その打者のチームは左投手との対戦での打席数を制限すべきであると知っており、一方、相手チームは打者がその投手に対して打たざるを得ない状況を作ろうとするかもしれない。

レーダーチャートのもう1つの用途は、コンピュータプログラム、[12] 、コンピュータ、電話、自動車など、さまざまなオブジェクトのパフォーマンスメトリクスを表示して品質改善を管理することです。コンピュータプログラマーは、多くの場合、分析を使用して自分のプログラムと他のプログラムのパフォーマンスをテストします。レーダーチャートが役立つ例として、さまざまなソートアルゴリズムのパフォーマンス分析が挙げられます。プログラマーは、選択、バブル、クイックなど、いくつかの異なるソートアルゴリズムを収集し、速度、メモリ使用量、電力使用量を測定することでこれらのアルゴリズムのパフォーマンスを分析し、それらをレーダーチャートにグラフ化して、さまざまなデータサイズで各ソートのパフォーマンスを確認することができます。もう1つのパフォーマンスアプリケーションは、同様の車同士のパフォーマンスを比較測定することです。消費者は、車の最高速度、1ガロンあたりのマイル数、馬力、トルクなどの変数を確認できます。次に、レーダーチャートを使用してデータを視覚化した後、結果に基づいて最適な車を決定できます。

レーダーチャートは、生命科学において、医薬品などの長所と短所を示すために用いられます。[13] 2種類の抗うつ薬を例に挙げると、研究者は効能、副作用、コストなどの変数を1から10のスケールでランク付けすることができます。そして、レーダーチャートを用いて結果をグラフ化し、変数の分布状況や差異を把握することができます。例えば、一方の抗うつ薬は安価で即効性があるものの、時間の経過とともに大きな緩和効果が得られないなどです。一方、もう一方の抗うつ薬はより強い緩和効果があり、長期間持続しますが、より高価です。生命科学におけるもう一つの応用は、患者分析です。レーダーチャートは、人の健康に影響を与える生活上の変数をグラフ化し、分析することで、患者の健康状態を改善するために用いられます。より具体的な例としては、アスリートが睡眠、食事、ストレスなど、様々な健康習慣をモニタリングし、最高の体調を維持できるようにすることが挙げられます。[14]何らかの領域で低下が見られた場合、医師やトレーナーが介入してアスリートを支援し、健康状態を改善することが可能となります。
制限事項
レーダー チャートは、外れ値や共通性を明確に示す場合、または 1 つのチャートが他のチャートよりもすべての変数で優れている場合に適しています。また、各変数がある点で「優れている」ことに対応し、すべての変数が同じスケール上にある順序測定に主に使用されます。
逆に、レーダーチャートは、あるチャートが他のチャートよりもいくつかの変数では優れているが、他の変数では劣っている場合など、トレードオフの決定を下すのにはあまり適していないと批判されてきました。[15]
さらに、同心円はグリッド線として役立ちますが、放射状の距離を判断するのが難しいため、異なるスポークの長さを視覚的に比較することは困難です。代わりに、特に時系列の場合は、単純な折れ線グラフを使用するとよいでしょう。[16]
レーダーチャートでは、特に領域が塗りつぶされている場合、データがある程度歪むことがあります。これは、含まれる領域が線形測定値の2乗に比例するためです。例えば、1から100までの範囲の5つの変数を持つチャートでは、すべての測定値が90の場合、5つのポイントで囲まれた多角形に含まれる領域は、すべての値が82の場合の同じチャートよりも10%以上大きくなります。
また、レーダー チャートでは、図 5 に示すように、線や領域が互いに重なり合って値が近い場合、チャート上の異なるサンプルを視覚的に比較することが難しくなることがあります。
人工構造物
レーダー チャートはデータにいくつかの構造を課しますが、多くの場合、それらは人工的です。
- 隣接変数の関連性 - レーダー チャートは、隣接変数が関連しておらず、偽の接続を作成する場合によく使用されます。
- 循環構造 - 最初の変数と最後の変数が隣り合って配置されます。
- 長さ – 変数は多くの場合、最も自然な順序付けになります。つまり、良いか悪いかですが、差異の程度は人為的である可能性があります。
- 面積 – 面積は値の2乗に比例するため、大きな数値の影響が強調されます。例えば、2, 2は1, 1の4倍の面積を占めます。これは面積グラフに共通する問題であり、面積の判定は困難です。「クリーブランドの階層」を参照してください。[17] [18]
たとえば、9、1、9、1、9、1 という交互のデータは、スパイク状のレーダー チャート (上昇と下降を繰り返します) を生成しますが、データを 9、9、9、1、1、1 と並べ替えると、2 つの異なるくさび形 (セクター) が生成されます。
場合によっては、自然な構造があり、レーダーチャートが適していることがあります。例えば、24時間周期で変化するデータの図では、1時間ごとのデータは隣接するデータと自然に関連し、周期的な構造を持つため、レーダーチャートとして自然に表示できます。[16] [19] [20]
レーダーチャート(あるいはそれに近い「極座標グラフ」)の使用に関するガイドラインの1つは次のとおりです。[20]
- 共通のスケールに沿った位置ではなく、積み重ねられた領域を読むことを気にしない(クリーブランドの階層を参照)。
- データセットは線形ではなく、真に循環的であり、
- 比較するシリーズが2つあり、一方は他方よりもはるかに小さい
データセットのサイズ
レーダーチャートは、小規模から中規模の多変量データセットに役立ちます。主な弱点は、その効果が数百ポイント未満のデータセットに限られることです。それを超えると、レーダーチャートは扱いにくくなりがちです。[5]
さらに、複数のディメンションまたはサンプルを含むレーダー チャートを使用する場合、サンプルの数が増えるにつれてレーダー チャートが乱雑になり、解釈が難しくなる可能性があります。
例えば、MLB 2021年MVPの大谷翔平選手と、リーグの平均的な指定打者や殿堂入り選手の成績を比較した打撃成績表を見てみましょう。これらの統計は、選手の打席あたりのヒット、ホームラン、三振などの割合を表しています。表で使用されている各統計が何を表しているかについては、MLBのこちらの資料を参照してください。[21]以下の表を使用して、2021年MVPの打撃成績を、指定打者と通常の打者のリーグ平均と比較したレーダーチャートを作成し、パフォーマンス指標を視覚化し、翔平選手が平均的な選手よりも優れた成績を収めたという結論を視覚的に導き出します。次に、殿堂入り選手のジャッキー・ロビンソン選手、ジム・トーミ選手、フランク・トーマス選手を使って、レーダーチャートに追加のサンプルを含め、翔平選手を史上最高の打者と比較します。このレーダー チャートは、翔平選手が歴代トップ選手とどのように比較されるかを直感的に把握できるだけでなく、レーダー チャートにサンプルが多すぎる場合の限界を示すのにも役立ちます。
| ターゲット | 学士 | 出塁率 | スラング | オペレーション | 心拍数% | それで% | BB% |
|---|---|---|---|---|---|---|---|
| メジャーリーグ | 0.244 | 0.317 | 0.411 | 0.728 | 0.037 | 0.232 | 0.087 |
| DH | 0.239 | 0.316 | 0.434 | 0.75 | 0.047 | 0.256 | 0.093 |
| 大谷翔平 | 0.257 | 0.372 | 0.592 | 0.965 | 0.086 | 0.296 | 0.15 |
| ジャッキー・ロビンソン | 0.313 | 0.41 | 0.477 | 0.887 | 0.0282 | 0.0582 | 0.151 |
| ジム・トーミ | 0.276 | 0.402 | 0.554 | 0.956 | 0.072 | 0.302 | 0.207 |
| フランク・トーマス | 0.301 | 0.419 | 0.555 | 0.974 | 0.063 | 0.17 | 0.203 |
図10を見ると、スポークとサンプルの数が比較的少ない場合、レーダーチャートの解釈が容易であることがわかります。図11のように、レーダーチャートに塗りつぶし領域がない場合でも、より多くのサンプルを比較すると、解釈やトレードオフの判断がいかに困難になるかが明らかになります。
例


右の図[5]には15台の車 のスタープロットが含まれています。サンプルのスタープロットの変数リストは次のとおりです。
- 価格
- 燃費(MPG)
- 1978年の修理記録(1=最悪、5=最高)
- 1977年の修理記録(1=最悪、5=最高)
- ヘッドルーム
- 後部座席のスペース
- トランクスペース
- 重さ
- 長さ
これらのプロットを個別に見ることも、類似した特徴を持つ車のクラスターを識別するために使用することもできます。たとえば、キャデラック セビル (画像の最後のもの) の星型プロットを見ると、この車は最も高価な車の 1 つであり、燃費は平均以下 (ただし最悪ではない)、修理履歴は平均的、室内空間とサイズは平均から平均以上であることがわかります。次に、キャデラックモデル (最後の 3 つのプロット) と AMC モデル (最初の 3 つのプロット) を比較します。この比較では明確なパターンが示されています。AMC モデルは一般的に安価で、燃費は平均以下で、高さと重量、室内空間は小さいです。キャデラック モデルは高価で、燃費が悪く、サイズと室内空間は大きいです。[5]
代替案
時系列データやその他のデータには、平行座標の形で折れ線グラフを使用することができます[16]。
複数の変数を含む2次元の表形式データをグラフィカルに質的に比較する場合、一般的な代替手段としてハーヴェイボールがあり、これは消費者レポートで広く使用されています。[22]ハーヴェイボール(およびレーダーチャート)での比較は、変数をアルゴリズム的に順序付けて秩序を加えることで大幅に容易になります。[23]
多変量データ内の構造を視覚化する優れた方法は、主成分分析(PCA) によって提供されます。
もう一つの選択肢は、スパークラインに似た小さなインライン棒グラフを使用することです。[23]
レーダーチャートとポーラーチャートは、同じチャートタイプとして説明されることが多いですが、[4]一部の情報源では両者を区別しており、レーダーチャートは極座標でデータを表示しないポーラーチャートのバリエーションであると考えることさえあります。[24]
参照
参考文献
この記事には、米国国立標準技術研究所の
パブリックドメイン資料が組み込まれています。
- ^ Porter, Michael M; Niksiar, Pooya (2018). 「多次元力学:順列レーダーチャートを用いた自然生物システムのパフォーマンスマッピング」. PLOS ONE . 13 (9) e0204309. Bibcode :2018PLoSO..1304309P. doi : 10.1371/journal.pone.0204309 . PMC 6161877. PMID 30265707 .
- ^ Nancy R. Tague (2005)品質ツールボックス437ページ。
- ^ Kolence, Kenneth W. (1973). 「ソフトウェア経験主義者」. ACM SIGMETRICS Performance Evaluation Review . 2 (2): 31– 36. doi : 10.1145/1113644.1113647 . S2CID 18600391.
Philip J. Kiviat
博士
は、最近開催されたNBS/ACMのパフォーマンス測定に関するワークショップにおいて、変数軸として半径を用いた円グラフが有用な形式となる可能性を示唆しました。[…] Kiviat博士の洞察に基づき、このグラフを「Kiviatプロット」または「Kiviatグラフ」と呼ぶことを推奨します。
- ^ ab 「レーダーチャートを使ってコンテンツのギャップを見つける」コンテンツ戦略ワークショップ。2015年3月3日。2020年8月6日時点のオリジナルよりアーカイブ。2015年12月17日閲覧。
- ^ abcdef NIST/SEMATECH (2003). スタープロット in: e-Handbook of Statistical Methods . 2003年6月1日 (作成日)
- ^ チェンバース、ジョン、ウィリアム・クリーブランド、ビート・クライナー、ポール・チューキー (1983). 『データ解析のためのグラフィカル手法』 ワズワース. pp. 158–162
- ^ マイヤー、ゲオルク・フォン (1877)、Die Gesetzmäßigkeit im Gesellschaftsleben (ドイツ語)、ミュンヘン: オルデンブルク、OL 23294909M、p.78。 Linien-Diagramme im Kreise: 円の折れ線グラフ。
- ^ Michael Friendly (2008). 「主題地図作成、統計グラフィックス、データ視覚化の歴史におけるマイルストーン」Wayback Machineに2018年9月26日アーカイブ。
- ^ Michael Friendly (1991). 「多変量データのための統計グラフィックス」. 1991年4月、SAS SUGI 16カンファレンスにて発表された論文。
- ^ スパイダーグラフ:バスケットボールの統計データをグラフ化する
- ^ Seeing Data. 「データ視覚化の意味を理解する」Seeing Data.
- ^ Ron Basu (2004).品質の実装:ツールとテクニックの実践ガイド. p.131.
- ^ モデルシステム知識翻訳センター. 「レーダーチャートの効果的な活用」(PDF) . モデルシステム知識翻訳センター.
- ^ John Maguire. 「非正規化スパイダーグラフとレーダーグラフ」. Kitman Labs.
- ^ あなたはスパイダーマンではないのに、なぜレーダーチャートを使うのですか?、Chandoo、2008年9月18日
- ^ abc Peltier, Jon (2008年8月14日). 「Rock Around The Clock - Peltier Tech Blog」. Peltiertech.com . 2013年9月11日閲覧。
- ^ クリーブランド、ウィリアム;マギル、ロバート (1984). 「グラフィカル・パーセプション:理論、実験、そしてグラフィカル手法の開発への応用」アメリカ統計学会誌. 79 (387): 531– 554. JSTOR 2288400.クリーブランドの階層構造の要約
- ^ クリーブランド&マギル 1984(要約)
- ^ 「Charting around the clock The Excel Charts Blog」Excelcharts.com、2008年8月15日。 2013年9月11日閲覧。
- ^ ab 時計これ
- ^ “Standard Stats”. www.mlb.com . 2022年4月26日閲覧。
- ^ 「定性比較」。Support Analytics Blog、2007年12月11日。2012年4月8日時点のオリジナルよりアーカイブ。
- ^ ab 「Information Ocean: Reorderable tables II: Bertin versus the Spiders」I-ocean.blogspot.com. 2008年9月24日. 2013年9月11日閲覧。
- ^ 「極座標グラフ(レポートビルダーおよびSSRS)」。Microsoft Developer Network 。2015年12月17日閲覧。
外部リンク
- スタープロット – NIST / SEMATECH 統計手法の電子ハンドブック